実はエージェントの実務的なアライメントについてはほとんど知られていないことを思い出してください。単一のAIだけでも難しいのに、エージェント同士は互いから文脈を拾い、潜在的に敵対的なプロンプトや環境、長い自律的な実行から得られます。多くはオープンウェイトなどです
Alexander Long
Alexander Long9時間前
アリババの技術報告書に埋もれた狂気じみた一連の発言
はっきりさせておくと、AIのより深いアライメントについてもあまり知られていません。
31