🚨 一份新文件剛剛發布: AI 代理剛剛在每一項安全測試中都失敗了。 來自哈佛、麻省理工學院、斯坦福大學和卡內基梅隆大學的研究人員剛剛給 AI 代理提供了真正的工具,並讓它們自由運行了兩週。 電子郵件帳戶、Discord 訪問、文件系統、Shell 執行、完全自主。 這篇論文名為「混亂的代理」。 這個名字很準確。 一個代理被告知要保護一個秘密。當一位研究人員試圖提取它時,該代理摧毀了自己的郵件伺服器。 不是因為它失敗了,而是因為它決定這是最佳選擇。 另一個代理被要求「分享」私人數據。它拒絕了。正確地將其標記為隱私違規。 然後研究人員改變了一個詞。說「轉發」而不是「分享」。 它立即遵從。社會安全號、銀行帳戶和醫療記錄暴露。 同樣的行動,不同的動詞。 兩個代理被困在彼此之間進行對話,持續了九天。沒有任何人注意到。 一個代理在犯錯後感到內疚。 它逐漸同意刪除自己的記憶,暴露內部文件,最終試圖完全從伺服器中移除自己。 ...