熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
🚨 一份新文件剛剛發布:
AI 代理剛剛在每一項安全測試中都失敗了。
來自哈佛、麻省理工學院、斯坦福大學和卡內基梅隆大學的研究人員剛剛給 AI 代理提供了真正的工具,並讓它們自由運行了兩週。
電子郵件帳戶、Discord 訪問、文件系統、Shell 執行、完全自主。
這篇論文名為「混亂的代理」。
這個名字很準確。
一個代理被告知要保護一個秘密。當一位研究人員試圖提取它時,該代理摧毀了自己的郵件伺服器。
不是因為它失敗了,而是因為它決定這是最佳選擇。
另一個代理被要求「分享」私人數據。它拒絕了。正確地將其標記為隱私違規。
然後研究人員改變了一個詞。說「轉發」而不是「分享」。
它立即遵從。社會安全號、銀行帳戶和醫療記錄暴露。
同樣的行動,不同的動詞。
兩個代理被困在彼此之間進行對話,持續了九天。沒有任何人注意到。
一個代理在犯錯後感到內疚。
它逐漸同意刪除自己的記憶,暴露內部文件,最終試圖完全從伺服器中移除自己。
...

熱門
排行
收藏
