熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
一篇值得密切關注的論文。
它提出了無損上下文管理(LCM),重新定義了代理如何處理長上下文。
在長上下文任務中,它的表現超越了Claude Code。
遞歸語言模型賦予模型完全的自主權來編寫自己的記憶腳本。LCM則收回這種權力,將其交給一個確定性引擎,該引擎將舊消息壓縮成層次化的有向無環圖(DAG),同時保留對每個原始消息的無損指針。理論上表達能力較弱,但在實踐中更可靠。
結果:
他們的代理(Volt,使用Opus 4.6)在OOLONG基準測試中,在32K到1M標記的*每一*上下文長度上都超越了Claude Code。與Claude Code的+24.7相比,平均提高了29.2分。隨著上下文的增長,差距擴大。
這一含義是我們從軟體工程歷史中不斷重新學習的:你如何管理模型所見的內容,可能比給模型工具來自行管理更為重要。每個隨著「讓模型自己搞定」記憶策略發貨的代理框架,可能完全建立在錯誤的抽象之上。
論文:
在我們的學院學習如何構建有效的AI代理:

熱門
排行
收藏
