- 如果你繼續這個 METR 趨勢,你會看到到年底大約有 100 小時的模型!(比現在強大約 8 倍) - METR 將真的很難擁有評估這種強大模型所需的基準 - 我們再也無法排除今年 AI 開發的重大自動化
Ajeya Cotra
Ajeya Cotra3月5日 23:17
新貼文:在1月14日,我預測到年底SWE的時間範圍將約為24小時。現在我認為它會超過100小時,甚至可能沒有上限。這是我第一次沒有看到反對今年AI研發自動化的確鑿證據。以下是連結。
@Douglas_Schon 平均比率 p80/p50 約為 ~0.19... 這是相當穩定的。
@djinnius @microfounded @eli_lifland 我也有一個 Substack
124