- 如果你继续METR的趋势,到年底你会看到~100小时的模型!(~比现在强大8倍) - METR将真的很难拥有评估如此强大模型所需的基准 - 我们再也不能排除今年AI开发的显著自动化
Ajeya Cotra
Ajeya Cotra3月5日 23:17
新帖子:在1月14日,我预测到年底SWE的时间范围大约为24小时。现在我认为它会超过100小时,甚至可能没有上限。这是第一次,我没有看到反对AI研发自动化的确凿证据*在今年。* 下面是链接。
@Douglas_Schon 平均比率 p80/p50 约为 ~0.19... 它非常稳定。
@djinnius @microfounded @eli_lifland 我也有一个 Substack
126