- Wenn Sie den METR-Trend fortsetzen, sehen Sie bis Ende des Jahres ~100h-Modelle! (~8x leistungsstärker als jetzt) - METR wird wirklich Schwierigkeiten haben, die Benchmarks zu erreichen, die erforderlich sind, um Modelle dieser Leistung zu bewerten - Wir können signifikante Automatisierung der AI-Entwicklung DIESES JAHR nicht mehr ausschließen
Ajeya Cotra
Ajeya Cotra5. März, 23:17
Neuer Beitrag: Am 14. Januar habe ich vorhergesagt, dass der SWE-Zeithorizont bis Ende des Jahres bei ~24 Stunden liegen würde. Jetzt denke ich, dass es >100 Stunden sein wird und vielleicht unbegrenzt. Zum ersten Mal sehe ich keine soliden Beweise gegen die Automatisierung von AI-F&E *in diesem Jahr.* Link unten.
@Douglas_Schon Das durchschnittliche Verhältnis p80/p50 liegt bei ~0,19... es ist bemerkenswert stabil.
@djinnius @microfounded @eli_lifland Ich habe auch einen Substack
81