- Si vous poursuivez la tendance METR, vous verrez des modèles d'environ 100h d'ici la fin de l'année ! (~8x plus puissants qu'actuellement) - METR aura vraiment du mal à avoir les références nécessaires pour évaluer des modèles de cette puissance - Nous ne pouvons plus exclure une automatisation significative du développement de l'IA CETTE ANNÉE
Ajeya Cotra
Ajeya Cotra5 mars, 23:17
Nouveau post : le 14 janvier, j'ai prédit que l'horizon temporel de SWE d'ici la fin de l'année serait d'environ 24 heures. Maintenant, je pense qu'il sera supérieur à 100 heures, et peut-être illimité. Pour la première fois, je ne vois pas de preuves solides contre l'automatisation de la R&D en IA *cette année.* Lien ci-dessous.
@Douglas_Schon Le ratio moyen p80/p50 est d'environ 0,19... il est remarquablement stable.
@djinnius @microfounded @eli_lifland J'ai aussi un Substack
91