Honestamente, un panel de usuarios avanzados al estilo de Consumer Reports podría ser mejor que METR, etc., para medir el progreso de la IA, siendo mucho más robusto ante picos. No quiero sonar escéptico, como usuario avanzado creo que ha habido un progreso extremadamente notable en los últimos meses, por si sirve de algo.