Rehellisesti sanottuna Consumer Reports -tyylinen paneeli tehokäyttäjille voisi olla parempi kuin METR ym. tekoälyn kehityksen mittaamiseen, paljon kestävämpi spikkejä vastaan. En halua kuulostaa epäilevältä, mutta teho-käyttäjänä uskon, että viime kuukausina on tapahtunut erittäin huomattavaa edistystä, jos se on tiedossa.