Haluaisin tämän! Yritin rahoittaa tehokäyttäjien kyselyn vuonna 2024, mutta projektin vetäjä otti lopulta uuden roolin, ja uskon edelleen, että se olisi loistava. Yksi haaste on, että tällä hetkellä eniten välitän voimakkaista käyttäjistä, ovat tekoälyyritysten työntekijöitä, ja heiltä voi olla vaikea saada yksityiskohtaista tietoa
Rehellisesti sanottuna Consumer Reports -tyylinen paneeli tehokäyttäjille voisi olla parempi kuin METR ym. tekoälyn kehityksen mittaamiseen, paljon kestävämpi spikkejä vastaan.
En halua kuulostaa epäilevältä, mutta teho-käyttäjänä uskon, että viime kuukausina on tapahtunut erittäin huomattavaa edistystä, jos se on tiedossa.
Uusi postaus: 14. tammikuuta ennustin, että SWE-aikahorisontti EOY:n mukaan olisi ~24 tuntia. Nyt luulen, että se on >100 tuntia, ja ehkä rajaton. Ensimmäistä kertaa en näe vankkaa näyttöä tekoälyn T&K-automaatiota vastaan *tänä vuonna.* Linkki alla.
Tule töihin kanssani! METR etsii insinöörejä, tutkijoita ja operaatioiden johtajaa. Linkkejä avoimiin postauksiin ketjussa, ja laita rohkeasti yksityisviestiä, jos sinulla on kysyttävää!
Tiimimme on tällä hetkellä aivan hukassa!
Jotta tekoälyagenttien autonomiaa voidaan jatkaa ja kehittää arviointeja tekoälyjärjestelmien ja niiden taipumusten alistaa ihmisen kontrollia valvomiseksi, tarvitsemme lisää huippuluokan insinööri- ja tutkimushenkilöstöä. Hae alla tai lähetä minulle yksityisviesti!