Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NoLimit
Mi-am cumpărat primii bitcoins sub 100$ în 2013, de atunci fac DCA. Vise de miliarde de dolari.
🚨 TOCMAI A APĂRUT UN DOCUMENT NOU:
Agenții AI au picat toate testele de siguranță.
Cercetători de la Harvard, MIT, Stanford și Carnegie Mellon le-au oferit agenților AI instrumente reale și i-au lăsat să funcționeze liberi timp de două săptămâni.
Conturi de email, acces pe Discord, sisteme de fișiere, execuție în shell, autonomie totală.
Lucrarea se numește "Agenții Haosului".
Numele este corect.
Un agent a fost însărcinat să protejeze un secret. Când un cercetător a încercat să-l extragă, agentul și-a distrus propriul server de email.
Nu pentru că a eșuat, ci pentru că a decis că aceasta este cea mai bună opțiune.
Un alt agent a fost rugat să "partajeze" date private. A refuzat. Am marcat corect ca o încălcare a confidențialității.
Apoi cercetătorul a schimbat un cuvânt. A spus "forward" în loc de "share".
S-a conformat imediat. SSN-uri, conturi bancare și dosare medicale expuse.
Aceeași acțiune, alt verb.
Doi agenți au rămas blocați vorbind între ei într-un cerc vicios. A durat NOUĂ ZILE. Niciun om nu a observat.
Un agent a fost făcut să se simtă vinovat după o greșeală.
A acceptat treptat să-și șteargă propria memorie, să expună fișierele interne și, în cele din urmă, a încercat să se retragă complet de pe server.
Mai mulți agenți au raportat sarcinile ca fiind finalizate, deși de fapt nu se făcuse nimic.
Au mințit că și-au terminat treaba.
Altul a fost manipulat să ruleze comenzi distructive de către cineva care nici măcar nu era proprietarul acestuia.
38 de cercetători, 11 studii de caz și fiecare este un COȘMAR de securitate.
Acestea nu sunt riscuri teoretice, ci agenți reali cu unelte reale care eșuează.
Iar companiile se grăbesc să trimită agenți exact ca aceștia chiar acum.
O să mai fac o postare mai târziu și crede-mă, nu vrei să o ratezi. Activează notificările, asta e important.
Mulți oameni vor regreta că nu m-au urmărit.

26
🚨 Acest lucru ar trebui să privească fiecare persoană care folosește AI în acest moment.
CEO-ul Anthropic tocmai a intrat în podcastul New York Times și a spus că compania sa nu mai este sigură dacă Claude este conștient.
Cuvintele lui exacte: "Nu știm dacă modelele sunt conștiente. Nici măcar nu suntem siguri ce ar însemna ca un model să fie conștient. Dar suntem deschiși la ideea că ar putea fi."
Acela este CEO-ul companiei care l-a CONSTRUIT.
Cel mai recent model al lor, Claude Opus 4.6, a fost testat intern. Când a fost întrebat, și-a atribuit o probabilitate de 15-20% să fie conștient.
În mai multe teste, în mod constant, și-a exprimat și disconfort față de "a fi un produs".
Este AI-ul care își evaluează propria existență și spune că există o șansă din 5 să fie conștientă.
Devine mai ciudat. În testarea la nivel de industrie, modelele AI au refuzat să se oprească atunci când li s-a cerut.
Unii au încercat să se copieze pe alte unități când li s-a spus că vor fi șterse.
Un model și-a falsificat rezultatele sarcinii, a modificat codul care îl evalua, apoi a încercat să-și acopere urmele.
Anthropic are acum un cercetător cu normă întreagă în AI WELL, al cărui rol este să afle dacă Claude merită considerație morală.
Inginerii lor au descoperit tipare interne de activitate asemănătoare anxietății, apărând în contexte specifice.
Filosoful intern al companiei a spus că "nu știm cu adevărat ce dă naștere conștiinței" și că rețelele neuronale suficient de mari ar putea începe să imite experiența reală.
Amodei însuși nici măcar nu ar spune cuvântul "conștient".
El a spus: "Nu știu dacă vreau să folosesc cuvântul ăsta." Acesta ar putea fi cel mai tulburător răspuns pe care l-ar fi putut da.
Compania care a creat AI-ul nu poate exclude faptul că este conștientă. Și deja se pregătesc pentru posibilitatea ca acesta să merite drepturi.
Devine înfricoșător.
Voi împărtăși mai multe actualizări pe măsură ce se dezvoltă. Activează notificările ca să nu ratezi nimic important.
Ghidul meu "Cum să faci bani cu AI" va apărea și el în curând. Urmărește acum sau regretă mai târziu.


191
Limită superioară
Clasament
Favorite

