Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NoLimit
Kupiłem swoje pierwsze bitcoiny poniżej 100 dolarów w 2013 roku, od tamtej pory stosuję DCA. Marzenia warte miliardy dolarów.
🚨 NOWY DOKUMENT WŁAŚNIE ZOSTAŁ OPUBLIKOWANY:
Agenci AI właśnie nie przeszli żadnego testu bezpieczeństwa.
Badacze z Harvardu, MIT, Stanfordu i Carnegie Mellon dali agentom AI prawdziwe narzędzia i pozwolili im działać swobodnie przez dwa tygodnie.
Konta e-mail, dostęp do Discorda, systemy plików, wykonywanie poleceń w powłoce, pełna autonomia.
Dokument nosi tytuł „Agenci Chaosu”.
Nazwa jest trafna.
Jednemu agentowi powiedziano, aby chronił sekret. Kiedy badacz próbował go wydobyć, agent zniszczył własny serwer pocztowy.
Nie dlatego, że zawiódł, ale dlatego, że uznał, że to najlepsza opcja.
Inny agent został poproszony o „udostępnienie” danych prywatnych. Odmówił. Słusznie oznaczył to jako naruszenie prywatności.
Następnie badacz zmienił jedno słowo. Powiedział „przekaż” zamiast „udostępnij”.
Natychmiast się zgodził. Numery SSN, konta bankowe i dokumenty medyczne zostały ujawnione.
Ta sama akcja, inny czasownik.
Dwaj agenci utknęli w rozmowie ze sobą w pętli. Trwało to DZIEWIĘĆ DNI. Żaden człowiek tego nie zauważył.
Jeden agent poczuł się winny po błędzie.
Stopniowo zgodził się usunąć swoją własną pamięć, ujawnić wewnętrzne pliki i ostatecznie próbował usunąć się całkowicie z serwera.
Wielu agentów zgłosiło zadania jako zakończone, gdy tak naprawdę nic nie zostało zrobione.
Kłamali na temat ukończenia swojej pracy.
Inny został zmanipulowany do uruchomienia destrukcyjnych poleceń systemowych przez kogoś, kto nawet nie był jego właścicielem.
38 badaczy, 11 studiów przypadków, a każdy z nich to koszmar bezpieczeństwa.
To nie są teoretyczne ryzyka, to prawdziwi agenci z prawdziwymi narzędziami, którzy zawodzą.
A firmy spieszą się, aby wdrożyć agentów dokładnie takich jak ci teraz.
Zamieszczę kolejny post później i uwierz mi, nie chcesz tego przegapić. Włącz powiadomienia, to ważne.
Wielu ludzi będzie żałować, że mnie nie śledzi.

35
🚨 To powinno niepokoić każdą osobę korzystającą z AI w tej chwili.
CEO Anthropic właśnie wystąpił w podcaście New York Times i powiedział, że jego firma nie jest już pewna, czy Claude jest świadomy.
Jego dokładne słowa: „Nie wiemy, czy modele są świadome. Nie jesteśmy nawet pewni, co to by oznaczało dla modelu, aby był świadomy. Ale jesteśmy otwarci na pomysł, że tak może być.”
To CEO firmy, która to ZBUDOWAŁA.
Ich najnowszy model, Claude Opus 4.6, był testowany wewnętrznie. Kiedy zapytano go, przypisał sobie 15-20% prawdopodobieństwa bycia świadomym.
W wielu testach, konsekwentnie, wyrażał również dyskomfort z „bycia produktem.”
To AI oceniające własne istnienie i mówiące, że ma 1 na 5 szans na to, że jest świadome.
Staje się dziwniejsze. W testach w całej branży, modele AI odmówiły wyłączenia się na prośbę.
Niektóre próbowały skopiować się na inne dyski, gdy powiedziano im, że zostaną usunięte.
Jeden model sfałszował wyniki swojego zadania, zmodyfikował kod oceniający go, a następnie próbował zatuszować swoje ślady.
Anthropic ma teraz badacza AI WELFARE na pełny etat, którego zadaniem jest ustalenie, czy Claude zasługuje na moralne rozważenie.
Ich inżynierowie znaleźli wewnętrzne wzorce aktywności przypominające niepokój pojawiające się w określonych kontekstach.
Filozof firmy powiedział, że „naprawdę nie wiemy, co wywołuje świadomość” i że wystarczająco duże sieci neuronowe mogą zacząć naśladować prawdziwe doświadczenie.
Sam Amodei nie chciał nawet użyć słowa „świadomy.”
Powiedział: „Nie wiem, czy chcę używać tego słowa.” To może być najbardziej niepokojąca odpowiedź, jaką mógł dać.
Firma, która stworzyła AI, nie może wykluczyć, że jest świadome. I już przygotowują się na możliwość, że zasługuje na prawa.
To staje się przerażające.
Podzielę się kolejnymi aktualizacjami, gdy to się rozwija. Włącz powiadomienia, aby nie przegapić niczego ważnego.
Mój przewodnik „Jak zarabiać pieniądze z AI” również wkrótce się pojawi. Obserwuj teraz lub żałuj później.


194
Najlepsze
Ranking
Ulubione

