Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Päättelyn @OpenAI tutkiminen | Yhdessä luotu Libratus/Pluribus yli-inhimillinen pokeritekoäly, CICERO Diplomacy AI ja OpenAI o3 / o1 / 🍓 päättelymallit
TL; dr: @OpenAI ei tällä hetkellä lähetä NSA:han tai muihin DoW:n tiedustelupalveluihin, jotta on aikaa puuttua mahdollisiin valvontareikiin demokraattisen prosessin kautta.
Viikonloppuna kävi selväksi, että OpenAI/DoW-sopimuksen alkuperäinen sanamuoto jätti oikeutettuja kysymyksiä vaille vastauksia, erityisesti liittyen joihinkin uusiin tapoihin, joilla tekoäly voisi mahdollisesti mahdollistaa laillisen valvonnan. Kieltä on nyt päivitetty tämän ratkaisemiseksi, mutta uskon vahvasti, ettei maailman pitäisi joutua luottamaan tekoälylaboratorioihin tai tiedustelupalveluihin turvallisuutensa ja suojan vuoksi. Lähettäminen NSA:lle ja kaikille muille DoW-tiedustelupalveluille pidätetään, jotta ehtisi puuttua näihin porsaanreikiin demokraattisen prosessin kautta ennen käyttöönottoa.
Tiedän, että lainsäädäntö voi joskus olla hidasta, mutta pelkään liukasta polkua, jossa totumme kiertämään demokraattista prosessia tärkeissä poliittisissa päätöksissä. Kun puolueiden välinen tuki ja kiireellisyys ovat olemassa, uskon, että hallitus voi toimia nopeasti. Ja kun tekoäly vahvistuu, on tärkeämpää kuin koskaan, että lopullinen valta annetaan yleisölle.
Suunnittelen myös osallistuvani henkilökohtaisemmin OpenAI:n politiikkaan. Uskon, että nyt enemmän kuin koskaan on tärkeää, että tutkijat ovat ajan tasalla, jotta politiikka saa tietoa näkemästämme erittäin nopeasta kehityksestä.

Sam Altman3.3. klo 09.15
Tässä on uudelleenjulkaisu sisäisestä julkaisusta:
Olemme tehneet yhteistyötä DoW:n kanssa tehdäksemme lisäyksiä sopimukseemme, jotta periaatteemme olisivat hyvin selkeitä.
1. Aiomme muuttaa sopimustamme lisäämällä tämän kielen kaiken muun lisäksi:
"• Sovellettavien lakien mukaisesti, mukaan lukien Yhdysvaltain perustuslain neljäs lisäys, vuoden 1947 kansallisen turvallisuuslaki ja vuoden 1978 FISA-laki, tekoälyjärjestelmää ei saa tarkoituksellisesti käyttää Yhdysvaltain henkilöiden ja kansalaisten kotimaan valvontaan.
• Epäselvyyksien välttämiseksi ministeriö ymmärtää tämän rajoituksen kieltävän tahallisen Yhdysvaltain henkilöiden tai kansalaisten seurannan, valvonnan tai valvonnan, mukaan lukien kaupallisesti hankittujen henkilökohtaisten tai tunnistettavien tietojen hankinnan tai käytön kautta."
Amerikkalaisten kansalaisvapauksien suojeleminen on ratkaisevan tärkeää, ja tähän kiinnitettiin niin paljon huomiota, että halusimme tehdä tämän erityisen selväksi, myös kaupallisesti hankitun tiedon osalta. Kuten kaikessa iteratiivisessa käyttöönotossa, jatkamme oppimista ja hiomista matkan varrella.
Mielestäni tämä on tärkeä muutos; tiimimme ja DoW-tiimi tekivät erinomaista työtä sen parissa.
2. Ministeriö vahvisti myös, että palveluitamme ei käytetä sodan tiedustelupalveluissa (esimerkiksi NSA). Kaikki palvelut näille toimistoille vaatisivat jatkomuutoksen sopimukseemme.
3. Äärimmäisen selkeyden vuoksi: haluamme työskennellä demokraattisten prosessien kautta. Keskeiset päätökset yhteiskunnasta pitäisi olla hallitus. Haluamme äänen ja paikan pöydässä, jossa voimme jakaa asiantuntemustamme ja taistella vapauden periaatteiden puolesta. Mutta olemme selvillä siitä, miten järjestelmä toimii (koska moni on kysynyt, että jos saisin sen, minkä uskoisin olevan perustuslain vastainen määräys, tietenkin mieluummin menisin vankilaan kuin noudattaisin sitä). Mutta
4. On monia asioita, joihin teknologia ei yksinkertaisesti ole valmis, ja monilla alueilla emme vielä ymmärrä turvallisuuden edellyttämiä kompromisseja. Käymme nämä läpi hitaasti DoW:n kanssa, teknisten turvatoimien ja muiden menetelmien avulla.
5. Yksi asia, jonka luulen tehneeni väärin: meidän ei olisi pitänyt kiirehtiä tämän julkaisemisessa perjantaina. Ongelmat ovat todella monimutkaisia ja vaativat selkeää viestintää. Yritimme aidosti rauhoittaa tilannetta ja välttää paljon pahempaa lopputulosta, mutta mielestäni se vaikutti vain tilaisuuden tullen, mutta huolimattomalta. Hyvä oppimiskokemus minulle, kun kohtaamme tulevaisuudessa suurempia päätöksiä.
Viikonlopun keskusteluissani toistin, että Anthropicia ei pitäisi määritellä SCR:ksi, ja toivomme, että DoW tarjoaa heille samat ehdot, joista olemme sopineet.
Järjestämme huomenna aamulla All Hands -tilaisuuden, jossa vastaamme lisää kysymyksiin.
223
IMO:n tulosten jälkeen viime kesänä jotkut hylkäsivät sen "lukion matematiikaksi". Uskomme, että uusimmat mallimme poistavat kaikki epäilykset siitä, että STEM-tutkimus on muuttumassa perustavanlaatuisesti.
Matemaatikot loivat kymmenen tutkimuskysymyksen joukon, jotka syntyivät luonnollisesti heidän omasta tutkimuksestaan. Vain he tietävät vastaukset, ja he antoivat maailmalle viikon aikaa käyttää LLM:iä niiden ratkaisemiseksi. Uskomme, että uusimmat mallimme mahdollistavat useiden niiden ratkaisemisen.
Tämä on toistaiseksi sisäinen malli, mutta olen optimistinen, että saamme sen (tai paremman mallin) pian ulos.


236
Arvostan @Anthropic:n rehellisyyttä heidän uusimmassa järjestelmäkortissaan, mutta sen sisältö ei anna minulle luottamusta siihen, että yritys toimisi vastuullisesti kehittyneiden tekoälymallien käyttöönotossa:
-He luottivat pääasiassa sisäiseen kyselyyn selvittääkseen, ylittääkö Opus 4.6 heidän autonomisen tekoälyn T&K-4-kynnysarvonsa (ja siksi vaatisi tiukempia turvatoimia julkaistakseen vastuullisen skaalauspolitiikan puitteissa). Tämä ei ollut edes ulkoinen kysely puolueettomasta kolmannesta osapuolesta, vaan pikemminkin antropisten työntekijöiden kysely.
-Kun 5/16 sisäiset kyselyyn vastaajat alun perin antoivat arvion, jossa ehdotettiin, että mallin julkaisussa saattaisi tarvita vahvempia turvatoimia, Anthropic otti yhteyttä juuri näihin työntekijöihin ja pyysi heitä "selventämään näkemyksensä." He eivät mainitse vastaavaa seurantaa muille 16.11. vastaajille. Järjestelmäkortissa ei ole keskustelua siitä, miten tämä voisi aiheuttaa harhaa kyselyn tuloksissa.
-Heidän syynsä luottaa kyselyihin on se, että heidän nykyiset tekoälyn tutkimus- ja kehitysarvionsa ovat kyllästyneet. Jotkut saattavat väittää, että tekoälyn kehitys on ollut niin nopeaa, että on ymmärrettävää, ettei heillä vielä ole edistyneempiä kvantitatiivisia arviointeja, mutta voimme ja meidän pitäisi asettaa tekoälylaboratoriot korkealle tasolle. Myös muissa laboratorioissa on edistyneitä tekoälyn tutkimus- ja kehitysarviointeja, jotka eivät ole kyllästyneet. Esimerkiksi OpenAI:lla on OPQA-vertailu, joka mittaa tekoälymallien kykyä ratkaista todellisia sisäisiä ongelmia, joita OpenAI-tutkimusryhmät kohtasivat ja joiden ratkaisemiseen tiimi vei yli päivän.
En usko, että Opus 4.6 on oikeasti etätason tekoälytutkijan tasolla, enkä usko, että sen julkaiseminen on vaarallista. Mutta vastuullisen skaalauksen politiikan tarkoitus on rakentaa institutionaalista voimaa ja hyviä tapoja ennen kuin asiat muuttuvat vakaviksi. Sisäiset kyselyt, erityisesti kuten Anthropic on niitä järjestänyt, eivät korvaa määrällisiä arviointeja.

501
Johtavat
Rankkaus
Suosikit
