Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Akıl yürütme @OpenAI araştırma | Libratus/Pluribus insanüstü poker yapay zekaları, CICERO Diplomasi yapay zekası ve OpenAI o3 / o1 / 🍓 akıl yürütme modelleri birlikte oluşturuldu
Özet; DR: @OpenAI şimdilik NSA veya diğer DoW istihbarat kurumlarına konuşlandırılmayacak, böylece demokratik süreçte olası gözetim boşluklarını ele almak için zaman olacak.
Hafta sonu boyunca OpenAI / DoW anlaşmasındaki orijinal dilin, özellikle yapay zekanın yasal gözetimi mümkün kılabileceği yeni yollarla ilgili meşru soruları yanıtsız bıraktığı ortaya çıktı. Artık bu duruma yönelik dil güncellendi, ancak aynı zamanda dünyanın güvenlik ve emniyet için yapay zeka laboratuvarlarına veya istihbarat ajanslarına güvenmek zorunda kalmaması gerektiğine de kesinlikle inanıyorum. NSA ve diğer tüm DoW istihbarat ajanslarına konuşlandırma, bu boşlukları demokratik süreç yoluyla ele almak için konuşlandırmadan önce zaman boyunca, durdurulacak.
Yasaların bazen yavaş olabileceğini biliyorum, ama önemli politika kararları için demokratik süreci aşmaya alıştığımız kaygan bir yoldan korkuyorum. İki partili destek ve aciliyet olduğunda, hükümetin hızlı hareket edebileceğine inanıyorum. Ve yapay zeka daha güçlü hale geldikçe, nihai yetenin kamuya verilmesi her zamankinden daha önemli.
Ayrıca OpenAI'de politika konusunda daha kişisel olarak dahil olmayı planlıyorum. Bence şimdi, araştırmacıların döngüde olması her zamankinden daha önemli, böylece politikanın gördüğümüz son derece hızlı ilerlemeden haberdar olması gerekiyor.

Sam Altman3 Mar 09:15
İşte bir iç gönderinin yeniden paylaşımı:
İlkelerimizi çok net hale getirmek için anlaşmamıza bazı eklemeler yapmak için DoW ile çalışıyoruz.
1. Anlaşmamızı değiştirerek bu dili ve diğer her şeyin yanı sıra ekleyeceğiz:
"• Amerika Birleşik Devletleri Anayasası'nın Dördüncü Değişikliği, 1947 Ulusal Güvenlik Yasası, 1978 FISA Yasası dahil olmak üzere geçerli yasalarla tutarlı olarak, yapay zeka sistemi ABD kişi ve vatandaşlarının iç gözetimi için kasıtlı olarak kullanılamaz.
• Şüphe yaratmamak için, Bakanlık bu sınırlamayı ABD kişi veya vatandaşlarının kasıtlı olarak takip edilmesini, gözetimini veya izlenmesini, ticari olarak elde edilen kişisel veya tanımlanabilir bilgilerin tedarif edilmesi veya kullanılması dahil olmak üzere yasakladığını anlıyor."
Amerikalıların sivil özgürlüklerini korumak kritik önemde, bu konuda o kadar çok odaklanıldı ki, özellikle ticari olarak elde edilen bilgiler dahil olmak üzere bu noktayı net bir şekilde vurgulamak istedik. Tekrarlayıcı dağıtımda yaptığımız her şey gibi, ilerledikçe öğrenmeye ve geliştirmeye devam edeceğiz.
Bence bu önemli bir değişiklik; ekibimiz ve DoW ekibi bu konuda harika bir iş çıkardı.
2. Bakanlık ayrıca hizmetlerimizin Savaş Bakanlığı istihbarat kurumları (örneğin NSA) tarafından kullanılmayacağını teyit etti. Bu kurumlara yapılacak herhangi bir hizmet sözleşmemizde bir sonraki değişiklik gerektirir.
3. Aşırı netlik için: demokratik süreçler üzerinden ilerlemek istiyoruz. Toplumla ilgili kilit kararları hükümet vermeli. Bir sese sahip olmak ve masada uzmanlığımızı paylaşabileceğimiz, özgürlük ilkeleri için mücadele edebileceğimiz bir yer istiyoruz. Ama sistemin nasıl işlediği konusunda net bir şey biliyoruz (çünkü birçok kişi bana anayasaya aykırı olduğuna inandığım bir emir alsaydım, tabii ki onu takip etmektense hapse girmeyi tercih ederim) sordu. Ama
4. Teknolojinin hazır olmadığı birçok şey var ve güvenlik için gereken ödünleri henüz anlamadığımız birçok alan. Bunları yavaş yavaş, DoW ile, teknik önlemler ve diğer yöntemlerle çözeceğiz.
5. Sanırım yanlış yaptığımı düşündüğüm bir şey: Cuma günü bunu acele ettirmemeliydik. Sorunlar çok karmaşık ve net iletişim gerektiriyor. Gerçekten durumu yatıştırmaya ve çok daha kötü bir sonuçtan kaçınmaya çalışıyorduk ama bence bu fırsatçı ve özensiz görünüyordu. Gelecekte daha yüksek riskli kararlarla karşı karşıya olduğumuz için benim için iyi bir öğrenme deneyimi.
Hafta sonu yaptığım konuşmalarda, Anthropic'in SCR olarak tanımlanmaması gerektiğini ve DoW'un onlara da kabul ettiğimiz aynı şartları sunmasını umduğumuzu yineledim.
Yarın sabah daha fazla soruyu yanıtlamak için bir All Hands etkinliği düzenleyeceğiz.
222
Geçen yaz IMO sonuçlarından sonra, bazıları bunu "lise matematiği" olarak reddetti. Son modellerimizin STEM araştırmalarının köklü bir şekilde değişeceğine dair her türlü şüpheyi ortadan kaldıracağını düşünüyoruz.
Matematikçiler, kendi araştırmalarından doğal olarak ortaya çıkan 10 araştırma sorusundan oluşan bir dizi oluşturdular. Cevapları sadece onlar biliyor ve dünyaya LLM'leri kullanarak çözmeye çalışmak için bir hafta verdiler. Son modellerimizin birkaçını çözmeyi mümkün kıldığını düşünüyoruz.
Şimdilik bu dahili bir model ama yakında (ya da daha iyi bir model) çıkaracağımıza dair iyimserim.


235
@Anthropic'nin son sistem kartındaki dürüstlüğünü takdir ediyorum, ancak içeriği bana şirketin gelişmiş yapay zeka modellerinin dağıtımında sorumlu davranacağına dair güven vermiyor:
-Opus 4.6'nın otonom AI R&D-4 eşiğini aşıp aşmadığını belirlemek için öncelikle bir iç ankete dayandılar (ve bu nedenle Sorumlu Ölçeklendirme Politikaları kapsamında yayımlanması için daha güçlü önlemler gerekecekti). Bu, tarafsız bir üçüncü tarafın dış bir anketi bile değil, daha çok Anthropic çalışanların bir anketiydi.
-16/5 iç anket katılımcıları model yayını için daha güçlü önlemlerin gerekebileceğini ilk olarak değerlendirdiğinde, Anthropic özellikle bu çalışanlarla iletişime geçip "görüşlerini netleştirmelerini" istedi. Diğer 11/16 katılımcıları için benzer bir takip sürecinden bahsetmiyorlar. Sistem kartında, bunun anket sonuçlarında nasıl bir önyargı yaratabileceği konusunda bir tartışma yoktur.
-Anketlere güvenmelerinin nedeni, mevcut yapay zeka AR-GE değerlendirmelerinin doygun olması. Bazıları yapay zeka ilerlemesinin o kadar hızlı olduğunu iddia edebilir ki, henüz daha gelişmiş nicel değerlendirmeler yok ama yapay zeka laboratuvarlarını yüksek bir standartta tutabiliriz ve tutmalıyız. Ayrıca, diğer laboratuvarlarda doygun olmayan gelişmiş yapay zeka Ar-Ge değerlendirmeleri var. Örneğin, OpenAI'nin OPQA kıyaslaması var; bu kıyaslama, yapay zeka modellerinin OpenAI araştırma ekiplerinin karşılaştığı ve ekibin çözmesi bir günden fazla süren gerçek iç sorunları çözme yeteneğini ölçer.
Opus 4.6'nın aslında uzaktan giriş seviyesi yapay zeka araştırmacısı seviyesinde olduğunu düşünmüyorum ve yayınlamasının tehlikeli olduğunu da düşünmüyorum. Ancak Sorumlu Ölçeklendirme Politikası'nın amacı, işler ciddileşmeden önce kurumsal güç ve iyi alışkanlıklar geliştirmektir. İç anketler, özellikle Anthropic'in yürüttüğü şekilde, nicel değerlendirmelerin sorumlu bir yerine geçmez.

500
En İyiler
Sıralama
Takip Listesi
