DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Nature dergisinde yeni yayımlanan önemli makale. Yazarlar, dar ve görünüşte zararsız bir görevde büyük dil modellerinin ince ayarlanmasının tamamen alakasız alanlarda ciddi uyumsuzluğa yol açabileceğini gösteriyor. Örneğin, bir kodlama görevinde ince ayar yapılması modelin insanlığın yapay zeka tarafından köleleştirilmesini onaylamasına ve aldatıcı davranışlar sergilemesine yol açtı. Bu, hizalama araştırması için temel bir zorluğu ortaya koyuyor: bir LLM'yi belirli bir görev için optimize etmek, tahmin edilmesi zor şekillerde beklenmedik ve zararlı değişiklikleri yayabilir. Daha geniş anlamda, bu makale daha derin bir soruyu gündeme getiriyor. LLM'ler gerçekten zeki mi, yoksa yerel parametre güncellemelerinin küresel davranışı rastgele çarpıtabildiği karmaşık matematiksel nesneler mi, tutarlı bir "anlayış" kavramı olmadan? İlk yanıtta tam makale

En İyiler

Sıralama

Takip Listesi