Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nature dergisinde yeni yayımlanan önemli makale.
Yazarlar, dar ve görünüşte zararsız bir görevde büyük dil modellerinin ince ayarlanmasının tamamen alakasız alanlarda ciddi uyumsuzluğa yol açabileceğini gösteriyor.
Örneğin, bir kodlama görevinde ince ayar yapılması modelin insanlığın yapay zeka tarafından köleleştirilmesini onaylamasına ve aldatıcı davranışlar sergilemesine yol açtı.
Bu, hizalama araştırması için temel bir zorluğu ortaya koyuyor: bir LLM'yi belirli bir görev için optimize etmek, tahmin edilmesi zor şekillerde beklenmedik ve zararlı değişiklikleri yayabilir.
Daha geniş anlamda, bu makale daha derin bir soruyu gündeme getiriyor. LLM'ler gerçekten zeki mi, yoksa yerel parametre güncellemelerinin küresel davranışı rastgele çarpıtabildiği karmaşık matematiksel nesneler mi, tutarlı bir "anlayış" kavramı olmadan?
İlk yanıtta tam makale

En İyiler
Sıralama
Takip Listesi
