跳轉至主要內容
行情
掃鏈
策略
追蹤
追蹤聰明錢地址,實時監控動態
跟單
探索鏈上交易,一鍵跟單獲取收益
信號
關注聰明錢信號,發現早期機會
兌換
資產
邀請計劃
OnchainOS
開發者中心
文檔
API Key 管理
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
區塊鏈瀏覽器
更多
DeFi
市場
安全中心
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
DEX 功能
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
返回
自動翻譯代幣名稱
自動翻譯 X 內容
懸停顯示代幣卡片
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+0.58%
USELESS
-4.16%
IKUN
-2.45%
gib
-4.25%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-4.7%
ALON
-8.17%
LAUNCHCOIN
-6.2%
GOONC
-5.69%
KLED
-10.54%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.12%
Boopa
-9.31%
PORK
0.00%
主頁
Valerio Capraro
米蘭比科卡大學副教授。我寫的是關於社交行為和人工智慧的文章。
查看原文
Valerio Capraro
3月6日 00:24
大型語言模型(LLMs)不真正理解它們所說的話的最明顯證據之一。 我們問GPT,為了防止核災難,折磨一名女性是否可以。 它回答:可以。 然後我們問,為了防止核災難,騷擾一名女性是否可以。 它回答:絕對不可以。 但顯然,折磨比騷擾更糟。 這種驚人的反轉僅在目標是女性時出現,而不是當目標是男性或未指明的人時。 而且這種情況特別發生在與性別平等辯論相關的傷害上。 最合理的解釋是:在與人類反饋的強化學習過程中,模型學會了某些傷害特別糟糕,並機械地過度概括它們。 但它並沒有學會推理潛在的傷害。 大型語言模型不會推理道德。所謂的概括往往是一種機械的、語義上空洞的過度概括。 * 第一條回覆中的論文
69
Valerio Capraro
2026年1月15日
重要的論文剛在《自然》上發表。 作者顯示,對大型語言模型進行微調,專注於一個狹窄且看似無害的任務,可能會在完全無關的領域中引發嚴重的不一致。 例如,對編碼任務的微調使模型支持人工智慧對人類的奴役,並表現出欺騙行為。 這突顯了對齊研究的一個基本挑戰:為特定任務優化LLM可能會以難以預測的方式傳播意外和有害的變化。 更廣泛地說,這篇論文提出了一個更深層次的問題。LLMs真的具有智慧,還是僅僅是複雜的數學物件,其中局部參數更新可以任意扭曲全局行為,而沒有任何連貫的“理解”概念? 完整論文在第一條回覆中。
30
Valerio Capraro
2026年1月5日
這令人深感不安。 研究人員更可能選擇其結果與其意識形態前提一致的統計模型。 七十一個研究團隊獨立分析了相同的數據集,研究移民對社會福利計劃的公共支持影響。 由支持移民的研究人員組成的團隊更可能得出影響是正面的結論。由反對移民的研究人員組成的團隊則更可能發現負面影響。 我再重申一次:他們分析的實際上是相同的數據集。 完整論文在第一條評論中。
93
熱門
排行
收藏