熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
上週,Karpathy 發布了終極指南,教你如何快速進入 LLMs。
在這個項目中,你將構建所有基本要素,總行數不超過 8k 行代碼。
> 訓練分詞器 — 新的 Rust 實現
> 在 fineweb 上預訓練一個變壓器 LLM
> 在多個指標上評估核心分數
> 中途訓練 — 來自 smoltalk 的用戶助手對話,
> 多選題,工具使用
> sft,然後在以下方面評估聊天模型:
> 世界知識 MCQ (arc-e/c, mmlu)
> 數學 (gsm8k)
> 代碼 (humaneval)
> 可選地在 gsm8k 上對模型進行 rl,使用 "grpo"
> 高效推理:
> kv 緩存,快速預填/解碼
> 工具使用 (python 解釋器,沙盒)
> 通過 cli 或類似 chatgpt 的 webui 訪問
> 撰寫一份單一的 markdown 報告卡,
> 總結 + 遊戲化整個流程
你將構建的模型:
> 僅使用旋轉(不使用位置嵌入)
> qk 正規化...

熱門
排行
收藏
