熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
沒有人在談論 @apple 對 128GB MacBook Pro 保持價格不變。面對飆升的記憶體價格,並沒有漲價。
每個人都在談論計算能力的提升,預填速度提高了 4 倍。這很酷,但實際上並沒有那麼重要。為什麼?因為在你自己的電腦上,大多數使用 LLM 的應用程式/工具將會獲得高的 kv 快取命中率——這意味著作為用戶,你只會經歷一次緩慢的預填。kv 快取可以持久化到磁碟並以 6GB/s 的速度加載。
在 LLM 推理中,大部分時間都花在解碼上,這是受記憶體帶寬限制的。
這對於圖像/視頻生成、高批次 LLM 推理和微調仍然很棒,這些都是受計算限制的。我們應該會看到那裡的巨大加速。
Apple 的 AI 策略是設備上的 LLM,而在這裡,記憶體才是關鍵,而不是 FLOPS。
對於 M5 Pro/Max Mac Mini 和 M5 Ultra Mac Studio 也應該期待同樣的情況。這意味著 512GB M5 Ultra 價格為 10k!
@tim_cook 是供應鏈天才。
熱門
排行
收藏
