M5 Max 是一個價值 3,500 美元的玩具 對於本地 AI 來說,唯一重要的數字是:每秒令牌數 對於 LLM 推理,實際上重要的順序是: 記憶帶寬 → 決定每秒令牌數 顯示記憶體/統一記憶體 → 決定模型大小 計算能力 → 對推理幾乎不重要 每秒 25 個令牌在 70B 上聽起來令人印象深刻,直到你意識到代理 AI 需要 100 以上才能不感覺破碎 M5 是一台很棒的筆記型電腦,但不適合用作伺服器