每秒 17,000 個代幣!!再讀一遍! LLM 直接硬連接到矽片上。沒有 HBM,沒有液冷,只有原始的專用硬體。比 B200 快 10 倍,便宜 20 倍。 “等待 LLM 思考”的時代已經結束。代碼生成的速度與人類思維相當。 從粗暴的 GPU 集群過渡到真正的 AI 設備。