每秒17,000个令牌!!再读一遍! LLM直接硬连线到硅片上。没有HBM,没有液冷,只有原始的专用硬件。比B200快10倍,便宜20倍。 “等待LLM思考”的时代已经结束。代码生成的速度与人类思维相当。 从粗暴的GPU集群过渡到真正的AI设备。