GPT-5.4 泄露:2M 令牌上下文 + 持久状态 = KV 缓存爆炸 这是实时的内存战争 用于权重的 HBM。用于延迟关键推理的 SRAM。光互连将这一切绑定在一起 我一直在写的分叉不再是理论了。