关于GPT-5.4的传闻是,该模型可以保持状态。 杰夫·迪恩在他的@latentspacepod节目中提到过这一点,因此显然这是AI实验室正在考虑的事情。 我敢打赌,他们很有可能已经发现如何有效地将状态空间模型与变换器大规模集成。 状态空间模型旨在在每个计算步骤中携带一个隐藏状态,并且线性扩展,而不是像变换器那样以平方的方式扩展。 这也支持了关于GPT-5.4将拥有200万标记上下文窗口的传闻。 持久状态基本上意味着AI模型会在一夜之间从盖·皮尔斯在《记忆碎片》中的角色变成达斯汀·霍夫曼在《雨人》中的角色。 这将赋予AI模型真正的长期记忆。 这将是一个巨大的突破。