显然,OpenAI 现在拥有了最佳编码模型的桂冠。 GPT 5.3 Codex 已经比 Opus 4.6 更好,而新的 GPT 5.4 更是超越了我迄今为止使用过的任何模型。 对现有代码的理解,涵盖边缘案例场景,以及在第一次尝试时编写代码而不出错的能力令人难以置信。 我在 GPT 5.4 中看到的唯一缺点是,在 Cursor 中对话变得非常长时,有时后续问题会被忽略,而它会再次回答之前的问题。我在昨天和今天的工作中看到过几次这种情况。这可能是 Cursor 或模型的问题,不太确定,但我希望看到他们推出 GPT 5.4 的 Codex 版本。