GPT 5.4 Pro 剛剛在最難的數學基準測試 FrontierMath Tier 4 中以 38% 的成績壓倒一切。 這 50 道研究級數學問題可能需要數學家幾週才能解決。 一年前,最佳成績是 2% (o3)。最佳的開源模型是 4.2% (Kimi K2.5) 真是令人難以置信的表現。