GPT 5.4 Pro vient de pulvériser le benchmark mathématique le plus difficile, FrontierMath Tier 4, avec 38%. Ces 50 problèmes mathématiques de niveau recherche peuvent prendre des semaines aux mathématiciens pour être résolus. Il y a un an, le meilleur était de 2% (o3). Le meilleur modèle open source est à 4,2% (Kimi K2.5) Incroyablement impressionnant.