GPT 5.4 Pro heeft net de moeilijkste wiskundige benchmark, FrontierMath Tier 4, verpletterd met 38%. Deze 50 wiskundige problemen op onderzoeksniveau kunnen weken duren om door wiskundigen op te lossen. Een jaar geleden was het beste 2% (o3). Het beste open source model is 4.2% (Kimi K2.5) Bizar indrukwekkend.