GPT 5.4 Pro krossade precis det svåraste mattebenchmarket, FrontierMath Tier 4, med 38%. Dessa 50 forskningsnivåproblem kan ta matematiker veckor att lösa. För ett år sedan var det bästa 2 % (o3). Den bästa open source-modellen är 4,2 % (Kimi K2.5) Otroligt imponerande.