GPT 5.4 Pro tocmai a depășit cel mai dificil benchmark matematic, FrontierMath Tier 4, cu 38%. Aceste 50 de probleme matematice la nivel de cercetare pot dura matematicienilor săptămâni întregi pentru a fi rezolvate. Acum un an, cel mai bun era 2% (O3). Cel mai bun model open source este 4,2% (Kimi K2.5) Incredibil de impresionant.