GPT 5.4 Pro acaba de superar el benchmark matemático más difícil, FrontierMath Tier 4, con un 38%. Estos 50 problemas matemáticos de nivel de investigación pueden llevar semanas a los matemáticos resolverlos. Hace un año, lo mejor era el 2% (o3). El mejor modelo de código abierto es del 4,2% (Kimi K2.5) Impresionante.