O GPT 5.4 Pro acabou de esmagar o benchmark matemático mais difícil, FrontierMath Tier 4, com 38%. Esses 50 problemas matemáticos de nível de pesquisa podem levar semanas a matemáticos para resolver. Um ano atrás, o melhor era 2% (o3). O melhor modelo de código aberto é 4,2% (Kimi K2.5) Incrivelmente impressionante.