O GPT 5.4 Pro acabou de superar o benchmark de matemática mais difícil, o FrontierMath Tier 4, com 38%. Esses 50 problemas matemáticos de nível de pesquisa podem levar semanas para matemáticos serem resolvidos. Um ano atrás, o melhor era 2% (O3). O melhor modelo open source é 4,2% (Kimi K2.5) Impressionante de verdade.