GPT 5.4 Pro właśnie zdominował najtrudniejszy benchmark matematyczny, FrontierMath Tier 4, z wynikiem 38%. Te 50 problemów matematycznych na poziomie badawczym może zająć matematykowi tygodnie do rozwiązania. Rok temu najlepszy wynik wynosił 2% (o3). Najlepszy model open source to 4,2% (Kimi K2.5) Niesamowicie imponujące.