GPT 5.4 Pro knuste nettopp den vanskeligste matematikkbenchmarken, FrontierMath Tier 4, med 38 %. Disse 50 matematikkoppgavene på forskningsnivå kan ta matematikere uker å løse. For ett år siden var det beste 2 % (O3). Den beste åpen kildekode-modellen er 4,2 % (Kimi K2.5) Utrolig imponerende.