GPT 5.4 Pro vừa vượt qua bài kiểm tra toán khó nhất, FrontierMath Tier 4, với 38%. 50 bài toán cấp nghiên cứu này có thể mất hàng tuần để các nhà toán học giải quyết. Một năm trước, kết quả tốt nhất là 2% (o3). Mô hình mã nguồn mở tốt nhất là 4.2% (Kimi K2.5) Thật sự ấn tượng.