Dessa nya AI-benchmarks blir galna.