我不羡慕那些给 First Proof 答案打分的人。当我们评估 Grok 4 时,我不得不在它的一个 USAMO 解答上请求帮助。一位评分者说 7/7。另一位说 0/7:方法很聪明,但它偷偷依赖于这个非凸集合的凸性。另一位评分者同意了。