@openclaw最高のLLMにとって非常に興味深いベンチマーク結果 テスト内容: 標準化されたOpenClawエージェントテストにおけるタスクの成功率 驚くべき結果で、キミ2.5はアンソピックより上です Minimax 2.1 #3 アル・クウェンのモデルはかなり悪いです