Résultats de benchmark très intéressants pour @openclaw meilleur LLM Le test : Pourcentage de tâches complétées avec succès lors des tests standardisés de l'agent OpenClaw Des résultats surprenants pour moi, kimi 2.5 est au-dessus d'Anthropic Minimax 2.1 à la #3 Les modèles Al Qwen sont plutôt mauvais