Resultados de benchmark muy interesantes para @openclaw mejor LLM La prueba: Porcentaje de tareas completadas con éxito en pruebas estandarizadas de agentes OpenClaw Resultados sorprendentes para mí, el kimi 2,5 está por encima de Anthopic Minimax 2.1 en el #3 Los modelos de Al Qwen son bastante malos