Nouvelle enquête sur l'apprentissage par renforcement agentique pour les LLM. Le RL des LLM traite encore les modèles comme des générateurs de séquences optimisés dans des contextes relativement étroits. Cependant, les véritables agents opèrent dans des environnements ouverts et partiellement observables où la planification, la mémoire, l'utilisation d'outils, le raisonnement, l'auto-amélioration et la perception interagissent tous. Cet article soutient que le RL agentique devrait être considéré comme son propre paysage. Il introduit une large taxonomie qui organise le domaine autour des capacités fondamentales des agents et des domaines d'application, puis cartographie les environnements open-source, les benchmarks et les frameworks qui façonnent cet espace. Si vous construisez des agents, c'est un article solide qui vaut la peine d'être consulté. Article : Apprenez à construire des agents IA efficaces dans notre académie :