Nueva encuesta sobre aprendizaje por refuerzo agente para LLMs. LLM RL sigue tratando los modelos como generadores de secuencias optimizados en entornos relativamente limitados. Sin embargo, los agentes reales operan en entornos abiertos y parcialmente observables donde la planificación, la memoria, el uso de herramientas, el razonamiento, la auto-mejora y la percepción interactúan. Este artículo sostiene que el RL agente debe tratarse como un paisaje propio. Introduce una taxonomía amplia que organiza el campo entre las capacidades principales de los agentes y dominios de aplicación, y luego mapea los entornos de código abierto, benchmarks y frameworks que moldean el espacio. Si vas a construir agentes, este es un trabajo sólido que merece la pena consultar. Papel: Aprende a crear agentes de IA efectivos en nuestra academia: