El panorama del aprendizaje por refuerzo agentivo para LLMs: una encuesta