Il panorama dell'apprendimento per rinforzo agentico per LLM: un'indagine