Un nou sondaj despre învățarea prin întărire agentică pentru LLM-uri. LLM RL încă tratează modelele ca pe generatoare de secvențe optimizate în contexte relativ restrânse. Totuși, agenții reali operează în medii deschise, parțial observabile, unde planificarea, memoria, utilizarea uneltelor, raționamentul, auto-îmbunătățirea și percepția interacționează toate. Această lucrare susține că RL-ul agentic ar trebui tratat ca un peisaj separat. Introduce o taxonomie largă care organizează domeniul pe capabilități de bază ale agenților și domeniile de aplicație, apoi cartografiază mediile open-source, benchmark-urile și framework-urile care modelează acest domeniu. Dacă construiești agenți, acesta este un articol solid care merită consultat. Hârtie: Învață să construiești agenți AI eficienți în academia noastră: