Ny undersøkelse om agentisk forsterkningslæring for LLM-er. LLM RL behandler fortsatt modeller som sekvensgeneratorer optimalisert i relativt smale omgivelser. Likevel opererer ekte agenter i åpne, delvis observerbare miljøer hvor planlegging, hukommelse, verktøybruk, resonnement, selvforbedring og persepsjon alle samhandler. Denne artikkelen argumenterer for at agentisk RL bør behandles som sitt eget landskap. Den introduserer en bred taksonomi som organiserer feltet på tvers av kjernekapasiteter og applikasjonsdomener, og deretter kartlegger de åpne kildekode-miljøene, benchmarks og rammeverk som former området. Hvis du er byggemeglere, er dette et sterkt papir verdt å sjekke ut. Artikkel: Lær å bygge effektive AI-agenter i vår akademi: