Uusi kysely agentin vahvistusoppimisesta LLM:ille. LLM RL käsittelee edelleen malleja kuin sekvenssigeneraattoreita, jotka on optimoitu suhteellisen kapeissa asetuksissa. Todelliset agentit toimivat kuitenkin avoimissa, osittain havaittavissa ympäristöissä, joissa suunnittelu, muisti, työkalujen käyttö, päättely, itsensä kehittäminen ja havainto kaikki ovat vuorovaikutuksessa. Tässä artikkelissa väitetään, että agenttista RL:ää tulisi käsitellä omana maisemanaan. Se esittelee laajan taksonomian, joka järjestää kentän ydinagenttien ominaisuuksien ja sovellusalueiden välillä, ja kartoittaa avoimen lähdekoodin ympäristöt, benchmarkit ja kehykset, jotka muovaavat tilaa. Jos olet rakennusagenttina, tämä on vahva artikkeli, joka kannattaa tarkistaa. Artikkeli: Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme: