Nový průzkum o agentickém posilovaném učení pro LLM. LLM RL stále zachází s modely jako s generátory sekvencí optimalizovanými v relativně úzkých nastaveních. Skuteční agenti však působí v otevřených, částečně pozorovatelných prostředích, kde se vzájemně ovlivňují plánování, paměť, používání nástrojů, uvažování, sebezdokonalování a vnímání. Tento článek tvrdí, že agentické RL by mělo být považováno za samostatnou krajinu. Zavádí širokou taxonomii, která organizuje pole napříč klíčovými schopnostmi agentů a aplikačními doménami, poté mapuje open-source prostředí, benchmarky a rámce, které prostor formují. Pokud jste stavební makléři, je to silný článek, který stojí za to si prohlédnout. Článek: Naučte se vytvářet efektivní AI agenty v naší akademii: