LLM向けのエージェント強化学習に関する新しい調査。 LLM RLは依然として比較的狭い環境で最適化されたシーケンスジェネレーターのようなモデルを扱っています。しかし、実際のエージェントは計画、記憶、ツールの使用、推論、自己改善、知覚がすべて相互作用する、開放的で部分的に観察可能な環境で活動します。 本論文は、エージェント的強化学習を独立したランドスケープとして扱うべきだと主張します。 このプログラムは、コアエージェントの能力とアプリケーションドメインを横断した広範な分類法を導入し、オープンソース環境、ベンチマーク、フレームワークをマッピングします。 もしあなたがビルディングエージェントであれば、この論文は読む価値のある強力な論文です。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう: