Новое исследование по агентному обучению с подкреплением для LLM. LLM RL по-прежнему рассматривает модели как генераторы последовательностей, оптимизированные в относительно узких условиях. Однако реальные агенты действуют в открытых, частично наблюдаемых средах, где планирование, память, использование инструментов, рассуждение, самоулучшение и восприятие взаимодействуют друг с другом. В этой статье утверждается, что агентное RL следует рассматривать как собственный ландшафт. Она вводит широкую таксономию, которая организует область по основным возможностям агентов и областям применения, а затем отображает открытые среды, бенчмарки и фреймворки, формирующие это пространство. Если вы создаете агентов, это сильная статья, которую стоит изучить. Статья: Научитесь создавать эффективных AI-агентов в нашей академии: