دراسة جديدة حول التعلم بالتعزيز الوكيلي لنماذج اللغة الكبيرة (LLMs). لا يزال LLM RL يعامل النماذج كمولدات تسلسلات محسنة في بيئات ضيقة نسبيا. ومع ذلك، يعمل الوكلاء الحقيقيون في بيئات مفتوحة النهاية وقابلة للرصد جزئيا، حيث تتفاعل التخطيط، الذاكرة، استخدام الأدوات، التفكير، تحسين الذات، والإدراك جميعا. تجادل هذه الورقة بأن التعلم الواقعي الوكيل يجب أن يعامل كمنظر طبيعي مستقل. يقدم تصنيفا واسعا ينظم المجال عبر قدرات الوكلاء الأساسية ومجالات التطبيق، ثم يرسم البيئات مفتوحة المصدر، والمعايير والأطر، التي تشكل هذا المجال. إذا كنت وكلاء بناء، فهذه ورقة قوية تستحق الاطلاع عليها. الورقة: تعلم كيفية بناء وكلاء ذكاء اصطناعي فعالين في أكاديميتنا: