المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
دراسة جديدة حول التعلم بالتعزيز الوكيلي لنماذج اللغة الكبيرة (LLMs).
لا يزال LLM RL يعامل النماذج كمولدات تسلسلات محسنة في بيئات ضيقة نسبيا. ومع ذلك، يعمل الوكلاء الحقيقيون في بيئات مفتوحة النهاية وقابلة للرصد جزئيا، حيث تتفاعل التخطيط، الذاكرة، استخدام الأدوات، التفكير، تحسين الذات، والإدراك جميعا.
تجادل هذه الورقة بأن التعلم الواقعي الوكيل يجب أن يعامل كمنظر طبيعي مستقل.
يقدم تصنيفا واسعا ينظم المجال عبر قدرات الوكلاء الأساسية ومجالات التطبيق، ثم يرسم البيئات مفتوحة المصدر، والمعايير والأطر، التي تشكل هذا المجال.
إذا كنت وكلاء بناء، فهذه ورقة قوية تستحق الاطلاع عليها.
الورقة:
تعلم كيفية بناء وكلاء ذكاء اصطناعي فعالين في أكاديميتنا:

الأفضل
المُتصدِّرة
التطبيقات المفضلة
