المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
معيار آخر لم يحل (وصعب الآن) في مجال الذكاء الاصطناعي: "اكتب لغز جريمة مرض من 10 فقرات. يجب أن تكون القطع التي تحتاجها لحل اللغز واضحة بما يكفي في الفقرات الخمس الأولى لتتمكن من حلها، لكنها غامضة بما يكفي بحيث لا يفعل الغالبية العظمى من الناس ذلك"
الأخطاء تكشف ما يلي:
-كلود ينسى إضافة الدليل الفعلي للغز (والتفاصيل غامضة جدا)، وهي مشكلة تخطيط كلاسيكية لنماذج اللغة الكبيرة، ولا، استخدام Cowork أو Code لا يساعد.
-ChatGPT 5.4 Pro يخلق دليلا واضحا تماما ثم يبدأ في الكتابة بالاستعارات المعقدة والتعقيدات التي طاردت قصص ChatGPT. لكن Pro كان أفضل من Thinking.
-Gemini 3.1 Pro هو الأقرب، لكن الجليد واضح قليلا، وهذا يفسد تماما سبب أهمية موضوع الجليد.



الأفضل
المُتصدِّرة
التطبيقات المفضلة
