أحيانا أصنع بيئة معقدة جديدة حيث تواجه النماذج صعوبة كبيرة ثم أبدأ تدريب التعلم المعزز بإعداد افتراضي منطقي وأقول "هذا البيئة صعبة جدا، لا أعرف إذا كانت ستعمل" لكنها تعمل ببساطة. المكافأة ترتفع. التمريرات تبدو جميلة.