Нарешті вивчено @PrimeIntellect Environments Hub! Платформа для спільного використання RL-середовищ для train/eval LLM/агентів, залишаючи все відкритим Написав покрокове керівництво на Environments Hub + Verifiers (@willccbb), від основ до evals & GRPO навчання на @kalomaze алфавітному сортуванні env. 👇
15,4K