Eindelijk de @PrimeIntellect Environments Hub verkend! Een platform om RL-omgevingen te delen voor het trainen/evalueren van LLM's/Agents, alles open houdend. Ik heb een handleiding geschreven over de Environments Hub + Verifiers (@willccbb), vanaf de basis tot evaluaties & GRPO-training op @kalomaze's alphabet-sort omgeving. 👇
15,39K