Finalmente esplorato il @PrimeIntellect Environments Hub! Una piattaforma per condividere ambienti RL per l'addestramento/eval di LLM/Agenti, mantenendo tutto aperto. Ho scritto una guida sull'Environments Hub + Verificatori (@willccbb), dai fondamenti agli eval e all'addestramento GRPO sull'ambiente di ordinamento dell'alfabeto di @kalomaze. 👇
15,4K