pezzo molto interessante e dettagliato sull'uso dell'Environments Hub :)
Stefano Fiorucci
Stefano Fiorucci4 set, 23:32
Finalmente esplorato il @PrimeIntellect Environments Hub! Una piattaforma per condividere ambienti RL per l'addestramento/eval di LLM/Agenti, mantenendo tutto aperto. Ho scritto una guida sull'Environments Hub + Verificatori (@willccbb), dai fondamenti agli eval e all'addestramento GRPO sull'ambiente di ordinamento dell'alfabeto di @kalomaze. 👇
8,1K