veldig kult og grundig stykke om bruk av Environments Hub :)
Stefano Fiorucci
Stefano Fiorucci4. sep., 23:32
Endelig utforsket @PrimeIntellect miljøsenter! En plattform for å dele RL-miljøer for train/eval-LLM-er/agenter, og holde ting åpne Skrev en gjennomgang på Environments Hub + Verifiers (@willccbb), fra grunnleggende til evals og GRPO-trening på @kalomaze alfabetsorterings-env. 👇
7,75K