Julkistamme ARESin – avoimen lähdekoodin Agentic Research and Evaluation Suite -pakettimme.
ARES on rakennettu kolmen pilarin ympärille (👇 katso ketju), jotta vahvistusoppiminen koodiagenteille on helppoa.
Olemme myös huomanneet sen olevan uskomattoman hyödyllistä omassa mecha-interp-tutkimuksessamme.
$1,000,000 ymmärtääkseni, miten LLM:t kirjoittavat koodia.
Ilmoitus: Marsin tulkintahaaste.
LLM:ien sisäisten toimintojen ymmärtäminen on aikamme suurin tieteellinen haaste. Ratkaistaan se.
Hae tästä:
🧵👇