Kunngjøring av ARES – vår åpne kildekode Agentic Research and Evaluation Suite.
ARES er bygget rundt tre pilarer (👇 se tråden) for å gjøre forsterkningslæring for kodeagenter enkelt.
Vi har også funnet det utrolig nyttig for vår egen forskning på mech-tolkning.
1 000 000 dollar for å forstå hvordan LLM-er skriver kode.
Kunngjøring: Den marsianske tolkbarhetsutfordringen.
Å forstå hvordan LLM-er fungerer er den største vitenskapelige utfordringen i vår tid. La oss løse det.
Søk her:
🧵👇