Mengumumkan ARES - Suite Penelitian dan Evaluasi Agen sumber terbuka kami.
ARES dibangun di sekitar 3 pilar (👇 lihat utas) untuk mempermudah pembelajaran penguatan untuk agen kode.
Kami juga menemukan itu sangat berguna untuk penelitian interp mekanisme kami sendiri.
$1.000.000 untuk memahami bagaimana LLM menulis kode.
Pengumuman: Tantangan Interpretabilitas Mars.
Memahami cara kerja LLM adalah tantangan ilmiah terbesar di zaman kita,. Mari kita selesaikan.
Terapkan di sini:
🧵👇