Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ini terjadi: penelitian AI otonom oleh agen AI di nanochat!
629 baris kode untuk melatih GPT-2. Satu file penurunan harga yang mendefinisikan agenda penelitian. Itulah seluruh laboratorium penelitian.
Peneliti AI mungkin yang pertama digantikan oleh AI. Hasil yang paling menghibur adalah yang paling mungkin.


5 jam lalu
Saya mengemas proyek "penelitian otomatis" ke dalam repo minimal mandiri baru jika orang ingin bermain selama akhir pekan. Ini pada dasarnya adalah inti pelatihan LLM nanochat yang dilucuti menjadi GPU tunggal, satu versi file dari ~630 baris kode, kemudian:
- manusia mengulangi prompt (.md)
- agen AI mengulangi kode pelatihan (.py)
Tujuannya adalah untuk merekayasa agen Anda untuk membuat kemajuan penelitian tercepat tanpa batas waktu dan tanpa keterlibatan Anda sendiri. Dalam gambar, setiap titik adalah latihan LLM lengkap yang berlangsung tepat 5 menit. Agen bekerja dalam loop otonom pada cabang fitur git dan mengakumulasi komitmen git ke skrip pelatihan karena menemukan pengaturan yang lebih baik (kehilangan validasi yang lebih rendah pada akhirnya) dari arsitektur jaringan saraf, pengoptimal, semua hiperparameter, dll. Anda dapat membayangkan membandingkan kemajuan penelitian dari petunjuk yang berbeda, agen yang berbeda, dll.
Kode bagian, sebagian fiksi ilmiah, dan sedikit psikosis :)

Memanggil GPT-5.4 xhigh dan Claude Opus 4.6, memberi mereka 16 GPU, dan membiarkan mereka melakukan penelitian otonom pada hari Sabtu yang cerah sangat memuaskan.
Juga ini adalah penilaian yang cukup bagus untuk model mana yang lebih baik untuk peneliti. Mungkin memposting hasil yang menarik besok.
34
Teratas
Peringkat
Favorit
