実現しています:ナノチャット上のAIエージェントによる自律型AI研究! GPT-2のトレーニングに629行のコード。研究アジェンダを定義したマークダウンファイルが1つ。それが研究所全体だ。 AI研究者はAIに取って代わられる最初の存在かもしれません。最も面白い結果が起こりやすいのです。
Andrej Karpathy
Andrej Karpathy5時間前
週末に遊びたい人がいるなら、その「autoresearch」プロジェクトを新しい自己完結型ミニマルリポジトリにまとめました。基本的にはnanochatのLLMトレーニングコアを、単一のGPUと約630行のファイルバージョンに絞ったものです。 - 人間がプロンプト(.md)を反復する - AIエージェントがトレーニングコードを反復する(.py) 目標は、エージェントが無期限に、そしてあなた自身の関与なしに最速で調査を進めるよう設計することです。画像では、各点がちょうど5分間の完全なLLMトレーニングランです。エージェントはgitの機能ブランチ上で自律ループで動作し、ニューラルネットワークアーキテクチャや最適化装置、すべてのハイパーパラメータなどのより良い設定(最終的に検証損失が低い)を見つけることで、gitコミットをトレーニングスクリプトに蓄積します。異なるプロンプトやエージェントの研究進捗を比較することを想像してみてください。 コードの一部、SF、そして少しの精神病:)
GPT-5.4 xhighとClaude Opus 4.6を召喚し、16台のGPUを用意し、晴れた土曜日に自律的に研究させたのは非常に満足感があります。 また、どのモデルがより良い研究者かの評価もかなり良いです。明日、面白い結果を投稿するかもしれません。
31