Am împachetat proiectul de "autocercetare" într-un nou depozit minimal autonom, dacă oamenii ar dori să joace în weekend. Practic, este un nucleu de antrenament LLM nanochat, redus la o singură versiune cu un singur GPU, un singur fișier, de aproximativ 630 de linii de cod, apoi: - omul itera pe prompt (.md) - agentul AI itera codul de antrenament (.py) Scopul este să-ți proiectezi agenții să facă cel mai rapid progres în cercetare, pe termen nelimitat și fără implicarea ta. În imagine, fiecare punct este o rundă completă de antrenament LLM care durează exact 5 minute. Agentul funcționează într-un ciclu autonom pe o ramură de caracteristică git și acumulează commit-uri git în scriptul de antrenament pe măsură ce găsește setări mai bune (cu pierdere mai mică de validare până la final) ale arhitecturii rețelei neuronale, optimizatorului, tuturor hiperparametrilor etc. Îți poți imagina compararea progresului cercetării diferitelor prompturi, agenți diferiți etc. Parțial cod, parțial SF și un strop de psihoză :)