Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Se întâmplă: cercetare AI autonomă realizată de agenți AI pe nanochat!
629 de linii de cod pentru a antrena GPT-2. Un fișier de markdown care definește agenda de cercetare. Asta e tot laboratorul de cercetare.
Cercetătorii în AI ar putea fi primii înlocuiți de AI. Cel mai amuzant rezultat este cel mai probabil.


8 mar., 03:53
Am împachetat proiectul de "autocercetare" într-un nou depozit minimal autonom, dacă oamenii ar dori să joace în weekend. Practic, este un nucleu de antrenament LLM nanochat, redus la o singură versiune cu un singur GPU, un singur fișier, de aproximativ 630 de linii de cod, apoi:
- omul itera pe prompt (.md)
- agentul AI itera codul de antrenament (.py)
Scopul este să-ți proiectezi agenții să facă cel mai rapid progres în cercetare, pe termen nelimitat și fără implicarea ta. În imagine, fiecare punct este o rundă completă de antrenament LLM care durează exact 5 minute. Agentul funcționează într-un ciclu autonom pe o ramură de caracteristică git și acumulează commit-uri git în scriptul de antrenament pe măsură ce găsește setări mai bune (cu pierdere mai mică de validare până la final) ale arhitecturii rețelei neuronale, optimizatorului, tuturor hiperparametrilor etc. Îți poți imagina compararea progresului cercetării diferitelor prompturi, agenți diferiți etc.
Parțial cod, parțial SF și un strop de psihoză :)

Să invoci GPT-5.4 xhigh și Claude Opus 4.6, să le dai 16 plăci video și să le permiți să facă cercetare autonomă într-o sâmbătă însorită este extrem de satisfăcător.
De asemenea, este o evaluare destul de bună pentru modelul care este cercetătorul mai bun. S-ar putea să postez rezultate interesante mâine.
152
Limită superioară
Clasament
Favorite
