Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Děje se to: autonomní výzkum AI agentů na nanochatu!
629 řádků kódu pro trénování GPT-2. Jeden markdown soubor definující výzkumný program. To je celá výzkumná laboratoř.
Výzkumníci AI by mohli být první, které AI nahradí. Nejzábavnější výsledek je nejpravděpodobnější.


8. 3. 03:53
Projekt "autoresearch" jsem zabalil do nového samostatného minimálního repozitáře, pokud by si lidé chtěli zahrát o víkendu. V podstatě jde o tréninkové jádro nanochat LLM zredukované na verzi s jedním GPU a jedním souborem ~630 řádků kódu, pak:
- člověk iteruje na zadání (.md)
- AI agent iteruje na tréninkovém kódu (.py)
Cílem je inženýrsky nasměrovat své agenty tak, aby dělali nejrychlejší výzkumný pokrok neomezeně dlouho a bez vašeho zapojení. Na obrázku je každý bod kompletní tréninkový běh LLM, který trvá přesně 5 minut. Agent pracuje v autonomní smyčce na větvi funkcí git a shromažďuje git commity do trénovacího skriptu, jakmile najde lepší nastavení (s menšími ztrátami validace na konci) architektury neuronové sítě, optimalizátoru, všech hyperparametrů atd. Můžete si představit porovnávat pokrok výzkumu různých zadání, různých agentů atd.
Částečně kód, částečně sci-fi a špetka psychózy :)

Přivolat GPT-5.4 xhigh a Claude Opus 4.6, dát jim 16 GPU a nechat je dělat samostatný výzkum v slunečnou sobotu je nesmírně uspokojivé.
Také je to docela dobré hodnocení, který model je lepší výzkumník. Možná zítra zveřejním zajímavé výsledky.
99
Top
Hodnocení
Oblíbené
