Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Společnost Sapient vydala svůj model hierarchického uvažování (HRM) a výsledky jsou docela zajímavé. Jedná se o 27M parametrický model, který překonává Claude 3.5 a o3-mini v referenčních hodnotách uvažování, jako je ARC-AGI-2, složité sudoku a hledání cest ve velkých bludišti.
Čím je tento článek pozoruhodný:
Aspekt efektivity je pozoruhodný. HRM bylo trénováno na zhruba 1000 příkladech bez předběžného trénování nebo Chain-of-Thought promptingu, přesto zvládá složité úlohy uvažování, které obvykle vyžadují mnohem větší modely. Díky tomu je praktický pro nasazení na okrajových zařízeních a přístupný pro týmy bez obrovských výpočetních rozpočtů.
Architektura inspirovaná mozkem je více než jen terminologie. HRM využívá konstrukci duálního systému se dvěma moduly: jeden pro abstraktní plánování na vysoké úrovni a druhý pro rychlou detailní exekuci, pracující v různých časových měřítcích. To zrcadlí, jak funguje lidské poznání jak s rychlým intuitivním zpracováním, tak s pomalejším záměrným uvažováním.
Požadavek na nízké zdroje mění rovnici přístupnosti. Zatímco většina pokročilé umělé inteligence vyžaduje značnou infrastrukturu, HRM může běžet na běžném hardwaru, což otevírá sofistikované možnosti uvažování startupům a výzkumníkům, kteří si nemohou dovolit rozsáhlé výpočty.
Technický přístup:
Namísto sekvenčního zpracování tokenů jako Transformers, HRM používá hierarchické opakující se smyčky, které pracují v nepřetržitém prostoru, spíše než diskrétní tokeny. Model řeší úkoly přímo, aniž by musel verbalizovat svůj myšlenkový proces prostřednictvím explicitních řetězců krok za krokem.
Efektivita parametrů pochází z učení vzorců uvažování, které zobecňují z minimálních příkladů, spíše než aby si pamatovaly obrovské množství trénovacích dat. Trénink využívá jednokrokovou aproximaci gradientu pro udržení konstantního využití paměti, takže je praktický na standardním hardwaru.
HRM také přizpůsobuje své výpočty – tráví více cyklů na těžších problémech a méně na jednodušších, přičemž pomocí zpětnovazebního učení určuje, kdy přestat uvažovat. Proces uvažování je interpretovatelný, zejména u vizuálních úloh, kde můžete pozorovat, jak řeší problémy krok za krokem.
To naznačuje, že pokročilé uvažování by mohlo být více o architektonickém návrhu než o měřítku, což by mohlo změnit způsob, jakým přemýšlíme o vytváření schopných systémů umělé inteligence.

60,04K
Top
Hodnocení
Oblíbené