Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sapient ha rilasciato il suo Modello di Ragionamento Gerarchico (HRM) e i risultati sono piuttosto interessanti. Si tratta di un modello con 27 milioni di parametri che supera Claude 3.5 e o3-mini nei benchmark di ragionamento come ARC-AGI-2, complessi puzzle di Sudoku e ricerca di percorsi in grandi labirinti.
Cosa rende questo notevole:
L'aspetto dell'efficienza è sorprendente. L'HRM è stato addestrato su circa 1000 esempi senza pre-addestramento o suggerimenti di Chain-of-Thought, eppure gestisce compiti di ragionamento complessi che tipicamente richiederebbero modelli molto più grandi. Questo lo rende pratico per il deployment su dispositivi edge e accessibile per team senza budget di calcolo massicci.
L'architettura ispirata al cervello è più di una semplice terminologia. L'HRM utilizza un design a doppio sistema con due moduli: uno per la pianificazione astratta di alto livello e un altro per l'esecuzione dettagliata rapida, operando a scale temporali diverse. Questo rispecchia il modo in cui funziona la cognizione umana, con un'elaborazione intuitiva veloce e un ragionamento deliberato più lento.
Il requisito di basse risorse cambia l'equazione dell'accessibilità. Mentre la maggior parte delle AI avanzate richiede un'infrastruttura significativa, l'HRM può funzionare su hardware normale, aprendo capacità di ragionamento sofisticate a startup e ricercatori che non possono permettersi calcoli su larga scala.
Approccio tecnico:
Invece di elaborare i token in modo sequenziale come i Transformers, l'HRM utilizza loop ricorrenti gerarchici che operano in uno spazio continuo piuttosto che in token discreti. Il modello risolve i compiti direttamente senza dover verbalizzare il suo processo di pensiero attraverso catene esplicite passo dopo passo.
L'efficienza dei parametri deriva dall'apprendimento di schemi di ragionamento che generalizzano da esempi minimi piuttosto che memorizzare enormi quantità di dati di addestramento. L'addestramento utilizza un'approssimazione del gradiente a passo singolo per mantenere costante l'uso della memoria, rendendolo pratico su hardware standard.
L'HRM adatta anche il suo calcolo - spendendo più cicli su problemi più difficili e meno su quelli più semplici, utilizzando l'apprendimento per rinforzo per determinare quando fermarsi nel ragionamento. Il processo di ragionamento è interpretabile, specialmente su compiti visivi dove puoi osservare come risolve i problemi passo dopo passo.
Questo suggerisce che il ragionamento avanzato potrebbe riguardare più il design architettonico che la scala, il che potrebbe cambiare il nostro modo di pensare alla costruzione di sistemi AI capaci.

60,05K
Principali
Ranking
Preferiti