Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sapient ga ut sin hierarkiske resonnementmodell (HRM), og resultatene er ganske interessante. Dette er en 27M-parametermodell som overgår Claude 3.5 og o3-mini på resonneringsreferanser som ARC-AGI-2, komplekse Sudoku-gåter og stifinning i store labyrinter.
Hva gjør dette bemerkelsesverdig:
Effektivitetsaspektet er slående. HRM ble trent på omtrent 1000 eksempler uten forhåndstrening eller tankekjede, men den håndterer komplekse resonneringsoppgaver som vanligvis krever mye større modeller. Dette gjør det praktisk for distribusjon på kantenheter og tilgjengelig for team uten enorme databehandlingsbudsjetter.
Den hjerneinspirerte arkitekturen er mer enn bare terminologi. HRM bruker en dobbel systemdesign med to moduler: en for abstrakt planlegging på høyt nivå og en annen for rask detaljert utførelse, som opererer på forskjellige tidsskalaer. Dette gjenspeiler hvordan menneskelig kognisjon fungerer med både rask intuitiv prosessering og langsommere bevisst resonnement.
Kravet til lave ressurser endrer tilgjengelighetsligningen. Mens de fleste avanserte AI krever betydelig infrastruktur, kan HRM kjøre på vanlig maskinvare, noe som åpner for sofistikerte resonneringsmuligheter for startups og forskere som ikke har råd til storskala databehandling.
Teknisk tilnærming:
I stedet for å behandle tokener sekvensielt som Transformers, bruker HRM hierarkiske tilbakevendende løkker som opererer i kontinuerlig rom i stedet for diskrete tokener. Modellen løser oppgaver direkte uten å måtte verbalisere tankeprosessen gjennom eksplisitte trinnvise kjeder.
Parametereffektiviteten kommer fra å lære resonneringsmønstre som generaliseres fra minimale eksempler i stedet for å huske store mengder treningsdata. Opplæringen bruker ett-trinns gradienttilnærming for å holde minnebruken konstant, noe som gjør den praktisk på standard maskinvare.
HRM tilpasser også beregningene sine - bruker flere sykluser på vanskeligere problemer og færre på enklere, ved å bruke forsterkende læring for å bestemme når du skal slutte å resonnere. Resonneringsprosessen er tolkbar, spesielt på visuelle oppgaver der du kan observere hvordan den løser problemer trinn for trinn.
Dette antyder at avansert resonnement kan handle mer om arkitektonisk design enn skala, noe som kan endre hvordan vi tenker på å bygge kapable AI-systemer.

60,04K
Topp
Rangering
Favoritter