A Sapient lançou o seu Modelo de Raciocínio Hierárquico (HRM) e os resultados são bastante interessantes. Este é um modelo com 27 milhões de parâmetros que supera o Claude 3.5 e o o3-mini em benchmarks de raciocínio como ARC-AGI-2, quebra-cabeças complexos de Sudoku e busca de caminhos em grandes labirintos. O que torna isso notável: O aspecto da eficiência é impressionante. O HRM foi treinado com cerca de 1000 exemplos, sem pré-treinamento ou sugestões de Cadeia de Pensamento, e ainda assim lida com tarefas de raciocínio complexas que normalmente exigem modelos muito maiores. Isso o torna prático para implementação em dispositivos de borda e acessível para equipes sem orçamentos massivos de computação. A arquitetura inspirada no cérebro é mais do que apenas terminologia. O HRM utiliza um design de sistema duplo com dois módulos: um para planejamento abstrato de alto nível e outro para execução detalhada rápida, operando em diferentes escalas de tempo. Isso espelha como a cognição humana funciona, com processamento intuitivo rápido e raciocínio deliberado mais lento. A baixa exigência de recursos muda a equação de acessibilidade. Enquanto a maioria das IA avançadas requer infraestrutura significativa, o HRM pode rodar em hardware comum, abrindo capacidades de raciocínio sofisticadas para startups e pesquisadores que não podem arcar com computação em larga escala. Abordagem técnica: Em vez de processar tokens sequencialmente como os Transformers, o HRM utiliza laços recorrentes hierárquicos que operam em espaço contínuo em vez de tokens discretos. O modelo resolve tarefas diretamente sem precisar verbalizar seu processo de pensamento através de cadeias explícitas passo a passo. A eficiência de parâmetros vem do aprendizado de padrões de raciocínio que generalizam a partir de exemplos mínimos, em vez de memorizar grandes quantidades de dados de treinamento. O treinamento utiliza aproximação de gradiente de um único passo para manter o uso de memória constante, tornando-o prático em hardware padrão. O HRM também adapta seu cálculo - gastando mais ciclos em problemas mais difíceis e menos em problemas mais simples, usando aprendizado por reforço para determinar quando parar de raciocinar. O processo de raciocínio é interpretável, especialmente em tarefas visuais onde se pode observar como resolve problemas passo a passo. Isso sugere que o raciocínio avançado pode ser mais sobre design arquitetônico do que escala, o que poderia mudar a forma como pensamos sobre a construção de sistemas de IA capazes.
60,05K