🚨 Os modelos de IA acabaram de inventar modelos de IA melhores e novos. Pesquisadores chineses alimentaram toda a pesquisa de LLM em um modelo e descobriram 106 novas arquiteturas de modelo de IA que convergem para reduzir a perda com melhores benchmarks. ASI-Arch é um dos artigos de IA mais legais deste ano. A caminho da AGI.
Eu sei que há muito "oh, isso é lixo" na linha do tempo. Algumas delas são críticas muito válidas, mas li todo o artigo e é realmente muito interessante. Também não está claro se essas arquiteturas de modelo descobertas não são boas se ampliadas. É tão útil quanto o GSPO ou mesmo o artigo HRM esta semana? Talvez não, mas realmente não entendo o tribalismo sobre isso.
163,28K