🚨 Los modelos de IA acaban de inventar modelos de IA mejores y novedosos. Investigadores chinos introdujeron toda la investigación de LLM en un modelo y descubrió 106 nuevas arquitecturas de modelos de IA que convergen para reducir la pérdida con mejores puntos de referencia. ASI-Arch es uno de los mejores artículos de IA de este año. En ruta AGI.
Sé que hay mucho "oh, esto es basura" en la línea de tiempo. Algunas de ellas son críticas muy válidas, pero leí todo el artículo y en realidad es bastante interesante. Tampoco está claro que estas arquitecturas de modelos descubiertas no sean buenas si se amplían. ¿Es tan útil como GSPO o incluso como el papel HRM de esta semana? Tal vez no, pero realmente no entiendas el tribalismo por eso.
163.26K