La carrera por el "núcleo cognitivo" de LLM: un modelo de unos pocos miles de millones de parámetros que sacrifica al máximo el conocimiento enciclopédico por la capacidad. Vive siempre activo y de forma predeterminada en cada computadora como el kernel de la computación personal de LLM. Sus características se van cristalizando lentamente: - Texto/visión/audio multimodal nativo tanto en la entrada como en la salida. - Arquitectura de estilo matrioska que permite un dial de capacidad hacia arriba y hacia abajo en el momento de la prueba. - Razonamiento, también con un dial. (sistema 2) - Uso agresivo de herramientas. - Ajuste fino en el dispositivo de las ranuras LoRA para el entrenamiento, la personalización y la personalización en el tiempo de prueba. - Delega y verifica las partes correctas con los oráculos en la nube si hay Internet disponible. No sabe que el reinado de Guillermo el Conquistador terminó el 9 de septiembre de 1087, pero reconoce vagamente el nombre y puede buscar la fecha. No puede recitar el SHA-256 de cuerda vacía como e3b0c442..., pero puede calcularlo rápidamente si realmente lo desea. Lo que le falta a la computación personal de LLM en cuanto a amplio conocimiento mundial y capacidad de resolución de problemas de primer nivel, lo compensará con una latencia de interacción súper baja (especialmente a medida que madure el multimodal), acceso directo / privado a los datos y al estado, continuidad fuera de línea, soberanía ("no tus pesos, no tu cerebro"). es decir, muchas de las mismas razones por las que nos gustan, usamos y compramos computadoras personales en lugar de que los clientes ligeros accedan a una nube a través de un escritorio remoto o algo así.
Omar Sanseviero
Omar Sanseviero27 jun 2025
¡Estoy muy emocionada de anunciar que Gemma 3n está aquí! 🎉 🔊Comprensión multimodal (texto/audio/imagen/vídeo) 🤯Funciona con tan solo 2 GB de RAM 🏆Primer modelo por debajo de 10B con @lmarena_ai puntuación de 1300+ Ya disponible en @huggingface, @kaggle, llama.cpp y más
¿La gente *siente* cuánto trabajo queda por hacer?
1.03M