FLUX.2 [klein] 9B acaba de volverse 2x más rápido en la edición de imágenes, especialmente cuando usas múltiples imágenes de referencia. La misma calidad, sin aumento de precio.
Bajo el capó: el almacenamiento en caché KV permite que el modelo omita cálculos redundantes en tus imágenes de referencia. Cuantas más referencias utilices, mayor será la aceleración. La inferencia es hasta 2x más rápida para la edición con múltiples referencias.
También estamos lanzando pesos cuantizados FP8, construidos con @NVIDIA_AI_PC Ejecuta Klein 9B con menos VRAM y una inferencia más rápida para implementaciones locales y autoalojadas.
319