FLUX.2 [klein] 9B tocmai a devenit de două ori mai rapid la editarea imaginilor, mai ales când folosești mai multe imagini de referință. Aceeași calitate, fără creștere de preț.
Sub capotă: KV-caching permite modelului să sară peste calcule redundante pe imaginile tale de referință. Cu cât folosești mai multe referințe, cu atât viteza este mai mare. Inferența este de până la 2x+ mai rapidă pentru editare multi-referință.
De asemenea, lansăm greutăți cuantificate FP8, construite cu @NVIDIA_AI_PC Rulează Klein 9B cu mai puțină VRAM și inferențe mai rapide pentru implementări locale și self-host.
285