Demo van Tether's QVAC die lokale inferentie uitvoert op een mobiel apparaat met ongelooflijke snelheid, via llama.cpp + LLAMA 3.2 1B parameters. QVAC is een gegeneraliseerde inferentie- en fine-tuning-runtime die zich kan aanpassen aan elk apparaat, van smartphones tot laptops en servers. Veel modellen worden al ondersteund. Meer komt eraan. Geen limieten. Oneindige intelligentie. Komt binnenkort.
38,18K