GLiClass-V3 : Une famille de modèles uniquement encodeurs qui égalent ou dépassent DeBERTa-v3-Large en précision zéro-shot, tout en offrant jusqu'à 50× d'inférence plus rapide. Conception de base : - Inférence en un seul passage : Pas besoin d'apairage cross-encoder. Un passage avant gère toutes les étiquettes. - Adaptateurs LoRA : Ajustés sur des tâches logiques (par exemple, Raisonnement Logique Formel, QA de Bon Sens) pour une généralisation symbolique sans oubli catastrophique. - Prêt pour l'edge : gliclass-edge-v3.0 atteint 97 ex/s sur A6000, idéal pour mobile et IoT. Variantes de GLiClass-V3 (gliclass-*): (Bâti sur DeBERTa, ModernBERT et Ettin pour le déploiement en edge) - large-v3.0 : 70,0 % de F1 moyen (meilleur) - base-v3.0 : 65,6 % - modern-large : 60,8 % - edge-v3.0 : 48,7 % (le plus rapide, basé sur Ettin) - x-base : 57 % F1 (EN), 42 % (multilingue) pour une généralisation robuste zéro-shot multilingue. Benchmarks (zéro-shot, sans ajustement) : - CR, SST2, IMDb : ~0,93–0,94 F1 - Surpasse GLiClass-v2 et les cross-encoders (par exemple, DeBERTa-v3-Large, RoBERTa) - Évolue jusqu'à 128+ étiquettes avec un gain de vitesse massif (DeBERTa-Large : 0,25 ex/s contre GLiClass : 82,6) Cas d'utilisation : - Classification multi-étiquettes (par exemple, sujet, sentiment, spam) - RAG reranking - NLP sur appareil sécurisé pour la vie privée. Construit sur DeBERTa et ModernBERT. Entièrement open-source. pip install gliclass
3,23K