GLiClass-V3: Семейство моделей только для кодирования, которые соответствуют или превосходят DeBERTa-v3-Large по точности в нулевом выстреле, при этом обеспечивая до 50× более быструю инференцию. Основной дизайн: - Инференция в один проход: Не требуется парное кодирование. Один прямой проход обрабатывает все метки. - Адаптеры LoRA: Тонкая настройка на логических задачах (например, Формальная логика, Commonsense QA) для символической обобщаемости без катастрофического забывания. - Готов к краю: gliclass-edge-v3.0 достигает 97 ex/s на A6000, идеально подходит для мобильных устройств и IoT. Варианты GLiClass-V3 (gliclass-*): (Построены на DeBERTa, ModernBERT и Ettin для развертывания на краю) - large-v3.0: 70.0% средний F1 (лучший) - base-v3.0: 65.6% - modern-large: 60.8% - edge-v3.0: 48.7% (самый быстрый, на основе Ettin) - x-base: 57% F1 (EN), 42% (многоязычный) для надежной многоязычной обобщаемости в нулевом выстреле. Бенчмарки (нулевой выстрел, без тонкой настройки): - CR, SST2, IMDb: ~0.93–0.94 F1 - Превосходит GLiClass-v2 и кросс-кодеры (например, DeBERTa-v3-Large, RoBERTa) - Масштабируется до 128+ меток с огромным ускорением (DeBERTa-Large: 0.25 ex/s против GLiClass: 82.6) Сценарии использования: - Многоуровневая классификация (например, тема, настроение, спам) - Повторная оценка RAG - Безопасный для конфиденциальности NLP на устройстве. Построен на DeBERTa и ModernBERT. Полностью с открытым исходным кодом. pip install gliclass
3,33K