Inspiré par Shrek, génération multi-personnes (avec clonage vocal) - c'est maintenant possible avec un *seul* modèle TTS !
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 juil., 20:29
NOUVEAU : Higgs Audio V2 de @boson_ai, modèle TTS unifié et ouvert avec clonage vocal, surpasse GPT 4o mini tts et ElevenLabs v2 🔥 > Entraîné sur 10 millions d'heures (discours, musique, événements) > Basé sur Llama 3.2 3B > Fonctionne en temps réel et en périphérie > Surpasse GPT-4o-mini-tts, ElevenLabs v2 en prosodie et émotion dans le dialogue multi-locuteur > Clonage vocal zéro-shot 🤩 > Disponible sur Hugging Face Bravo aux équipes de Boson AI pour avoir publié un travail aussi brillant et tous les détails autour du modèle ! 🤗
13,74K