Ispirato a Shrek, generazione multi-persona (con clonazione vocale) - questo è possibile ora con un *unico* modello TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23 lug, 20:29
NUOVO: Higgs Audio V2 di @boson_ai modello TTS aperto e unificato con clonazione vocale, supera GPT 4o mini tts e ElevenLabs v2 🔥 > Addestrato su 10 milioni di ore (voce, musica, eventi) > Basato su Llama 3.2 3B > Funziona in tempo reale e su edge > Supera GPT-4o-mini-tts, ElevenLabs v2 in prosodia ed emozione dialogo multi-parlante > Clonazione vocale zero-shot 🤩 > Disponibile su Hugging Face Complimenti ai ragazzi di Boson AI per aver rilasciato un lavoro così brillante e tutti i dettagli sul modello! 🤗
13,73K