Shrek-inspirert, generering av flere personer (med stemmekloning) - dette er mulig nå med en *enkelt* TTS-modell!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23. juli, 20:29
NYTT: Higgs Audio V2 fra @boson_ai åpen, enhetlig TTS-modell med stemmekloning, slår GPT 4o mini tts og ElevenLabs v2 🔥 > Trent på 10 millioner timer (tale, musikk, arrangementer) > Bygget på toppen av Llama 3.2 3B > Fungerer i sanntid og på kanten > Beats GPT-4o-mini-tts, ElevenLabs v2 i prosodi og følelser dialog med flere høyttalere > Zero-shot stemmekloning 🤩 > tilgjengelig på Hugging Face Kudos til folk hos Boson AI for å gi ut et så strålende verk og alle detaljene rundt modellen! 🤗
13,74K