Generace více lidí inspirovaná Shrekem (s klonováním hlasu) - to je nyní možné s *jedním* modelem TTS!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav23. 7. 20:29
NOVINKA: Higgs Audio V2 z @boson_ai otevřený, sjednocený model TTS s klonováním hlasu, poráží GPT 4o mini tts a ElevenLabs v2 🔥 > Trénováno na 10M hodin (řeč, hudba, události) > Postaven na Llama 3.2 3B > pracuje v reálném čase a na hraně > Beats GPT-4o-mini-tts, ElevenLabs v2 v dialogu s více reproduktory a prosodií > Klonování hlasu bez výstřelu 🤩 > k dispozici na Hugging Face Sláva lidem z Boson AI za vydání tak brilantní práce a všech detailů kolem modelu! 🤗
13,65K