受《史瑞克》啟發的多人物生成(帶有語音克隆) - 現在只需一個 TTS 模型就能實現!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav7月23日 20:29
全新:來自 @boson_ai 的 Higgs Audio V2 開放,統一的 TTS 模型,具備聲音克隆,超越 GPT 4o mini tts 和 ElevenLabs v2 🔥 > 訓練於 1000 萬小時(語音、音樂、事件) > 基於 Llama 3.2 3B 構建 > 實時運作並可在邊緣設備上使用 > 在韻律和情感的多說話者對話中超越 GPT-4o-mini-tts、ElevenLabs v2 > 零樣本聲音克隆 🤩 > 可在 Hugging Face 上獲得 感謝 Boson AI 的團隊釋出如此出色的作品及其模型的所有細節!🤗
13.76K