熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
受《史瑞克》啟發的多人物生成(帶有語音克隆) - 現在只需一個 TTS 模型就能實現!

7月23日 20:29
全新:來自 @boson_ai 的 Higgs Audio V2 開放,統一的 TTS 模型,具備聲音克隆,超越 GPT 4o mini tts 和 ElevenLabs v2 🔥
> 訓練於 1000 萬小時(語音、音樂、事件)
> 基於 Llama 3.2 3B 構建
> 實時運作並可在邊緣設備上使用
> 在韻律和情感的多說話者對話中超越 GPT-4o-mini-tts、ElevenLabs v2
> 零樣本聲音克隆 🤩
> 可在 Hugging Face 上獲得
感謝 Boson AI 的團隊釋出如此出色的作品及其模型的所有細節!🤗
13.76K
熱門
排行
收藏