新消息:来自 @boson_ai 的 Higgs Audio V2 开放,统一的 TTS 模型,具有语音克隆功能,超越了 GPT 4o mini tts 和 ElevenLabs v2 🔥 > 训练了 1000 万小时(语音、音乐、事件) > 基于 Llama 3.2 3B 构建 > 实时工作并在边缘计算上运行 > 在韵律和情感的多说话者对话中超越了 GPT-4o-mini-tts 和 ElevenLabs v2 > 零样本语音克隆 🤩 > 可在 Hugging Face 上获取 感谢 Boson AI 的团队发布如此出色的作品以及关于模型的所有细节!🤗
73.6K