Apresentando o Eleven v3 (alfa) - o modelo de conversão de texto em fala mais expressivo de todos os tempos. Suporta 70+ idiomas, diálogos com vários alto-falantes e tags de áudio como [animado], [suspira], [rindo] e [sussurros]. Agora em alfa público e com 80% de desconto em junho.
Esta é uma prévia da pesquisa. Requer engenharia mais rápida do que os modelos anteriores - mas as gerações são de tirar o fôlego. Continuaremos ajustando para melhorar a confiabilidade e o controle.
A nova arquitetura do Eleven v3 entende profundamente o texto - oferecendo uma expressividade muito maior. E agora você pode guiar gerações mais diretamente usando tags de áudio: - Emoções [triste] [zangado] [feliz] - Direção de entrega [sussurros] [gritos] - Reações não verbais [risos] [limpa a garganta] [suspira]
Gere diálogos com vários alto-falantes que soam como uma conversa real. O Eleven v3 lida com interrupções, mudanças de tom e dicas emocionais com base no contexto da conversação.
A API pública para Eleven v3 (alfa) estará disponível em breve. Para acesso antecipado, entre em contato com a equipe de vendas. Estamos trabalhando na versão em tempo real da v3. Para casos de uso em tempo real e conversacionais, recomendamos ficar com a v2.5 Turbo ou Flash por enquanto.
Criado para criadores e desenvolvedores que criam ferramentas de mídia. Se você estiver trabalhando em vídeos, audiolivros ou ferramentas de mídia, a v3 desbloqueia um novo nível de expressividade. Saiba como tirar o máximo proveito dele com nosso guia de prompts:
Eleven v3 (alfa) já está disponível: Está com 80% de desconto durante o mês de junho. Experimente - e compartilhe suas melhores gerações conosco.
1,41M