Представляем Eleven v3 (альфа) - самую выразительную модель текстового синтеза речи на сегодняшний день. Поддерживает более 70 языков, многоголосый диалог и аудиометки, такие как [восторг], [вздыхает], [смеется] и [шепчет]. Сейчас в публичной альфа-версии и со скидкой 80% в июне.
Это предварительный обзор исследования. Он требует больше настройки подсказок, чем предыдущие модели, но результаты впечатляют. Мы продолжим донастройку, чтобы улучшить надежность и контроль.
Новая архитектура Eleven v3 глубоко понимает текст - обеспечивая гораздо большую выразительность. А теперь вы можете более напрямую управлять генерациями, используя аудиометки: - Эмоции [грустно] [сердито] [счастливо] - Направление доставки [шепчет] [кричит] - Невербальные реакции [смеется] [кашляет] [вздыхает]
Создайте диалог с несколькими участниками, который звучит как настоящий разговор. Eleven v3 обрабатывает прерывания, изменения тона и эмоциональные сигналы в зависимости от контекста разговора.
Публичный API для Eleven v3 (альфа) скоро будет доступен. Для раннего доступа, пожалуйста, свяжитесь с отделом продаж. Мы работаем над версией v3 в реальном времени. Для использования в реальном времени и в разговорных сценариях мы рекомендуем пока оставаться на v2.5 Turbo или Flash.
Создано для создателей и разработчиков, создающих медиаинструменты. Если вы работаете с видео, аудиокнигами или медиаинструментами - v3 открывает новый уровень выразительности. Узнайте, как максимально использовать его с нашим руководством по подсказкам:
Eleven v3 (alpha) теперь доступен: Скидка 80% в течение июня. Попробуйте - и поделитесь с нами своими лучшими генерациями.
1,41M