Eleven v3 (alpha) のご紹介 - これまでで最も表現力豊かなテキスト読み上げモデルです。 70 +言語、マルチスピーカーの対話、および[興奮]、[ため息]、[笑い]、[ささやき]などのオーディオタグをサポートします。 現在、パブリックアルファ版で、6月に80%オフです。
これは調査プレビューです。以前のモデルよりも迅速なエンジニアリングが必要ですが、世代は息を呑むほどです。 信頼性と制御性を向上させるために、引き続き微調整を行っていきます。
Eleven v3の新しいアーキテクチャは、テキストを深く理解し、はるかに優れた表現力を提供します。 そして今、オーディオタグを使用して、より直接的に世代を導くことができます。 - 感情[悲しい][怒っている][幸せに] - 配信方向[ささやき声][叫び声] - 非言語的な反応[笑]【咳払い】【ため息】
実際の会話のように聞こえるマルチスピーカーの会話を生成します。 Eleven v3は、会話の文脈に基づいて、中断、トーンの変化、感情的な合図を処理します。
公開 API for Eleven v3 (alpha) は近日公開予定です。早期アクセスをご希望の場合は、営業担当者にお問い合わせください。 現在、v3のリアルタイム版に取り組んでいます。リアルタイムおよび会話型のユースケースでは、今のところ v2.5 Turbo または Flash を使用することをお勧めします。
メディアツールを構築するクリエイターや開発者向けに構築されています。 ビデオ、オーディオブック、メディアツールに取り組んでいる場合、v3は新たなレベルの表現力を解き放ちます。それを最大限に活用する方法を、プロンプトガイドで学びましょう。
Eleven v3 (alpha) は現在入手可能です。 6月中は80%オフです。 ぜひお試しいただき、あなたの最高の世代を私たちと共有してください。
1.41M