分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

Eleven v3 (alpha) のご紹介 - これまでで最も表現力豊かなテキスト読み上げモデルです。 70 +言語、マルチスピーカーの対話、および[興奮]、[ため息]、[笑い]、[ささやき]などのオーディオタグをサポートします。現在、パブリックアルファ版で、6月に80%オフです。

これは調査プレビューです。以前のモデルよりも迅速なエンジニアリングが必要ですが、世代は息を呑むほどです。信頼性と制御性を向上させるために、引き続き微調整を行っていきます。

Eleven v3の新しいアーキテクチャは、テキストを深く理解し、はるかに優れた表現力を提供します。そして今、オーディオタグを使用して、より直接的に世代を導くことができます。 - 感情[悲しい][怒っている][幸せに] - 配信方向[ささやき声][叫び声] - 非言語的な反応[笑]【咳払い】【ため息】

実際の会話のように聞こえるマルチスピーカーの会話を生成します。 Eleven v3は、会話の文脈に基づいて、中断、トーンの変化、感情的な合図を処理します。

公開 API for Eleven v3 (alpha) は近日公開予定です。早期アクセスをご希望の場合は、営業担当者にお問い合わせください。現在、v3のリアルタイム版に取り組んでいます。リアルタイムおよび会話型のユースケースでは、今のところ v2.5 Turbo または Flash を使用することをお勧めします。

メディアツールを構築するクリエイターや開発者向けに構築されています。ビデオ、オーディオブック、メディアツールに取り組んでいる場合、v3は新たなレベルの表現力を解き放ちます。それを最大限に活用する方法を、プロンプトガイドで学びましょう。

Eleven v3 (alpha) は現在利用可能です。 6月中は80%オフです。ぜひ試してみて、最高の世代を私たちと共有してください。

548

トップ

ランキング

お気に入り