Maak kennis met Eleven v3 (alpha) - het meest expressieve tekst-naar-spraakmodel ooit. Ondersteuning voor 70+ talen, dialogen met meerdere sprekers en audiotags zoals [opgewonden], [zucht], [lachen] en [fluisteren]. Nu in openbare alfa en 80% korting in juni.
Dit is een voorproefje van het onderzoek. Het vereist meer snelle engineering dan eerdere modellen, maar de generaties zijn adembenemend. We gaan door met finetunen om de betrouwbaarheid en controle te verbeteren.
De nieuwe architectuur van Eleven v3 begrijpt tekst tot in de puntjes en levert een veel grotere expressiviteit. En nu kunt u generaties directer begeleiden met behulp van audiotags: - Emoties [verdrietig] [boos] [gelukkig] - Afleverrichting [fluistert] [schreeuwt] - Non-verbale reacties [lacht] [schraapt keel] [zucht]
Genereer een dialoog met meerdere sprekers die klinkt als een echt gesprek. Eleven v3 gaat om met onderbrekingen, toonverschuivingen en emotionele signalen op basis van de gesprekscontext.
Openbare API voor Eleven v3 (alfa) is binnenkort beschikbaar. Neem voor vroege toegang contact op met de verkoopafdeling. We werken aan de real-time versie van v3. Voor real-time en conversationele gebruiksscenario's raden we aan om voorlopig bij v2.5 Turbo of Flash te blijven.
Gebouwd voor makers en ontwikkelaars die mediatools bouwen. Als je aan video's, audioboeken of mediatools werkt, ontgrendelt v3 een nieuw niveau van expressiviteit. Leer hoe u er het meeste uit kunt halen met onze promptgids:
Eleven v3 (alpha) is nu beschikbaar: Het is 80% korting in juni. Probeer het uit - en deel uw beste generaties met ons.
1,41M