DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Vi presenterar världens bästa (och öppna) taligenkänningsmodeller!

Både Voxtral 3B- och Voxtral 24B-modellerna går längre än transkription med funktioner som inkluderar: · Långformskontext: med en kontextlängd på 32 kB token hanterar Voxtral ljud upp till 30 minuter för transkription eller 40 minuter för förståelse · Inbyggd Q&A och sammanfattning: Stöder att ställa frågor direkt om ljudinnehållet eller generera strukturerade sammanfattningar, utan att behöva kedja separata ASR- och språkmodeller · Modersmål flerspråkig: Automatisk språkidentifiering och toppmodern prestanda på världens mest använda språk (engelska, spanska, franska, portugisiska, hindi, tyska, nederländska, italienska, för att nämna några), vilket hjälper team att betjäna globala målgrupper med ett enda system · Funktionsanrop direkt från rösten: Möjliggör direkt utlösning av serverdelsfunktioner, arbetsflöden eller API-anrop baserat på talade användaravsikter, vilket omvandlar röstinteraktioner till användbara systemkommandon utan mellanliggande parsningssteg. · Mycket kapabel på text: Behåller textförståelsefunktionerna i sin språkmodells ryggrad, Mistral Small 3.1

486,94K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda