Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vi presenterar världens bästa (och öppna) taligenkänningsmodeller!

Både Voxtral 3B- och Voxtral 24B-modellerna går längre än transkription med funktioner som inkluderar:
· Långformskontext: med en kontextlängd på 32 kB token hanterar Voxtral ljud upp till 30 minuter för transkription eller 40 minuter för förståelse
· Inbyggd Q&A och sammanfattning: Stöder att ställa frågor direkt om ljudinnehållet eller generera strukturerade sammanfattningar, utan att behöva kedja separata ASR- och språkmodeller
· Modersmål flerspråkig: Automatisk språkidentifiering och toppmodern prestanda på världens mest använda språk (engelska, spanska, franska, portugisiska, hindi, tyska, nederländska, italienska, för att nämna några), vilket hjälper team att betjäna globala målgrupper med ett enda system
· Funktionsanrop direkt från rösten: Möjliggör direkt utlösning av serverdelsfunktioner, arbetsflöden eller API-anrop baserat på talade användaravsikter, vilket omvandlar röstinteraktioner till användbara systemkommandon utan mellanliggande parsningssteg.
· Mycket kapabel på text: Behåller textförståelsefunktionerna i sin språkmodells ryggrad, Mistral Small 3.1
486,94K
Topp
Rankning
Favoriter