DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Apresentando os melhores (e abertos) modelos de reconhecimento de fala do mundo!

Os modelos Voxtral 3B e Voxtral 24B vão além da transcrição com recursos que incluem: · Contexto de formato longo: com um comprimento de contexto de token de 32k, o Voxtral lida com áudios de até 30 minutos para transcrição ou 40 minutos para compreensão · Perguntas e respostas e resumo integrados: oferece suporte a fazer perguntas diretamente sobre o conteúdo de áudio ou gerar resumos estruturados, sem a necessidade de encadear modelos de ASR e linguagem separados · Nativamente multilíngue: detecção automática de idioma e desempenho de última geração nos idiomas mais usados do mundo (inglês, espanhol, francês, português, hindi, alemão, holandês, italiano, para citar alguns), ajudando as equipes a atender públicos globais com um único sistema · Chamada de função diretamente da voz: permite o acionamento direto de funções de back-end, fluxos de trabalho ou chamadas de API com base nas intenções faladas do usuário, transformando as interações de voz em comandos acionáveis do sistema sem etapas intermediárias de análise. · Altamente capaz de texto: Mantém os recursos de compreensão de texto de seu backbone de modelo de linguagem, Mistral Small 3.1

486,95K

Melhores

Classificação

Favoritos

Em alta on-chain

Em alta no X

Principais fundos da atualidade

Mais notável