Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando os melhores (e abertos) modelos de reconhecimento de fala do mundo!

Os modelos Voxtral 3B e Voxtral 24B vão além da transcrição com recursos que incluem:
· Contexto de formato longo: com um comprimento de contexto de token de 32k, o Voxtral lida com áudios de até 30 minutos para transcrição ou 40 minutos para compreensão
· Perguntas e respostas e resumo integrados: oferece suporte a fazer perguntas diretamente sobre o conteúdo de áudio ou gerar resumos estruturados, sem a necessidade de encadear modelos de ASR e linguagem separados
· Nativamente multilíngue: detecção automática de idioma e desempenho de última geração nos idiomas mais usados do mundo (inglês, espanhol, francês, português, hindi, alemão, holandês, italiano, para citar alguns), ajudando as equipes a atender públicos globais com um único sistema
· Chamada de função diretamente da voz: permite o acionamento direto de funções de back-end, fluxos de trabalho ou chamadas de API com base nas intenções faladas do usuário, transformando as interações de voz em comandos acionáveis do sistema sem etapas intermediárias de análise.
· Altamente capaz de texto: Mantém os recursos de compreensão de texto de seu backbone de modelo de linguagem, Mistral Small 3.1
486,95K
Melhores
Classificação
Favoritos