A Decagon definiu o sucesso de empresas em estágio inicial. Perry Ha e sua equipe são os heróis não reconhecidos por trás desse movimento.
Perry é um ex-fundador que construiu seu movimento de implantação avançada. Ele criou o programa de Gerente de Produto de Agente, e esses APMs são responsáveis pelo tremendo sucesso que estão tendo com clientes como Chime, Duolingo, Eventbrite e Samsara.
Adorei sentar-me com ele para discutir a construção inicial, a estrutura ideal da equipe, como contratar para esse papel e o que ele gostaria de ter sabido quando começou.
Por favor, desfrute desta conversa franca com meu bom amigo Perry Ha!
@DecagonAI
Os modelos de fala-para-fala parecem incríveis em teoria… até serem implementados em escala empresarial.
É fácil ver por que as pessoas estão entusiasmadas. Ao pular os modelos separados de fala-para-texto e texto-para-fala, os modelos S2S oferecem demonstrações empolgantes que capturam tom, emoção e nuances com uma latência mínima.
Os modelos S2S podem ser uma conquista técnica incrível, mas ainda são difíceis de controlar em produção e mais difíceis de garantir que os fluxos de trabalho sejam executados com precisão.
Muitas das demonstrações de voz S2S otimizam para velocidade e naturalidade, não para correção ou segurança. Em implementações do mundo real, essas compensações erodem a confiança rapidamente.
Para nossos agentes de voz, mantivemos o pipeline estruturado, mas o reengenheiramos para velocidade. Fizemos uma tonelada de otimizações de modelo e infraestrutura para oferecer uma fala mais rápida e com som mais natural. O resultado é uma melhoria de 65% na velocidade, mantendo a auditabilidade e a precisão das quais as empresas dependem.
A fala-para-fala chegará lá eventualmente. Mas hoje, precisão e confiabilidade são o que fazem a IA de voz funcionar em escala empresarial.