Decagon has defined early stage enterprise success. Perry Ha and his team are the unsung heroes behind that motion.
Perry is a former founder who has built their forward deployed motion. He's created their Agent Product Manager program, and those APMs are responsible for the tremendous success they are having with customers like Chime, Duolingo, Eventbrite, and Samsara.
I loved sitting down with him to talk through the initial build, optimal team structure, how to hire for this role, and what he wishes he knew when he started out.
Please enjoy this candid conversation with my good friend Perry Ha!
@DecagonAI
Modelos de fala para fala parecem incríveis em teoria ... até que sejam implantados em escala empresarial.
É fácil ver por que as pessoas estão animadas. Ao ignorar os modelos separados de fala para texto e texto para fala, os modelos S2S oferecem demonstrações empolgantes que capturam tom, emoção e nuances com latência mínima.
Os modelos S2S podem ser uma conquista técnica incrível, mas ainda são difíceis de controlar na produção e mais difíceis de garantir que os fluxos de trabalho sejam executados com precisão.
Muitas das demonstrações de voz do S2S otimizam a velocidade e a naturalidade, não a correção ou a segurança. Em implantações do mundo real, essas compensações corroem a confiança rapidamente.
Para nossos agentes de voz, mantivemos o pipeline estruturado, mas o reprojetamos para velocidade. Fizemos uma tonelada de otimizações de modelo e infraestrutura para fornecer uma fala mais rápida e com som mais natural. O resultado é uma melhoria de 65% na velocidade, mantendo a auditabilidade e a precisão das quais as empresas dependem.
Fala a fala chegará lá eventualmente. Mas hoje, precisão e confiabilidade são o que fazem a IA de voz funcionar em escala empresarial.