Decagon has defined early stage enterprise success. Perry Ha and his team are the unsung heroes behind that motion.
Perry is a former founder who has built their forward deployed motion. He's created their Agent Product Manager program, and those APMs are responsible for the tremendous success they are having with customers like Chime, Duolingo, Eventbrite, and Samsara.
I loved sitting down with him to talk through the initial build, optimal team structure, how to hire for this role, and what he wishes he knew when he started out.
Please enjoy this candid conversation with my good friend Perry Ha!
@DecagonAI
Les modèles de parole à parole semblent incroyables en théorie… jusqu'à ce qu'ils soient déployés à l'échelle des entreprises.
Il est facile de comprendre pourquoi les gens sont enthousiastes. En évitant les modèles séparés de conversion de la parole en texte et de conversion du texte en parole, les modèles S2S offrent des démonstrations passionnantes qui capturent le ton, l'émotion et les nuances avec une latence minimale.
Les modèles S2S peuvent être une réalisation technique incroyable, mais ils restent difficiles à contrôler en production et il est plus difficile de garantir que les flux de travail sont exécutés avec précision.
Beaucoup des démonstrations vocales S2S sont optimisées pour la vitesse et le naturel, pas pour la justesse ou la sécurité. Dans les déploiements réels, ces compromis érodent rapidement la confiance.
Pour nos agents vocaux, nous avons conservé le pipeline structuré mais l'avons ré-ingénierie pour la vitesse. Nous avons effectué de nombreuses optimisations de modèle et d'infrastructure pour offrir une parole plus rapide et plus naturelle. Le résultat est une amélioration de 65 % de la vitesse tout en maintenant l'auditabilité et la précision dont les entreprises dépendent.
La parole à parole y parviendra finalement. Mais aujourd'hui, la précision et la fiabilité sont ce qui rend l'IA vocale efficace à l'échelle des entreprises.