Decagon has defined early stage enterprise success. Perry Ha and his team are the unsung heroes behind that motion.
Perry is a former founder who has built their forward deployed motion. He's created their Agent Product Manager program, and those APMs are responsible for the tremendous success they are having with customers like Chime, Duolingo, Eventbrite, and Samsara.
I loved sitting down with him to talk through the initial build, optimal team structure, how to hire for this role, and what he wishes he knew when he started out.
Please enjoy this candid conversation with my good friend Perry Ha!
@DecagonAI
Modele mowy na mowę brzmią niesamowicie w teorii… aż do momentu, gdy są wdrażane na skalę przedsiębiorstw.
Łatwo zrozumieć, dlaczego ludzie są podekscytowani. Pomijając oddzielne modele mowy na tekst i tekst na mowę, modele S2S dostarczają ekscytujące pokazy, które uchwycają ton, emocje i niuanse z minimalnym opóźnieniem.
Modele S2S mogą być niesamowitym osiągnięciem technicznym, ale wciąż są trudne do kontrolowania w produkcji i trudniejsze do zapewnienia, że przepływy pracy są realizowane precyzyjnie.
Wiele z demonstracji głosowych S2S optymalizuje szybkość i naturalność, a nie poprawność czy bezpieczeństwo. W rzeczywistych wdrożeniach te kompromisy szybko erodują zaufanie.
Dla naszych agentów głosowych zachowaliśmy ustrukturyzowany proces, ale przekształciliśmy go dla szybkości. Wprowadziliśmy wiele optymalizacji modeli i infrastruktury, aby dostarczyć szybszą, bardziej naturalnie brzmiącą mowę. Efektem jest 65% poprawa szybkości przy zachowaniu audytowalności i precyzji, na których polegają przedsiębiorstwa.
Mowa na mowę w końcu tam dotrze. Ale dzisiaj precyzja i niezawodność to to, co sprawia, że AI głosowe działa na skalę przedsiębiorstw.