Decagon zdefiniował sukces przedsiębiorstw na wczesnym etapie. Perry Ha i jego zespół są niedocenianymi bohaterami tego ruchu.
Perry jest byłym założycielem, który zbudował ich strategię działania. Stworzył program Menedżera Produktu Agenta, a ci APM są odpowiedzialni za ogromny sukces, jaki odnoszą z klientami takimi jak Chime, Duolingo, Eventbrite i Samsara.
Uwielbiałem usiąść z nim, aby omówić początkową budowę, optymalną strukturę zespołu, jak zatrudniać na to stanowisko oraz co chciałby wiedzieć, gdy zaczynał.
Proszę, cieszcie się tą szczerym rozmową z moim dobrym przyjacielem Perry'm Ha!
@DecagonAI
Modele mowy na mowę brzmią niesamowicie w teorii… aż do momentu, gdy są wdrażane na skalę przedsiębiorstw.
Łatwo zrozumieć, dlaczego ludzie są podekscytowani. Pomijając oddzielne modele mowy na tekst i tekst na mowę, modele S2S dostarczają ekscytujące pokazy, które uchwycają ton, emocje i niuanse z minimalnym opóźnieniem.
Modele S2S mogą być niesamowitym osiągnięciem technicznym, ale wciąż są trudne do kontrolowania w produkcji i trudniejsze do zapewnienia, że przepływy pracy są realizowane precyzyjnie.
Wiele z demonstracji głosowych S2S optymalizuje szybkość i naturalność, a nie poprawność czy bezpieczeństwo. W rzeczywistych wdrożeniach te kompromisy szybko erodują zaufanie.
Dla naszych agentów głosowych zachowaliśmy ustrukturyzowany proces, ale przekształciliśmy go dla szybkości. Wprowadziliśmy wiele optymalizacji modeli i infrastruktury, aby dostarczyć szybszą, bardziej naturalnie brzmiącą mowę. Efektem jest 65% poprawa szybkości przy zachowaniu audytowalności i precyzji, na których polegają przedsiębiorstwa.
Mowa na mowę w końcu tam dotrze. Ale dzisiaj precyzja i niezawodność to to, co sprawia, że AI głosowe działa na skalę przedsiębiorstw.
Co to naprawdę oznacza, aby AI działało w przedsiębiorstwie?
Nasz współzałożyciel i dyrektor generalny @thejessezhang wystąpił na głównej scenie DevDay @OpenAI razem z @kimberlywtan i @vxanand, aby o tym porozmawiać.
Pełne nagranie poniżej. ↓