حددت Decagon نجاح المؤسسة في المراحل المبكرة. بيري ها وفريقه هم الأبطال المجهولون وراء هذه الحركة.
بيري هو مؤسس سابق قام ببناء حركته المنتشرة إلى الأمام. لقد أنشأ برنامج مدير منتج الوكيل الخاص بهم ، وهذه APMs مسؤولة عن النجاح الهائل الذي يحققونه مع عملاء مثل Chime و Duolingo و Eventbrite و Samsara.
أحببت الجلوس معه للتحدث عن البناء الأولي ، وهيكل الفريق الأمثل ، وكيفية التوظيف لهذا الدور ، وما يتمنى أن يعرفه عندما بدأ.
يرجى الاستمتاع بهذه المحادثة الصريحة مع صديقي العزيز بيري ها!
@DecagonAI
تبدو نماذج تحويل الكلام إلى كلام مذهلة من الناحية النظرية ... حتى يتم نشرها على نطاق المؤسسة.
من السهل معرفة سبب حماس الناس. من خلال تخطي نماذج تحويل الكلام إلى نص والنص إلى كلام المنفصلة ، تقدم طرازات S2S عروضا توضيحية مثيرة تلتقط النغمة والعاطفة والفروق الدقيقة بأقل زمن انتقال.
قد تكون طرازات S2S إنجازا تقنيا لا يصدق ، ولكن لا يزال من الصعب التحكم فيها في الإنتاج ويصعب ضمان تنفيذ مهام سير العمل بدقة.
تعمل العديد من العروض التوضيحية الصوتية S2S على تحسين السرعة والطبيعة، وليس من أجل الصحة أو السلامة. في عمليات النشر في العالم الحقيقي ، تؤدي هذه المقايضات إلى تآكل الثقة بسرعة.
بالنسبة لوكلاء الصوت لدينا ، احتفظنا بخط الأنابيب المنظم ولكننا أعدنا هندستها من أجل السرعة. لقد أجرينا الكثير من تحسينات النماذج والبنية التحتية لتقديم خطاب أسرع وأكثر طبيعية. والنتيجة هي تحسن بنسبة 65٪ في السرعة مع الحفاظ على قابلية التدقيق والدقة التي تعتمد عليها المؤسسات.
سيصل تحويل الكلام إلى كلام إلى هناك في النهاية. ولكن اليوم ، الدقة والموثوقية هما ما يجعل الذكاء الاصطناعي الصوتي يعمل على نطاق المؤسسة.
ما الذي يتطلبه الأمر حقا لجعل الذكاء الاصطناعي يعمل في المؤسسة؟
تولى المؤسس المشارك والرئيس التنفيذي لدينا @thejessezhang المسرح الرئيسي ل @OpenAI DevDay مع @kimberlywtan و @vxanand للمناقشة.
التسجيل الكامل أدناه. ↓