Puheesta puheeksi -mallit kuulostavat teoriassa hämmästyttäviltä... kunnes ne otetaan käyttöön yritysmittakaavassa. On helppo ymmärtää, miksi ihmiset ovat innoissaan. Ohittamalla erilliset puheesta tekstiksi ja tekstistä puheeksi -mallit S2S-mallit tarjoavat jännittäviä demoja, jotka vangitsevat sävyn, tunteet ja vivahteet minimaalisella viiveellä. S2S-mallit voivat olla uskomaton tekninen saavutus, mutta niitä on silti vaikea hallita tuotannossa ja vaikeampaa taata, että työnkulut suoritetaan tarkasti. Monet S2S-äänidemot optimoivat nopeuden ja luonnollisuuden, eivät oikeellisuuden tai turvallisuuden. Todellisissa käyttöönotoissa nämä kompromissit heikentävät luottamusta nopeasti. Ääniagenttiemme osalta olemme säilyttäneet jäsennellyn putken, mutta suunnitelleet sen uudelleen nopeutta varten. Teimme paljon malli- ja infrastruktuurioptimointeja tarjotaksemme nopeampaa ja luonnollisemmalta kuulostavaa puhetta. Tuloksena on 65 prosentin parannus nopeudessa säilyttäen samalla yritysten riippuvainen tarkastettavuus ja tarkkuus. Puheesta puheeksi pääsee lopulta perille. Mutta nykyään tarkkuus ja luotettavuus saavat äänitekoälyn toimimaan yritysmittakaavassa.