Prvou fázou procesu syntézy je zvukový záznam pacientovho hlasu pred operáciou, ktorý sa vykonáva v špecializovanom nahrávacom štúdiu. V súčasnosti je však testované aj nahrávanie v domácnostiach. Vybrané texty, ktoré sú nahrávané, sú dôkladne zostavované tak, aby bola efektívne zachytená široká škála špecifík hlasového prejavu daného pacienta.
Po nahraní pacientovho hlasu sa vykonáva kontrola nahovoreného textu a foneticko-prozodická analýza. Nahrávky sa spracúvajú, parametrizujú a segmentujú. Výsledkom je hlasový modul kompatibilný s týmito metódami rečovej syntézy:
- štatisticko-parametrická rečová syntéza (reč je generovaná na základe štatistických modelov; využitie Markovových modelov)
- jednotková selekcia (reč vzniká zreťazením starostlivo vybraných krátkych segmentov reálnej reči)
Laryngo Voice sa stále zdokonaľuje. Súčasné úsilie smerujeme k úplnej automatizácii systému, kde by v celom procese, od nahrávania až po tvorbu výsledného syntetického hlasu, nebola potrebná ľudská asistencia. Pacient by si tak sám vytvoril program, ktorý by čítal zadávaný text jeho syntetickým hlasom, a potom by si ho nainštaloval do vybraného zariadenia. Ak by Laryngo Voice dospel do tejto fázy, v porovnaní s konkurenciou by bol úplne unikátny svojou plnou automatizáciou aj rýchlosťou, s ktorou by bolo možné vytvoriť kvalitný syntetický hlasový systém a okamžite ho nainštalovať do bežne používaných prenosných prístrojov.
Ostatné známe projekty zaoberajúce sa tvorbou osobných syntetických rečových systémov sa väčšinou zameriavajú na štatisticko-parametrickú rečovú syntézu. Priemerný štatistický model vzniknutý pomocou veľkého množstva odlišných hlasov býva prispôsobený konkrétnemu používateľovi na základe jeho hlasových záznamov. Podobnosť výsledného výstupu s hlasom danej osoby však nebýva uspokojivá.
Cieľom do budúcna je aj prispôsobiť súčasné parametre Laryngo Voice pre hlasové modulátory a „rečové protézy“, ktoré budú súčasťou pacientovho tela.