Puhesynteesi on prosessi, jossa sanallinen viestintä toistetaan keinotekoisen laitteen avulla. Tietokone, joka muuntaa tekstin puheeksi, on eräänlainen puhesyntetisaattori.
Varhaisimmat puhesynteesin muodot toteutettiin koneilla, jotka on suunniteltu toimimaan kuten ihmisen äänikanava. Esimerkkinä on Wolfgang von Kempelenin 1700-luvulla luoma puhekone. Tällä laitteella tuotettiin puhetta keittiön palkeen, säkkipillikiekon ja klarinettikellon kautta. Keittiöpalje suunniteltiin toimimaan keuhkon tavoin, kun taas äänihuuli (äänihuulten alue) edusti säkkipilliruo’on kautta. Klarinettikello toimi suussa.
Laitteen käyttö oli täysin manuaalista. Oikea käsi ohjasi sarjaa vipuja, kun taas vasen käsi käsitteli klarinettikelloa (suuta). Oli myös mahdollisuus sulkea “sieraimet”, jotta nenäääni kuuluisi vähemmän. Joka tapauksessa, niin kauan kuin perushallintalaitteita käytettiin oikein, kone sai ilmavirtaa. Tämä ilmavirta määritti syntyvien äänien tyypit.
Myöhemmät puhekoneet 18- ja 19-luvuilla säilyttivät tämän kokoonpanon, vaikka parannuksiakin tehtiin. Esimerkiksi 1800-luvun lopulla Joseph Faber loi puhekoneen, joka pystyi vastaanottamaan syötteitä näppäimistön ja polkimen kautta. Kone oli myös erittäin luova, sillä ääni tuli ulos keinotekoisten “kasvojen” kautta.
Kun 20-luku tuli, elektroniikan innovaatiot mahdollistivat puhesynteesin ottamaan entistä tehokkaamman suunnan. Vaikka lähtökohta ihmisen äänikanavan jäljittelylle oli edelleen sama, 20-luvun alun puhekoneet pystyivät tuottamaan parempia ääniä, koska syöttö oli tarkempaa.
Kuitenkin vasta tietokoneiden tultua puhesynteesiä voitiin todella käyttää viihdeareenan ulkopuolella. Tämä johtuu pääasiassa siitä, että puhesyntetisaattorit voidaan tallentaa ohjelmistoon erillisen koneen sijaan. Lisäksi tietokoneita käytettäessä puhesynteesi voisi saada toisenlaisen muodon; käyttämällä ihmisääniä äänen päälähteenä.
Tämä puhesynteesin muoto tunnetaan konkatenatiivisena. Prosessi toimii yhdistämällä erilaisia ihmisen puheen tallenteita. Tuloksena oleva ääni on paljon luonnollisempi ja miellyttävämpi korvalle. Tämä on toisin kuin ohjelmat, jotka käyttävät artikulaatiosynteesiä, joissa puhetta kopioidaan äänikanavan tietokoneistetun mallin avulla.
Kaupalliset puhesyntetisaattorit voivat käyttää joko konkatenatiivisia tai artikulaatiomenetelmiä, mutta molemmat pystyvät saavuttamaan saman tavoitteen; mahdollisuus antaa ihmisille mahdollisuus kuulla tekstiä. Tämä on erityisen hyödyllistä tilanteissa, joissa lukeminen on häiritsevää tai mahdotonta.
Liike-elämässä tällaiset tilanteet ovat hyvin yleisiä, etenkin puhelinasioissa. Ilman tekstistä puheeksi (TTS) vaihtoehtoja yritysten omistajat joutuisivat käyttämään rahaa palkkaamaan entistä enemmän asiakaspalveluhenkilöstöä. Syntetisoidut ratkaisut välttävät tämän ongelman, koska kaikki tehdään tietokoneella; ei ihminen.
Syntetisoidulla puheella on myös rooli jokapäiväisessä elämässä, erityisesti vammaisten henkilöiden kohdalla. Puhuvat kellot, sanakirjat ja muut laitteet voivat helpottaa ihmisten asioita, joilla on vaikeuksia nähdä tai lukea. Syntetisoitu puhe pystyy jopa antamaan äänen henkilöille, jotka eivät osaa puhua ollenkaan. Steven Hawking, kuuluisa fyysikko, on näkyvä esimerkki. Koska Lou Gehrigin tauti on tehnyt hänestä mykistyksen, Hawking käyttää puhesyntetisaattoria kommunikoidakseen ihmisten kanssa.
Saatavilla on myös TTS-sovelluksia, jotka auttavat ihmisiä erilaisissa tietokonetoiminnoissa. Tällaisten sovellusten hankkimiseksi useimpien käyttäjien on ostettava erillinen ohjelmisto tai ladattava korjaustiedostoja. Jälkimmäinen vaihtoehto on yleensä ilmainen, riippuen käytetystä käyttöjärjestelmästä tai tekstinkäsittelyohjelmasta. Jos henkilö kuitenkin päättää ostaa erillisen ohjelmiston, hänellä voi olla pääsy laadukkaampaan järjestelmään. Tarkkoja esimerkkejä voi nähdä Natural Reader 7:n ja Text Aloud 2:n kautta.
Viime kädessä puhesynteesi on tekniikkaa, joka on mullistanut ihmiskunnan kommunikoinnin. Tietyssä mielessä se antaa tekstille oman elämän. Se myös antaa maailmalle mahdollisuuden kuulla loistavien yksilöiden ajatuksia, jotka normaalisti olisivat olleet äänettömiä.