Mikä on puhesyntetisaattori?

Puhesyntetisaattori on laite, jota käytetään tekstin merkkien kääntämiseen ääniksi, jotka vastaavat ihmisen puheen ääntä. Yksittäisen laitteen kehittyneisyydestä riippuen tuotetut äänet voivat olla hieman tylsiä ja keinotekoisia tai kuulostaa hyvin samankaltaiselta kuin oikean henkilön ääni. Puhesynteesin käsite on ollut olemassa vuosisatojen ajan, mutta vasta viime vuosikymmeninä prosessi on tullut yleisön saataville.

On esimerkkejä yrityksistä tuottaa keinotekoisesti ihmisen puhekuvioita, jotka ulottuvat 11 -luvulle. Varhaisimmat yritykset käyttivät usein materiaaleja ihmisten ääninauhojen toistamiseksi ja erilaisten stimulaatioiden käyttämiseksi äänien tuottamiseksi. Ajan mittaan suunnittelut mahdollistivat äänien tuottamisen, jotka matkivat vokaalien ääntämistä. 18 -luvun loppupuolella muutamat mallit pystyivät myös tuottamaan ääniä, jotka muistuttivat läheisesti konsonantteja.

Todellinen edistys nykyaikaisen puhesyntetisaattorin kanssa alkoi 1930 -luvulla. Bell Laboratories tuotti syntetisaattorin, jota kutsuttiin vokooderiksi. Tiedot syötettiin näppäimistöllä, järjestelmä analysoi ja sopivat äänet muodostivat sanoja. Vaikka sanojen intonaatio ja taivutus olivat hieman alkeellisia, laite tuotti selvästi ymmärrettäviä sanoja. Tämän laitteen hienostunut versio, voder, esiteltiin yleisölle vuoden 1939 maailmannäyttelyssä.

1950 -luvulla visuaalisia kuvia ja syötettyä tekstiä käyttävän puhesyntetisaattorin työ tuotti osittain onnistuneita tuloksia. Samaan aikaan tekniikan kehitys alkoi parantaa äänenlaatua. Kun automaattinen puheviestintä yleistyi 1970 -luvulla, oli olemassa useita puhesyntetisaattoreita, jotka pystyivät tuottamaan ääniä, jotka olivat hyvin lähellä ihmisen puhekuvioita. Lyhyessä ajassa laitteita käytettiin sellaisten tuotteiden tuottamiseen, kuten valmiiksi tallennetut viestit vastaajaan ja lukutuotteet näkövammaisille.

Tietokoneen tulo avasi myös oven puhesyntetisaattorin lisäparannuksille. Sisällyttämällä laitteen kotitietokonejärjestelmään lukuvammaiset tai näkövammaiset voivat nauttia monista tietokoneohjelmista. Nykyään useimpien puhesyntetisaattorimallien äänenlaatu on kaukana 20 -luvun alussa luotujen laitteiden tuottamista robottiäänistä. Monet nykyiset versiot pystyvät tuottamaan äänikuvioita, jotka ovat lähes erottamattomia ihmisen puheesta.