Mikä on puheen käsittely?

Puheprosessointi on prosessi, jolla puhesignaaleja tulkitaan, ymmärretään ja niihin sovelletaan. Se viittaa erityisesti ihmisen puheen käsittelyyn tietokonejärjestelmissä, kuten puheentunnistusohjelmistossa tai puhe-teksti-ohjelmissa. Puheprosessointi on tärkeää monille aloille sekä teoreettisessa että käytännöllisessä käytössä, aina puhelimen äänen aktivoinnista ja ohjauksesta toiminnallisen tekoälyn kehittämiseen tietotekniikassa. Johdonmukaisen puheen tulkinta ja tuottaminen ovat molemmat tärkeitä puheen käsittelyssä; Jotkut huolenaiheet suosivat kuitenkin toisiaan, koska puheenkäsittelyn sovellustarpeet ovat hyvin erilaisia.

Puheentunnistus on yksi puheenkäsittelyn tärkeimmistä näkökohdista, koska puheen käsittelyn yleisenä tavoitteena on ymmärtää puhuttu kieli ja toimia sen mukaan. Yksi yleisesti käytetty puheentunnistussovellus on yksinkertainen puheen muuntaminen tekstiksi, jota käytetään monissa tekstinkäsittelyohjelmissa. Monet sovellukset vaativat kuitenkin paljon suurempaa tarkkuutta kuin puhe-tekstimuunnosohjelmisto vaatii. Esimerkiksi puheentunnistuksen käyttäminen sotilaslentokoneissa vähentää suurta lentäjän vastuuta ja rasitusta. Tarkkuuden ja tarkkuuden saavuttamiseksi kaiuttimen on kalibroitava tunnistusohjelmisto omaan ääneen ja puhetyyliin.

Kaiuttimien tunnistus, toinen puheentunnistuksen osa, on toinen erittäin tärkeä puhekäsittelyn osa, vaikka sitä ei vielä käytetä niin laajalti kuin yleistä puheentunnistusta. Vaikka puheentunnistus viittaa nimenomaan sanojen ymmärtämiseen, puhujan tunnistus koskee vain sitä, kuka puhuu. Kaiuttimen henkilöllisyyden vahvistaminen voi olla tärkeä suojausominaisuus, joka estää tietokonejärjestelmän luvattoman käytön tai käytön.

Toinen puheenkäsittelyn komponentti on puheentunnistus, joka on olennaisesti yhdistelmä puheen ja kaiuttimen tunnistusta. Puheentunnistus tapahtuu, kun puheentunnistusohjelmat käsittelevät tunnetun puhujan puheen; tällaiset ohjelmat voivat yleensä tulkita tunnetun puhujan puheen paljon tarkemmin kuin satunnaispuhujan puhe.

Toinen puheen käsittelyn aihe on puheanalyysi. Puheanalyysi eroaa muista puheenkäsittelyn aiheista, koska se ei oikeastaan ​​koske puheen kielellistä sisältöä. Se koskee ensisijaisesti puhekuvioita ja ääniä. Äänianalyysiä voitaisiin käyttää diagnosoimaan äänihuulten tai muiden puheeseen liittyvien elinten ongelmat huomioimalla ääniä, jotka viittaavat sairauteen tai vaurioon. Ääntä ja stressiä voidaan käyttää myös sen määrittämiseen, puhuuko henkilö totuuden, vaikka tämä ääni -analyysin käyttö on erittäin kiistanalaista.