Mitä Audio Mining on?

Äänikaivostoimintaa käytetään yleensä puheentunnistusohjelmistossa ja musiikin analysoinnissa. Tämä tekniikka antaa käyttäjälle mahdollisuuden etsiä puhe- tai musiikkiäänestä, joka on analysoitu tiettyjen ominaisuuksien perusteella. Kun puheentunnistustekniikassa sitä käytetään, äänen louhinta tunnistaa äänessä olevat sanat ja sijoittaa ne haettavissa olevaan tiedostoon. Tämä ominaisuus voi olla hyödyllinen opiskelijoille tai yrityksille, jotka osallistuvat moniin kokouksiin, koska sen avulla käyttäjä voi helpommin selata ajankohtaisia ​​tietoja puheesityksistä. Tämän tyyppistä analyysiä voidaan käyttää myös musiikissa määrittämään ominaisuuksia, kuten lyöntiä minuutissa (BPM), musiikillinen avain ja musiikkirakenne, musiikin luokittelussa käytettävät tiedot.

Puheentunnistuksessa, jossa tekniikkaa käytetään useimmiten, äänen louhinta käytetään akustisen mallin luomiseen. Akustinen malli ohjelmoi puheentunnistusohjelmiston tunnistamaan puhekuviot sanoina. Tämä tekniikka on kehitetty äänen louhinnalla puhutun lauseen tallenteesta, jota verrataan puhetta vastaavaan tekstiin. Tietokone tunnistaa tiedot sanojen tunnistamiseksi, kun käyttäjä antaa samanlaisia ​​ääniä kuin akustisessa mallissa. Akustista mallia käytetään yhdessä tiedoston kanssa, joka kertoo puheentunnistusohjelmalle, mitä kieltä tulkita ja mitä sanamalleja todennäköisesti puhutaan tietyissä lauseissa ja tilanteissa.

Sekä muusikot että musiikin kuuntelijat voivat hyötyä äänen louhimisesta musiikissa. Joskus musiikkiohjelmistot, jotka luokittelevat musiikin tyylilajin mukaan, käyttävät musiikin järjestämiseen äänikaivostoimintaa. Prosessi tunnistaa ja ryhmittelee musiikkitiedostot, joilla on samankaltaisia ​​äänilajeja, joita esiintyy usein musiikkilajeissa. Vaikka tämä tekniikka voi helpottaa musiikin järjestämistä ja uuden musiikin löytämistä, se voi tehdä virheitä luokitellessaan kappaleita, joilla on samanlaiset mittausominaisuudet mutta erilainen kokonaisääni. Äänen analysointiohjelmisto voi olla hyödyllinen muusikoille, erityisesti säveltäjille, koska sen avulla säveltäjä voi siirtyä tiettyihin kappalerakenteen osiin, mukaan lukien musiikilliset avainmuutokset ja sanat sanoissa.

Puheentunnistusohjelmistojen valmistaja Dragon® myy AudioMining® -nimisen ohjelman, joka transkriboi äänitiedostot ja merkitsee tiedostot, jotta niistä voidaan etsiä tekstiä. Dragon on tietokone -lingvistiikkaohjelmien valmistaja, tekninen termi puheen tulkintaan tarkoitettujen ohjelmistojen alalla. Äänikaivostoiminta, kun sitä käytetään kahdena sanana, on yleinen termi, joka viittaa äänitiedoston analysointiin määritettyjen ääniominaisuuksien perusteella. Muita audiokaivosohjelmistojen valmistajia ovat Nuance® ja Nexidia®.