Mikä on kontrolloitu sanasto?

Hallittu sanasto on tietotekniikan ja tietokoneohjelmoinnin käsite, joka sisältää vain ennalta sovittujen tai hyväksyttyjen termien käyttämisen relaatiotietokantojen, haettavissa olevien metatietojen tai muiden järjestelmien rakentamisessa, joissa ihmisen luettavissa olevia sanoja käytetään merkitsemään tiedot myöhempää hakua varten. Menetelmä kontrolloidun sanaston käyttämiseksi tietojen luokittelemisessa on suoraan ristiriidassa luonnollisen kielen sanaston käsitteen kanssa, jossa ei ole sovittuja termejä ja kaikki käytetyt sanat on sen sijaan yhdistetty painotetuilla suhteilla. Hallitun sanaston ylätason sanojen lisäksi voidaan käyttää tukisanoja, joten synonyymit tai muut termit, jotka liittyvät vahvasti ylätason termiin, voivat käynnistää ylätason sanan käytön. Suurimmat erot, joita mitataan luonnollisen kielen järjestelmien ja ohjattujen sanastojärjestelmien välillä, ovat sanoja käyttävän kyselyn tulosten asianmukaisuus, palautetun tiedon määrä ja järjestelmän yleinen käytettävyys.

On monia tapauksia, joissa sanojen tai termien kokoelmaa käytetään mielivaltaisten, jatkuvasti muuttuvien tai järjestäytymättömien tietojen saattamiseksi käyttäjien saataville. Hakutermit Internet -hakukoneessa, yritystietokannassa ja jopa digitaalisessa tutkimuskirjastossa ovat kaikki esimerkkejä sovelluksista, joiden kautta tiedot voidaan luokitella metatietoluokilla tiukan hierarkkisen rakenteen sijaan. Sanat, joita käytetään kuvaamaan objektia tällaisissa tilanteissa, muodostavat eräänlaisen haettavissa olevan indeksin suuremmasta tietopankista.

Yksi esimerkki hallitun sanaston käytöstä voidaan nähdä, kun harkitaan yrityksen arkistointijärjestelmää. Tiedostot on luokiteltava tavalla, jotta ne ovat helposti ja ennakoitavasti haettavissa. Jos yksi tiedosto koskee autoja, se voidaan jättää luokkaan “autot”. Jos toisella henkilöllä on myös tiedosto, joka käsittelee autoja ilman hallittua sanastoa, tiedosto voidaan sijoittaa otsikkoon “autot”, mikä tekee näiden kahden tiedoston löytämisen yhdellä haulla vaikeaa. Kun luokkia valvotaan, kaikki autoja koskevat tiedostot sijoitetaan samaan sovittuun otsikkoon.

Hallitun sanaston käytön etuna on, että tiedot kuvataan tiukasti ennustettavalla tavalla. Tämä tarkoittaa, että jokainen, joka on tietoinen sanastosta, pystyy etsimään tietoa tehokkaasti ja tarkasti. Sanaston monimutkaisuus on kuitenkin se, että hakusanoja on vaikeampi, ellei mahdotonta luoda automaattisesti, ja ne vaativat yleensä jonkin verran ihmisen väliintuloa, minkä vuoksi nykyisten tietokantojen muuttaminen hallitun sanaston käyttämiseksi on suuri tehtävä. Jos sanasto ei ole riittävän suuri, on myös mahdollista, että yksittäinen kysely tuo esiin niin suuren määrän tietoa, että lajittelu tulee epäkäytännölliseksi ilman toista kyselymenetelmää.