Mikä on kaavojen täsmäytys?

Kaavan sovitus on tekniikka, jota käytetään kahden tai useamman monimutkaisen tietokannan tai tietojoukon yhdistämiseen toisiinsa. Kun tietokantojen ja sähköisen tiedon tallennuksen käyttö kasvaa ja monimutkaistuu Internetin kautta, on määriteltävä menetelmät datasarjojen yhdistämiseksi yhdestä tietokannasta toiseen, ja kaavojen sovittaminen on yksi tällainen tekniikka. Konsepti on yksinkertainen, mutta tietojen yhdistämisen todellisuus on melko monimutkainen.

Termiä “kaavan sovitus” käytetään synonyyminä “skeemakartoitukseen”, koska käyttäjät todella kartoittavat tietoja eivätkä vastaa niitä. Kaksi tai useampia tietokantoja yhdistetään yhteen ja kunkin tietokannan samankaltaiset näkökohdat yhdistetään toisiinsa. Yleisin tapa yhdistää tiedot on käyttää tarkkoja viittauksia. Esimerkki tästä yhdistämistyylistä on yhden tietokannan nimisarakkeen yhdistäminen toisen tietokannan nimisarakkeen kanssa.

Yhdistäminen ei yleensä ole niin yksinkertaista ihmisille tai tietokoneille. Koska niin paljon tietoja on suodatettava, yhdistettävä ja käytettävä, yhden tietokannan käyttäminen useiden tietokantojen sijaan on välttämätöntä. Kaavan kartoitus keskittyy tekemään tästä tylsästä prosessista automatisoidun ja tehokkaamman. Esimerkki siitä, missä kaavojen sovittaminen on välttämätöntä, voi olla, kun yhdessä tietokannassa on “opiskelijan pääaine” -kenttä ja toisessa tietokannassa on “opiskelijan opintoalue” -kenttä. Se on sama tieto, mutta hieman erilaiset otsikot vaikeuttavat pyrkimyksiä yhdistää ne.

Kaavan sovitus katkaisee tämän monimutkaisen prosessin yhdistämällä tietokannat neljään vaiheeseen: esiasennus, vertailu, mukauttaminen ja yhdistäminen. Ennen kuin useita tietokantoja voidaan yhdistää, ne on analysoitava yhtäläisyyksien ja erojen varalta. Kaavojen täsmäytysalueella tätä kutsutaan esiliitokseksi. Tietokone alkaa määrittää tehokkaimman integrointimenetelmän.

Seuraavaksi tietokone arvioi kaavat vertaamalla niitä toisiinsa yksityiskohtaisemmin. Vertailuvaiheessa tietokone tutkii jokaisen tietokantamerkinnän ja määrittää, missä voi olla ristiriitoja. Esimerkki tästä on, kun “opiskelijan kiinnostuksen kohteet” -kentässä on luettelo “lääkäri” ja toisessa tietokannassa “lääkäri”. Henkilö todennäköisesti tunnistaisi tiedot samoiksi, mutta tietokantatyökalujen osalta he ovat kaksi erillistä kokonaisuutta.

Kun tietokone on määrittänyt kaikki mahdolliset ristiriidat, se voi siirtyä eteenpäin yrittäen ratkaista ongelmat. Tämä voi olla niin yksinkertaista kuin vaihtaa kaikki “lääkärin” tapaukset “lääkäriin”. Todellisuudessa prosessi on huomattavasti monimutkaisempi.
Kun kaikki ristiriidat on korjattu, tietokone voi jatkaa tietojen yhdistämistä kaavojen täsmäytysprosessissa. Tässä vaiheessa kaksi tai useampia tietokantoja yhdistetään yhdeksi suureksi tietokannaksi. Jos kaikki menee hyvin, ristiriitoja tai virheitä ei esiinny integroinnin ja tulevan tietokannan käytön aikana.