Mikä on datamallinnus?

Datamallinnus on tapa rakentaa ja järjestää dataa, jotta tietokannat voivat käyttää sitä helposti. Strukturoimattomia tietoja löytyy tekstinkäsittelyasiakirjoista, sähköpostiviesteistä, ääni- tai videotiedostoista ja suunnitteluohjelmista. Datamallinnus ei halua näitä “rumia” tietoja; pikemminkin se haluaa tietoja, jotka kaikki koostuvat mukavasta, siististä paketista tietokannan käsiteltäväksi.

Datamallinnusta käytetään rutiininomaisesti yhdessä tietokannan hallintajärjestelmän kanssa. Tätä järjestelmää varten mallinnetut ja valmiit tiedot voidaan tunnistaa eri tavoin, esimerkiksi sen mukaan, mitä ne edustavat tai miten ne liittyvät muihin tietoihin. Ajatuksena on tehdä datasta mahdollisimman edustava, jotta analyysi ja integrointi voidaan tehdä mahdollisimman vähän vaivaa.

Voimme myös ajatella datamallinnusta ohjeena tietokannan rakentamiseen. Keskity sanamalliin, niin saat mitä etsimme täältä. Jos haluat luoda “kauniin” tietokannan, sinun on noudatettava mallia keinona kohti haluttua päämäärää.

Jos esimerkiksi haluat analysoida, kuinka monta ihmistä tietyssä kongressipiirissä äänesti viime vaaleissa, haluat luonnollisesti sisällyttää sarakkeen, jota puoluetta kukin henkilö äänesti. Tällainen analyysi on arvokas kaikkien poliittisten puolueiden jäsenille, ja se on sellainen yksityiskohta, jonka voit rakentaa tietokantaan alusta alkaen ja opastaa tietokannan hallintajärjestelmää sisällyttämään kyseisen sarakkeen tuloksena olevaan tietokantaan. Jos haluat analysoida kyseiset tiedot erityisesti, mutta et sisällyttänyt niitä saraketta tietokantaasi, käyttäisit paljon aikaa tietojen keräämiseen – vaivaa, joka ei olisi välttämätöntä, jos olisit ensin seurannut tietomallia. Datamallinnus on siksi erittäin tärkeä taito toteuttaa tietokantoja rakennettaessa.