Mitä on tietojen redundanssi?

Tietojen redundanssi on tilanne, joka tapahtuu tietokantajärjestelmissä ja johon liittyy tahattomasti päällekkäisten tietojen luominen, jotka eivät ole välttämättömiä tietokannan toiminnalle. Vaikka irtisanominen on usein toivottava piirre joissakin tilanteissa, tämä ei pidä paikkaansa tietokannan toiminnassa. Monistettujen tietojen läsnäolo voi usein vaikuttaa haitallisesti järjestelmän toimintaan, minkä seurauksena tiedot palautuvat vastauksena järjestelmän kyselyihin, joista on vähemmän hyötyä. Yksi tiedonhallinnan keskeisistä tehtävistä on päällekkäisten tietojen tunnistaminen ja päällekkäisyyksien poistaminen.

Mahdollisuus tietojen redundanssiin löytyy lähes kaikentyyppisistä tietokantaohjelmista. Ohjelmat, joita pidetään tasaisina, kuten laskentataulukot ja jotka perustuvat tietojen manuaaliseen syöttämiseen, ovat erityisen alttiita päällekkäisille tiedoille, jotka voivat aiheuttaa komplikaatioita haluttujen tietojen hakemisessa. Suhdetyyppiset tietokannat, kuten myyntikontaktitietokannat, sisältävät usein prosesseja, jotka auttavat minimoimaan tahattoman päällekkäisyyden mahdollisuudet, kuten kahden eri yhteystiedoston luominen samaan yhteystietoon, joka liittyy samaan yritykseen. Vaikka järjestelmätarkastuksia käytettäisiin tietojen redundanssien vähentämiseksi, on edelleen olemassa ongelmia, joiden vuoksi on välttämätöntä osallistua säännöllisesti tietokannan tietojen puhdistamiseen.

Tietojen redundanssi tarkoittaa parhaimmillaan sitä, että tietokanta on täynnä tietoja, jotka eivät ole välttämättömiä, mutta jotka eivät ole todellista uhkaa kyvylle löytää tietoja silloin, kun niitä tarvitaan. Pahimmillaan päällekkäisten tietojen läsnäolo hidastaa tietokannan keskeisiä toimintoja ja voi vaikeuttaa tietokannan käyttöä tiettyjen tehtävien hallintaan. Jos esimerkiksi tarpeettomilla tiedoilla tukkeutuneen asiakastietokannan käyttäminen postitustarrojen luomiseen johtaisi useiden päällekkäisten tasojen luomiseen, jolloin on tarpeen joko lajitella ja hävittää kaksoiskappaleet ennen tarrojen käyttöä tai ottaa aika puhdistaa tietokanta ennen tarrojen luomista.

Onneksi tietojen redundanssin seuranta ja korjaaminen on jotain, mitä monet tiedonhallintajärjestelmät voivat tehdä suhteellisen helposti. Jotkut järjestelmät merkitsevät päällekkäisten tietojen syöttämisen, mikä helpottaa havaitun päällekkäisyyden tarkistamista ja päättää, poistetaanko tieto vai annetaanko se seistä. On jopa ohjelmistoja, joiden avulla voidaan skannata olemassa oleva tietokanta päällekkäisyyksien varalta ja poistaa tarpeettomat merkinnät automaattisesti suhteellisen helposti.