Mikä on likainen data?

Likaiset tiedot ovat termi, jota käytetään kuvaamaan kaikenlaisia ​​sähköisiä tietoja, jotka ovat vanhentuneita, puutteellisia tai muuten epätarkkoja. Tämäntyyppisiä tietoja voidaan luoda tietojen syöttämisvirheiden, tietojen säännöllisen päivittämisen epäonnistumisen tai jopa samojen tietojen syöttämisen vuoksi useammin kuin kerran. Toisinaan virheelliset tiedot ovat vain sähköisten asiakirjojen tekstissä olevia välimerkkejä. Muissa tapauksissa likaiset tiedot voivat olla tarkoituksellisesti harhaanjohtavia tietoja, kuten yritykset muuttaa kirjanpitoaineistoa esittääkseen sijoittajille ja muille tietyn kuvan.

Suurin osa likaisen tiedon kerääntymisestä kaiken tyyppisiin tietokantoihin on tahatonta. Yksilöt, jotka syöttävät uusia tietoja tietokantaan, voivat kirjoittaa sanoja väärin, jättää pois välimerkit, jotka ovat tärkeitä tekstin tarkoituksen ymmärtämiseksi, tai olla noudattamatta tiettyä muotoilustrategiaa. Tämän tyyppisissä tilanteissa virheellisten tietojen korjaaminen on suhteellisen yksinkertainen prosessi, joka ei vaadi muuta kuin väärän tekstin muuttamista ja muutosten tallentamista. Yritykset hallitsevat tätä prosessia joskus lukemalla tiedot sen jälkeen, kun ne on syötetty, ja tekemällä tarvittavat päivitykset.

Likaisia ​​tietoja voi esiintyä myös siksi, että olemassa olevia tietueita ei ole päivitetty tietojen muuttuessa. Jos esimerkiksi myyjät eivät päivitä asiakastiedostoja, kun tietyn asiakkaan kanssa tapahtuu muutoksia, tiedostot eivät ole enää tarkkoja ja niitä pidetään likaisina. Kuten oikeinkirjoitus- ja välimerkintöjen korjaamisessa, vanhentuneiden tietojen poistaminen ja korvaaminen nykyisillä tiedoilla auttaa parantamaan tietokannan yleistä käytettävyyttä.

On tilanteita, joissa likaisten tietojen luominen on tarkoituksellista. Yritykset voivat halutessaan jättää tietyt tiedot tietokannasta luodakseen erityisen käsityksen taloudesta, esimerkiksi korostaa tietyn ajanjakson aikana tuotettujen tulojen määrää, mutta eivät halua syöttää tietoja, jotka liittyvät samaan aikaan kerättyjen tulojen määrään ajanjaksolla. Tämän tyyppisissä likaisissa tiedoissa esitetyt tiedot ovat kaikilta osin tarkkoja, mutta niitä pidetään epätäydellisinä.

Joidenkin likaisten tietojen kohdalla päätös saattaa olla, että korjausten tekemiseen ei käytetä aikaa ja vaivaa. Tämä on yleistä, kun väärillä tiedoilla ei ole vaikutusta yrityksen kykyyn toimia oikein tai jos ne eivät aiheuta suurta ahdistusta. Tämä tarkoittaa sitä, että melkein missä tahansa entiteetissä, joka ylläpitää jonkin tyyppistä tietokantaa, on luultavasti ainakin vähän likaista dataa, johon on liitetty muita ajankohtaisia ​​ja tarkkoja tietoja.