Mikä on raakatieto?

Raakatiedot, joita kutsutaan myös lähdetiedoiksi tai atomitiedoiksi, ovat tietoja, joita ei ole käsitelty näytettäväksi missään muodossa. Raaka muoto voi näyttää hyvin tunnistamattomalta ja olla lähes merkityksetön ilman käsittelyä, mutta se voi myös olla muodossa, jonka jotkut voivat tulkita tilanteen mukaan. Nämä tiedot voidaan käsitellä manuaalisesti tai koneella.

Joissakin tapauksissa raakatiedot voivat olla vain numeroita. Tapa, jolla nämä numerot sekvensoidaan, ja joskus jopa tapa, jolla ne on sijoitettu, voi olla erittäin tärkeä tieto. Tietokone voi tulkita nämä tiedot ja antaa lukeman, joka voi olla lukijalle järkevä.

Binaarikoodi on hyvä esimerkki raakatiedosta. Tulostettuna binäärikoodilla on vain vähän hyötyä tietokoneen käyttäjälle – ainakin valtaosalle käyttäjistä. Kun sitä käsitellään tietokoneen kautta, se tarjoaa toisaalta ymmärrettävämpää tietoa. Itse asiassa binaarikoodi on tyypillisesti lähdekoodi kaikelle, mitä tietokoneen käyttäjä näkee.

Joissakin tapauksissa tämäntyyppiset tiedot eivät ehkä koskaan näy lopullisessa muodossaan, etenkään tietojen syöttösovelluksissa työskentelevät. Näissä tilanteissa käyttäjä on vastuussa vain tietojen syöttämisestä, ja joskus tietojen syöttäjä ei välttämättä edes tiedä tarkasti, mitä hän on syöttänyt tai miksi. Tämä on erityisen hyödyllistä silloin, kun turvallisuus tai yksityisyys on tärkeää, koska se auttaa varmistamaan, ettei kukaan työntekijä lisää puolueellisia tai tahallisesti vääriä tietoja vahingoittaakseen tai hyödyntääkseen jotakuta.

Esimerkiksi joissakin lääketieteellisissä sovelluksissa potilaiden yksityisyyttä koskevat määräykset voivat olla erittäin tiukat, mutta tiedot on saatettava joutua syöttämään tietokantaan. Jotta mahdollisimman monet ihmiset eivät pystyisi tunnistamaan potilaita, jokaiselle voidaan antaa numero. Niiden olosuhteille voidaan myös antaa numero sekä hoitovaihtoehdot. Ilman tietoa siitä, mitä nämä numerot tarkoittavat, potilaan tai tilan tunnistaminen ei ole mahdollista. Nämä tunnistetiedot voivat olla vain kourallisen ihmisten saatavilla.

Tämä esimerkki on itse asiassa melko epätavallinen, koska tiedot muuttuvat harvoin raakamuotoisiksi. Sen sijaan raakatietoja käsitellään yleensä sen parantamiseksi. On kuitenkin monia erilaisia ​​sovelluksia, joissa käsittelemätöntä tietoa esiintyy, ja säännöt siitä, mitä tehdä, riippuvat tilanteesta.