Mitä eroa on tiedon louhinnalla ja tietojen varastoinnilla?

Sekä liike- että tekninen henkilöstö sekoittavat termit tiedonlouhinta ja -varastointi usein. Koko tiedonhallinnan ala on kasvanut ilmiömäisesti tiedonkeruuohjelmistojen käyttöönoton ja tietokoneen muistikustannusten laskun myötä. Molempien näiden toimintojen ensisijainen tarkoitus on tarjota työkaluja ja menetelmiä suuren tietomäärän mallien ja merkityksen tutkimiseksi.

Ensisijaiset erot tiedon louhinnan ja varastoinnin välillä ovat järjestelmärakenteet, käytetyt menetelmät ja tarkoitus. Tietojen louhinta on mallintunnistuslogiikan käyttämistä identiteettitrendeihin otantatietojoukossa ja ekstrapoloi nämä tiedot suurempaan tietovarastoon. Tietovarastointi on prosessi tietojen keräämiseksi ja tallentamiseksi raportoinnin helpottamiseksi.

Tietojen louhinta on yleinen termi, jota käytetään kuvaamaan erilaisia ​​liiketoimintaprosesseja, jotka johtavat malleja datasta. Tyypillisesti tilastollisen analyysin ohjelmistopakettia käytetään tiettyjen mallien tunnistamiseen loppukäyttäjän tuottaman tietojoukon ja kyselyjen perusteella. Tyypillinen tiedonlouhinnan käyttö on kohdennettujen markkinointiohjelmien luominen, rahoituspetosten tunnistaminen ja epätavallisten käyttäytymismallien merkitseminen osana turvatarkastusta.

Erinomainen esimerkki tiedonlouhinnasta on prosessi, jota puhelinyritykset käyttävät markkinoidakseen tuotteita nykyisille asiakkailleen. Puhelinyhtiö käyttää tiedonlouhintaohjelmistoa päästäkseen tietokantaansa asiakastiedoista. Kysely kirjoitetaan tunnistamaan asiakkaat, jotka ovat tilanneet puhelimen peruspaketin ja Internet -palvelun tietyn ajanjakson aikana. Kun tämä tietojoukko on valittu, kirjoitetaan toinen kysely sen määrittämiseksi, kuinka moni näistä asiakkaista käytti ilmaisia ​​puhelimen lisäominaisuuksia kokeilutarjouksen aikana. Tämän tiedonlouhintatutkimuksen tulokset paljastavat käyttäytymismalleja, jotka voivat ohjata tai auttaa tarkentamaan markkinointisuunnitelmaa lisäpuhelinpalvelujen käytön lisäämiseksi.

On tärkeää huomata, että tiedon louhinnan ensisijainen tarkoitus on havaita datamallit. Näytejoukon määrittämisessä käytetyillä spesifikaatioilla on valtava vaikutus tulosten osuvuuteen ja analyysin tarkkuuteen. Palataksemme yllä olevaan esimerkkiin, jos tietojoukko rajoittuu tietyllä maantieteellisellä alueella oleviin asiakkaisiin, tulokset ja mallit eroavat laajemmasta tietojoukosta. Vaikka sekä tiedonlouhinta että tietojen varastointi toimivat suurilla tietomäärillä, käytetyt prosessit ovat melko erilaisia.
Tietovarasto on ohjelmistotuote, jota käytetään suurten tietomäärien tallentamiseen ja erityisesti suunniteltujen kyselyiden ja raporttien suorittamiseen. Business Intelligence on kasvava tutkimusala, joka keskittyy tietovarastoon ja siihen liittyviin toimintoihin. Nämä työkalut on suunniteltu poimimaan tietoja ja tallentamaan ne menetelmällä, joka on suunniteltu parantamaan järjestelmän suorituskykyä. Suuri osa tiedon louhinnan ja varastoinnin terminologiasta on sama, mikä lisää sekaannusta.