Mitä on datavirran louhinta?

Tietovirran louhinta on strategia, joka sisältää aktiivisen tietovirran tietojen tunnistamisen ja poimimisen. Tällä lähestymistavalla ajatuksena on vetää dataa luomatta minkäänlaista keskeytystä itse streamissa, jolloin muut voivat myös käyttää tietoja, vaikka poiminta tapahtuu. Tämäntyyppiseen datavirran louhintaan voi sisältyä kaikenlaista dataa, joka vaihtelee äänestä videon siirtoon Internetin välityksellä ja jopa päivittäisiin tehtäviin, kuten rahan nostamiseen pankkitililtä automaatilla tai puhelinkeskustelun avulla.

Yksi datavirran louhinnan ominaisuuksista on kyky suunnitella tai ennustaa tarkasti halutun tiedon paikantaminen ja millaiset tiedonhakutyökalut auttavat halutun tiedon löytämisessä ja onnistuneessa poimimisessa. Esimerkiksi kun asiakas aloittaa tapahtuman automaattisella pankkiautomaatilla, koneen ohjelmointi aloittaa asiaankuuluvien tilitietojen etsimisen, paikantaa tiedot ja määrittää sitten, alentaako tapahtuman summa tilisi saldon alle sallitun määrän, tilin rakenteen perusteella. Sieltä ohjelmointi voi palauttaa asiaankuuluvia tietoja käyttäjälle, kuten dokumentoida pyydetyn tapahtuman onnistuneen suorittamisen ja antaa tilisi saldon, joka on jäljellä tapahtumaan liittyvän luoton tai veloituksen kirjaamisen jälkeen.

Toinen yleinen esimerkki datavirran louhimisesta on perushaku selaimella. Tällä sovelluksella loppukäyttäjä syöttää hakuarvot kenttään, ja selainta ohjaava ohjelmisto pyrkii tulkitsemaan arvot ja palauttamaan tietoja, joilla on jonkin verran merkitystä hakukriteereille. Selaimen asetuksista riippuen tämä voi sisältää myös ominaisuuden, joka pyrkii ennakoimaan suoritetun haun tarkoituksen ja tarjoaa lisäsanoja tai -lauseita, jotka voivat auttaa tarkentamaan hakua enemmän käyttäjän makuun. Kun käyttäjä on asettunut hakulausekkeeseen, selain palauttaa tulokset sijoitusjärjestyksessä käyttäen algoritmeja, jotka liittyvät selaimen kokoonpanoon.

Yksi datavirran louhinnan tärkeimmistä eduista on mahdollisuus käyttää ja hakea tietoja ilman, että muita tosiasiallisesti estetään käyttämästä samoja tietoja. Koska tietovirrat päivittyvät jatkuvasti, poiminnan tulokset voivat muuttua ajoittain. Esimerkiksi verkkohaun tekeminen käyttämällä tiettyä hakulauseketta voi tuottaa yhden tulossarjan tänään, mutta antaa huomenna hieman erilaiset tulokset sen perusteella, mitä uutta tietoa on tullut tietovirtaan ja miten hakukone sijoittaa tiedot.