Tiedonlouhinta -algoritmit ovat ohjelmoituja kyselyitä ja ohjelmia, joita käytetään tunnistamaan malleja ja suuntauksia tietojoukoissa. Tietojen louhinnan ensisijainen käyttö on asiakkaiden tarpeiden ja mieltymysten määrittäminen heidän todellisen toimintansa perusteella. Vaikka tiedot perustuvat aiempaan suorituskykyyn, ne voivat olla erinomainen osoitus asiakkaiden käyttäytymisestä ja suuntauksista.
Kaksi erinomaista esimerkkiä tiedon louhinnan algoritmeista ovat klusterointi ja lähimmän naapurin ennustajat. Klusterointi on termi, jota käytetään kuvaamaan toimintaa, jossa yksittäisillä yksiköillä tai tiedoilla on tärkeitä ominaisuuksia. Pyykin erottaminen on looginen esimerkki tästä toiminnasta. Pyykin lajittelija toimii algoritmina. Hän jakaa pyykin kasoihin ominaisuuksien mukaan: värit, kuivapesu ja valkoiset erotetaan toisistaan.
Tämän toiminnan varsinainen päätöksentekoprosessi on algoritmin yksityiskohdat. Ensinnäkin tietojoukko on rajoitettava harjoitukseen liittyviin kohteisiin. Kengät eivät sisälly pyykin lajitteluun, vaikka ne voivat olla samassa fyysisessä tilassa. Päätös siitä, mitä ominaisuuksia käytetään pyykin erottamiseen ja jokaisen kasan koko, on tehtävä etukäteen.
Lähimmän naapurin ennustaja perustuu läheisesti vastaavien esimerkkien tunnistamiseen. Kriteerit on annettava alkuvaiheessa ja täsmennettävä, mikä kohde tai tiedot ovat ja mitä lähimmän määritelmä sisältää. Tämäntyyppinen algoritmi noudattaa samanlaista mallia kuin looginen ajatteluprosessi.
Tietojen louhinnan algoritmien ensisijainen etu on ohjelman kyky luoda ja tunnistaa malleja valtavassa tietomäärässä. Kyky tunnistaa naapurit tietyssä ympäristössä on helppo tehdä pienessä ryhmässä. Kaikista vuoden aikana tai alueella suoritetuista myyntitapahtumista kerätyt tiedot vaativat kuitenkin erityisiä ohjelmia ja logiikkaa, jotta ne olisivat mahdollisimman tarkkoja.
Ihmiset, jotka voivat luoda tiedonlouhinta -algoritmeja käyttäjien tarpeisiin, tarvitsevat työtä liiketoimintatiedon tai tiedon louhinnan parissa. Tämä on erittäin monimutkainen laajennus tilastoista, joiden suosio kasvaa, kun organisaatiot pyrkivät tuottamaan konkreettisempaa tuottoa keräämistään tiedoista. Tehokas kehittäjä voi luoda joukon tiedonlouhinta -algoritmeja, jotka tunnistavat käyttäytymismallit tarkasti, ja käyttää näitä tietoja tulevien toimintojen ennustamiseen. Nämä tiedot ovat erittäin arvokkaita yrityksille, organisaatioille ja hallituksille.