Mikä on rakenteen louhinta?

Rakennekaivos on eräänlainen tiedonlouhinta, jossa skannataan puolistrukturoitu tietolähde ja löydetään ja korostetaan sen rakenteen elementtejä. Osittain rakenteinen tietolähde on sellainen, joka ei käytä taulukoiden perinteistä tietokantarakennetta, mutta sisältää semanttisen elementin, joka erottaa tiedot tunnisteiden ja merkkien avulla. Rakenteiden louhintaa voidaan käyttää tietokantojen, verkkosivustojen ja monien muiden tietokonemuotojen louhintaan rakenteen elementtien löytämiseksi. Se auttaa käyttäjiä joko ymmärtämään, kuinka kappaleet ovat vuorovaikutuksessa toistensa kanssa tai kuinka löytää tietoja tietyistä tunnisteista. Tätä kaivostoimintaa voidaan myös käyttää ennustamaan, mikä kohde on käyttäjän kirjoittamien sääntöjen perusteella.

Tiedonlouhinta on monenlaista, ja useimmat ovat huolissaan perinteisesti jäsennellyn lähteen louhimisesta. Tämä sisältää kaikki lähteet, jotka käyttävät useimmille tietokannoille tyypillisiä taulukoita ja solmuja. Rakenteellisessa louhinnassa käytetään vain osittain jäsenneltyä dataa. Tässä tapauksessa tiedot ovat peräisin verkkosivustoilta tai yksinkertaisista tietokannoista, joilla on rakenne, mutta jotka eivät ole perinteisten tietokantasääntöjen mukaisia. Tiedot tarvitsevat tunnisteita tai merkkejä, jotka erottavat kunkin kohteen toisistaan, jotta ne voidaan louhia oikein.

Lukemalla puolistrukturoitu tietojoukko, rakenteen louhinta pystyy havaitsemaan rakenteen vuorovaikutuksen. Esimerkiksi jokaisella verkkosivustolla on navigointimalli, ja tämä malli määrittää sivujen vuorovaikutuksen. Kaivamalla rakennetta käyttäjä voi selvittää, miten tämä navigointi toimii, mikä voi auttaa luomaan samanlaisen navigointimallin.

Rakennekaivostoimintaa voidaan käyttää myös esineiden etsimiseen kirjoittamalla säännöt kaivosohjelmaan. Jos esimerkiksi on olemassa kirjan tietojoukko, käyttäjä voi kirjoittaa säännön, jonka mukaan kaikkien kirjojen, joilla ei ole indeksiä, tulee palata fiktiona ja niiden, joilla on indeksi, on palautettava tietokirjana. Useimmista kaunokirjakirjoista puuttuu hakemisto, joten tämä sääntö ennustaa suurella tarkkuudella tiedot. Tämä auttaa käyttäjiä, kun he katsovat osittain jäsenneltyä joukkoa, jolla on organisaatiomenetelmä, mutta joka ei vastaa sitä, mitä käyttäjä etsii.

Selvitettyään osittain rakenteellisen yksikön rakenteen käyttäjä vertaa sitä tyypillisesti toiseen puoliksi rakenteelliseen yksikköön. Jos käyttäjällä on yrityksen verkkosivusto, hän voi kaivaa toisen yrityksen verkkosivuston navigointia ja linkkejä varten ja nähdä, kuinka hänen verkkosivustonsa on samanlainen. Vertaamalla louhittuja tietoja käyttäjä voi löytää keinoja rakenteen tehokkuuden lisäämiseksi.