Paikkatietojen louhinta on prosessi, jolla yritetään löytää malleja paikkatiedoista. Yleisimmin käytetty vähittäiskaupassa, se on kasvanut tiedon louhinnan alalta, joka alun perin keskittyi tekstimuotoisten ja numeeristen sähköisten tietojen mallien löytämiseen. Paikkatietojen louhinta katsotaan monimutkaisemmaksi haasteeksi kuin perinteinen kaivostoiminta, koska vaikeuksia liittyy sellaisten kohteiden analysointiin, joilla on konkreettista tilaa ja aikaa.
Kuten tavanomaisessa tiedonlouhinnassa, paikkatiedon louhintaa käytetään pääasiassa markkinoinnin ja vähittäiskaupan maailmassa. Se on tekniikka, jolla tehdään päätöksiä siitä, minne myymälä avataan. Se voi auttaa näiden päätösten tekemisessä käsittelemällä jo olemassa olevia tietoja siitä, mitkä tekijät kannustavat kuluttajia menemään yhteen paikkaan eikä toiseen.
Oletetaan, että Ashley haluaa avata yökerhon tietylle korttelille. Jos hänellä olisi käytettävissään asianmukaiset tiedot, hän voisi käyttää paikkatietojen louhinnan avulla selvittääkseen, mitkä paikkatekijät tekevät yökerhoista menestyviä. Hän saattaa esittää kysymyksiä, kuten: Tuleeko lisää ihmisiä klubille, jos julkinen liikenne on lähellä? Mikä etäisyys muista yöelämän kohteista maksimoi asiakassuhteen? Onko huoltoasemien läheisyys plus vai miinus?
Ashley saattaa myös haluta varmistaa, että hänen yökerhoonsa tulevat ihmiset saapuvat tasaisesti yhden yön aikana. Hän voisi myös käyttää paikkatietojen louhintaa – ehkä tarkemmin spatiotemporaalista tiedonlouhintaa – selvittääkseen, kuinka ihmiset liikkuvat kaupungin läpi tiettyinä aikoina. Samaa prosessia voitaisiin soveltaa holhoukseen viikon eri iltoina.
Tämän menetelmän vaikeudet johtuvat Internetin ulkopuolisen maailman monimutkaisuudesta. Kun aikaisemmat ponnistelut tiedon louhinnassa olivat yleensä tietokantoja valmiita analysoitavaksi, paikkatietojen louhintaan käytettävät syötteet eivät ole tietoverkkoja vaan karttoja. Näissä kartoissa on erityyppisiä kohteita, kuten tiet, väestö, yritykset ja niin edelleen.
Sen määrittäminen, onko jokin “lähellä” jotain muuta, muuttuu diskreetistä jatkuvaksi muuttujaksi. Tämä lisää massiivisesti analyysin vaatimaa monimutkaisuutta. Uskomatonta, että tämä on yksi yksinkertaisimmista suhteista, joita joku voi käyttää paikkatietojen louhintaan.
Paikkatietojen louhinta kohtaa myös väärien positiivisten ongelman. Kun etsitään tietoja, jotka etsivät suhteita, monet ilmeiset suuntaukset tulevat esiin tilastollisten väärien positiivisten seurauksena. Tämä ongelma esiintyy myös yksinkertaisemman tietokannan louhinnassa, mutta sitä vahvistaa datankaivajan käytettävissä oleva data. Viime kädessä tiedon louhinnan havaitsema suuntaus on vahvistettava selitys- ja lisätutkimusten avulla.