Sekvenssikaivos on eräänlainen jäsennelty tiedonlouhinta, jossa tietokanta ja järjestelmänvalvoja etsivät tietojen sekvenssejä tai suuntauksia. Tämä tiedonlouhinta on jaettu kahteen kenttään. Kohdesarjojen louhintaa käytetään tyypillisesti markkinoinnissa, ja merkkijonokaivostoimintaa käytetään biologian tutkimuksessa. Sekvenssikaivos on erilainen kuin tavallinen trendikaivos, koska tiedot ovat tarkempia, mikä tekee tehokkaan tietokannan rakentamisesta vaikeaa tietokannan suunnittelijoille, ja se voi joskus mennä pieleen, jos sekvenssi eroaa tavallisesta sekvenssistä.
Jossain vaiheessa kaikkia tietokantoja käytetään tietojen kaivamiseen. Tämä kaivostoiminta auttaa yrityksiä ja tutkimusryhmiä löytämään tarvitsemansa. Yleensä he etsivät jonkinlaista suuntausta, mutta mikä tämä suuntaus on ja kuinka tarkkoja tiedot ovat, riippuu tietokannan suunnittelusta. Sekvenssikaivostoiminnassa tietokanta on rakennettu löytämään hyvin spesifisiä sekvenssejä, joissa ei ole juurikaan vaihtelua. Tämä on ainutlaatuinen rakenteellisen tiedon louhinnan muoto, jossa tietokanta etsii jäsenneltyjä tietoja samankaltaisuuksia.
Sekvenssikaivostoiminta voidaan jakaa kahteen luokkaan. Tuoteryhmäkaivostoimintaa käytetään markkinoinnissa ja liiketoiminnassa etsimään erityisiä suuntauksia myyntimäärissä, tuotetyypeissä, tuotteen sijoittelussa myymälässä ja tuotteen käytössä. Nämä luvut otetaan ja niitä sovelletaan markkinointialgoritmeihin markkinointiprojektin strategisoimiseksi ja myynnin tukemiseksi. Tietoa tuotteesta ja sen tavallisesta tyypistä otetaan tietokannasta, mutta kohderyhmän kaivostoiminnan määrittävä piirre on se, että sekvenssi otetaan monisymbolisista tietokantasoluista.
Merkkijonojen louhinta on vastakohta esineiden kaivostoiminnalle, koska se tarkastelee jokaista symbolia erikseen eikä klusteria. Jousikaivoksessa tietokanta voidaan asettaa etsimään sekvenssi proteiinilähteestä tai geeninäytteistä. Tämä auttaa vertaamaan monia geeninäytteitä nähdäkseen, ovatko ne samat vai hajottavatko suuret sekvenssit ja miten ne sisältävät. Useimmiten biologiset ja lääketieteelliset tutkimusryhmät käyttävät tätä.
Tietokannan luominen sekvenssikaivostoimintaan voi olla vaikeaa, koska toisin kuin trendikaivos ja muu strukturoitu tiedonlouhinta, sekvenssien on vastattava toisiaan. Tämä johtaa myös sekvenssien louhinnan ongelmaan. Jos sekvenssi on erilainen, sitä ei tunnisteta, mikä saattaa vaikeuttaa kohteiden kaivostoimintaa. Stringin louhinta hyötyy tästä tyypillisesti, koska pienin ero kudosnäytteessä voi tehdä organismin – tai mitä tutkimusryhmä tutkii – täysin erilaiseksi muista näytteistä.