Biclustering on tiedon louhintatekniikka, joka lajittelee tiedot matriisiksi määrittämällä matriisin rivit ja sarakkeet samanaikaisesti. Tämän tekniikan ytimessä on tehokkuus, jonka avulla tietokone voi seuloa ja lajitella suuren määrän dataa lyhyemmässä ajassa verrattuna yksittäisiin klusterointimenetelmiin. Biklasterointi on yksinkertaisesti tietyn tiedonlouhintatekniikan luokan yleinen otsikko; tähän luokkaan voi kuulua monia erilaisia algoritmeja, mukaan lukien lohkoryhmittely, Plaid-malli, yhdistetty kaksisuuntainen ryhmittely ja toisiinsa liittyvä kaksisuuntainen ryhmittely.
Kahden klusterin tärkeyden ymmärtämiseksi on ensin ymmärrettävä tiedon louhinnan yleinen käsite. Tietojen louhinta vie suuren kasan dataa – kuten yrityksen päätietokannasta ladattua tietoa – ja lajittelee sen trendien ja muiden hyödyllisten mallien tunnistamiseksi. Tämän tyyppistä analyysiä voidaan käyttää sellaisten mallien määrittämiseen, jotka eivät muuten käy ilmi satunnaisista tutkimuksista, kuten kuluttajien ostotrendit ja osakemarkkinoiden vaihtelut. Tiedon louhinta voidaan suorittaa manuaalisesti ihmisen analyytikon toimesta tai sähköisesti käyttämällä tietyn tyyppistä tiedonlouhinta -algoritmia; siinä kaksijakoisuus tulee peliin.
Tietojen louhinnan aikana analysoiva tietokone yrittää lajitella asiaan liittyvät tiedot keskenään. Tämä prosessi tunnetaan klusterointina. Klusteroinnin avulla tietokone voi joustaa tekoälyään tunnistamalla, milloin kaksi tai useampia tietoja liittyy toisiinsa, sijoittamalla ne yhteen matriisiin. Normaalisti joko matriisin rivit tai sarakkeet täytetään, mutta vain yksi kerrallaan.
Biclustering poistaa tämän rajoittamalla sallimalla tietokoneen täyttää sekä rivit että sarakkeet samanaikaisesti. Tämä parantaa klusterointiprosessin tehokkuutta, mutta voi johtaa eri tavalla järjestettyihin matriiseihin käytetyn algoritmin mukaan. Esimerkiksi tietokone, joka järjestää asioita, joilla on vakio vastaavat arvot riveillä, verrattuna siihen, että järjestää asiat, joiden sarakkeisiin on sijoitettu vakio vastaavat arvot, luo eri näköiset matriisit käyttämällä täsmälleen samoja arvoja. Ei ole olemassa yhtä ”oikeaa” tapaa ryhmitellä tietoja; kaikki riippuu tiedon louhinnan suorittavan henkilön erityistilanteesta ja mieltymyksistä.