Päätöspuun oppiminen käyttää ennustavaa mallia, jonka informaatiohaaroja muistuttaa puu, jotta voidaan kerätä oletuksia kohteen arvosta ja tehdä arvio siitä. Järjestelmää käytetään koneoppimiseen, tilastointiin ja tiedon louhintaan. Päätöspuita kutsutaan myös regressio- tai luokituspuiksi sen mukaan, mihin tarkoitukseen niitä käytetään.
Päätöspuun oppimisprosessi sisältää siirtymisen haarasta informaation haaraan. Saavuttaessa jokaisen elementin, joko tietokoneen tai henkilön kautta, on määritettävä, koskeeko se kohdekohdetta vai ei. Kun jokainen haara on tutkittu, vastauksia voidaan käyttää arvon määrittämiseen.
Päätöspuun oppiminen on pohjimmiltaan kysymyksiin vastaaminen. Jokainen vastaus vie prosessia eteenpäin, kunnes on tarpeeksi tietoa päätöksen tekemiseksi. Esimerkiksi yksinkertainen puu voi aloittaa kysymällä, kumpi kahdesta esineestä ostaa. Yksi kysymys voi kysyä, onko esine hyödyllinen, kun taas toinen voi kysyä, onko yhdellä tuotteella parempi hinta kuin toisella. Kysymällä kaikki nämä kysymykset on tyypillisesti mahdollista määrittää, mikä toiminta on tilastollisesti hyödyllisempi.
Päätöspuun oppiminen tutkii myös alakategorioita. Vastaaminen yhteen kysymykseen voi johtaa toiseen. Tämä voi johtaa siihen, että joillakin haaroilla on monia alihaaroja, kun taas toiset ovat vähemmän kehittyneitä, koska kysymykseen on helppo vastata. Prosessin jatkaminen tällä tavalla antaa käyttäjälle mahdollisuuden kehittää yksityiskohtaisemman arvioinnin tuotteesta.
Toinen mahdollinen päätöspuun oppimisen käyttö on luokittelu. Sen sijaan, että jokainen kysymys johtaisi yhteen päätökseen, tietojoukko on jaettu eri alueisiin kunkin haaran vastauksen perusteella. Kun kaikki haarat on luokiteltu, sama prosessi voidaan suorittaa myös jokaisessa luokassa.
Päätöspuun oppiminen etenee tyypillisesti ylimmältä tasolta alaspäin. Se ei ole taipuvainen perääntymään. Kun kysymykseen on vastattu täydellisesti, siihen ei yleensä tarvitse viitata uudelleen ennen kuin tulokset on koottu.
Päätöspuun oppimisen tulokset voidaan ilmaista monin eri tavoin. Ne voivat olla vastaus kyllä tai ei -kysymykseen tai numero, kuten hinta tai ajanjakso. Tulokset voivat myös paljastaa tietyn objektin identiteetin ja siten nimetä luokan, johon se kuuluu.