Mikä on taajuustaulukko?

Taajuustaulukko on järjestetty kohteiden tai arvojen lukumäärä. Yksinkertaisimmassa muodossaan taajuustaulukko näyttää kuinka usein kukin tietty arvo esiintyy tietojoukossa. Raakatiedot on järjestetty luokkiin ja laskettu näyttämään kuinka monta kutakin luokkaa on raakatiedossa. Nämä taulukot ovat usein hyödyllisiä tietojoukon tilastotietojen löytämisessä.

Jos raakatietojoukossa on vain muutama arvo, yksinkertainen taajuustaulukko yleensä riittää. Jotkin tietojoukot ovat liian suuria tai järjestämättömiä, jotta ne voivat käsitellä taulukkoa käsin, ja laskimen tai tietokoneen apu voi olla tarpeen. Yleensä yksinkertaiset taajuustaulukot koostuvat kolmesta sarakkeesta, joita käytetään seuraamaan luokkia, jotka tunnetaan nimellä merkki, laskenta ja taajuus.

Merkki -sarakkeessa luetellaan yleensä kaikki tietojoukon mahdolliset luokat. Jos joku esimerkiksi heittää kolikon 30 kertaa, hänellä on 30 arvoa tietojoukossa, mutta vain kaksi luokkaa – päät ja hännät. Toisaalta, jos kolme ihmistä saisi jälkiruoan kaupasta, jossa on 25 erilaista jäätelömakua, tietokannassa olisi kolme arvoa ja 25 mahdollista luokkaa.

Suuremmilla tietojoukoilla taajuustaulukon luominen vaatii tyypillisesti raakadatan järjestämistä ryhmiksi tai alueiksi, joita kutsutaan luokkaväleiksi. Tästä voi olla hyötyä lukuarvojen käsittelyssä. Jos esimerkiksi tietojoukon pienin luku on yksi ja suurin luku on 300, merkintäsarake voidaan jakaa kuuteen luokkaväliin, alkaen yhdestä 50, 51-100, 101-150 ja niin edelleen.

Seuraavaksi järjestetyt tiedot lasketaan yleisesti määrittämään kuinka monta kertaa jokainen luokka esiintyy tietojoukossa. Yksinkertaisessa taajuustaulukossa tämä tehdään yleensä merkitsemällä käsin luokkasarjan vieressä oleva laskentasarake kerran jokaiselle arvolle tai laskulle. Monimutkaisemmassa tietojoukossa raakatiedot syötetään usein tietokoneeseen tai laskimeen sen sijaan, että ne laskettaisiin käsin.

Taajuustaulukon kolmas sarake on taajuussarake. Tässä luetellaan kunkin luokan esiintymistiheys. Tässä sarakkeessa olevat luvut eivät ole raakatietoarvoja, vaan pikemminkin kuinka monta kertaa jokainen luokka esiintyi tietojoukossa. Tästä sarakkeesta tehdään usein kaavio tai ympyräkaavio arvojen esittämiseksi visuaalisesti mielenkiintoisemmalla tavalla.
Taajuustaulukoista voi olla hyötyä paljastettaessa joitakin raakatietojoukon tilastotietoja. Ne voivat näyttää mitä tahansa tilaa tai arvoja, jotka esiintyvät useimmiten tiedoissa. Näistä taulukoista voi olla apua myös mediaani- tai keskiarvon löytämisessä, koska tiedot järjestetään usein suuruusjärjestyksessä merkin sarakkeessa.

Taajuustaulukkoa voidaan käyttää myös tietojen jakautumisen määrittämiseen. Tästä syystä niitä kutsutaan usein taajuusjakauma -taulukoiksi. Taulukko voi myös näyttää, onko tiedoilla keskeinen taipumus, joka voidaan esittää visuaalisesti korkeammilla taajuuksilla, jotka on ryhmitelty taulukon keskelle. Se voi myös näyttää tietojen hajaantumisen kaikkiin luokkiin, jota kutsutaan myös sen vaihtelevuudeksi.