Mikä on histogrammin jakauma?

Histogrammin jakauma tilastoissa viittaa histogrammin yksimuuttujien tietopalkkien kuvioihin, muotoihin ja sijainteihin. Miten ja missä palkit on jaettu, voidaan käyttää tietojen analysointiin ja johtopäätösten tekemiseen. Histogrammijakauma -analyysi on tärkeä tunnistettaessa piirteitä, kuten datan normaalisuus, multimodaalinen jakauma ja vääristynyt data.

Histogrammi on yksimuuttujainen datanäyttö, joka käyttää suorakulmioita, jotka ovat verrannollisia pinta -alaan luokan tai bin -taajuuksien kanssa tietojen esittämiseksi visuaalisesti. Histogrammin datapisteet on järjestetty säiliöihin ja itse histogrammijakauma on visuaalinen likimääräinen arvio datan taajuusjakaumasta tai todennäköisyystiheysfunktiosta. Jakauman muoto voi muuttua säiliöiden lukumäärän mukaan.

Histogrammijakauma -analyysiä käytetään usein laadullisena tarkistuksena tietojen normaalisuudesta. Vaikka normaaliarvon määrittämiseen on olemassa analyyttisiä menetelmiä, histogrammeja voidaan käyttää nopean ja järkevän tarkistuksen aika säästämiseksi. Jos histogrammitiedot näyttävät suunnilleen tasaisilta ja keskittyneinä keskiarvoon, tietojen oletetaan olevan normaaleja. Vaikka tällainen laadullinen tarkistus on nopea ja suhteellisen helppo, se on subjektiivinen ja analyysimenetelmiä olisi käytettävä, jos vaaditaan korkeampaa tarkkuutta.

Histogrammijakauma -analyysin toinen tapa on käyttää sen määrittämistä, onko tietojoukossa vinoutumista. Tietojen vinous määritellään datan voimakkaaksi epäsymmetriaksi. Negatiivinen vinous tai vinoutuminen vasemmalle näkyy tietojoukoissa, joissa on hyvin vähän matalia arvoja. Positiivinen vinous tai vino oikealle tapahtuu tietojoukoissa, joissa on vähän suuria arvoja. Histogrammijakauman tarkkailu voi paljastaa poikkeavuuksia ja vääristyneitä tietoja.

Sen lisäksi, että histogrammin muoto paljastaa tietojen ominaisuudet yhdellä moodilla, se voi paljastaa myös multimodaalisen datan ominaisuuksia. Multimodaaliset tietojoukot sisältävät useamman kuin yhden tilan, ja niille on ominaista taajuusjakaumat, joilla on useampi kuin yksi huippu tai maksimi. Poliittiset yhdyskunnat kaupungissa, hyväksytyt mielipidemittaukset ja mehiläiskoko ovat esimerkkejä tietokokonaisuuksista, jotka voivat olla multimodaalisia. Histogrammin muodon tarkkailu ja multimodaalisen datan eri piikkien huomioiminen voivat usein antaa tutkijalle enemmän tietoa kuin yksinkertaiset yksimuuttujat tilastolliset laskelmat.

Histogrammien analysointi ja tietojen jakautuminen riippuvat suuresti valituista säiliökokoista. Käytännössä säiliöiden lukumäärä voidaan arvioida ottamalla havaintojen lukumäärän neliöjuuri, vaikka muita säiliökokoja voidaan käyttää. Esimerkiksi opettaja voi halutessaan analysoida testiarvoja valitsemalla säiliöiden koot, jotka heijastavat kirjainten arvosanoja.