Mitkä ovat erilaiset histogrammien tulkintatyypit?

Histogrammin tulkintaa on monia erilaisia, kaavion yleisen muodon perusteella. Kaksi pääasiallista eroa ovat symmetriset histogrammit ja epäsymmetriset histogrammit. Näiden kahden merkittävän eron sisällä on useita muita eroja, riippuen kaavion jakautumisesta. Eri tyyppisten histogrammien tulkinnan ymmärtäminen voi antaa analyytikoille tietää jotain tiedosta ensi silmäyksellä.

Histogrammin normaali muoto tunnetaan kellon muodona tai kellokäyränä. Suurin määrä datapisteitä sijaitsee lähellä kaavion keskustaa, ja yhä pienempi määrä pisteitä kummassakin päässä siirtyy pois keskustasta. Kun viiva vedetään, käyttäen suunnilleen palkkien yläosia vertailupisteinä, se muistuttaa kellon muotoa. Tämä malli ilmenee useimmiten, kun analysoidaan asioita, joita tapahtuu luonnossa.

Kaksi tyypillistä muunnosta symmetrisestä histogrammin tulkinnasta ovat epätavallinen lyhythäntäinen ja ei-normaali pitkähäntäinen. Näissä tapauksissa datapisteet ovat edelleen enimmäkseen tasaisia ​​kummallakin puolella, mutta jakautumisessa on jonkin verran eroa. Lyhythäntäisessä histogrammitulkinnassa datapisteillä on taipumus kasaantua keskelle. Pitkäkestoisessa tulkinnassa datapisteet ovat yleensä hajautuneempia, mutta silti enimmäkseen tasaisesti kummallakin puolella.

Toinen symmetrisen histogrammin muunnelma on symmetrinen poikkeamien kanssa. Tässä tapauksessa tietojoukoissa voi olla merkittäviä aukkoja, jotka jättävät aukot histogrammiin. Tästä huolimatta histogrammi pysyy suhteellisen symmetrisenä, koska poikkeamat näkyvät molemmin puolin. Joissakin tapauksissa poikkeamat voidaan heittää pois, koska ne eivät ole tilastollisesti merkitseviä.

Toinen merkittävä tulkintatyyppi histogrammeille on epäsymmetrinen tulkinta. Kuten toinenkin pääjako, epäsymmetriset histogrammit voidaan edelleen jakaa alajakoihin. Epäsymmetriset histogrammit tunnetaan myös vinossa histogrammina, koska datapisteet suosivat keskipisteen toista puolta tai toista puolta. Poikkeamat voivat esiintyä myös vinossa histogrammissa, mutta eivät yleensä vaikuta muotoon tai keskiarvoihin, elleivät ne ole äärimmäisiä poikkeamia.

Väärä tai epäsymmetrinen histogrammin tulkinta on usein vaikeaa todella saada aikaan, koska datapisteet ovat voimakkaasti toisella puolella. Usein keskiarvot voivat merkitä hyvin vähän tällaisissa tietojoukoissa, koska ne ovat niin vinoja. Keskiarvo ei välttämättä ole todella histogrammin keskellä, ja tämä pyrkii pienentämään sen tilastollista merkitystä.