Mikä on normaali todennäköisyysjakauma?

Tilastojen periaatteiden mukaan riittävän otoskoon perusteella voidaan ennustaa suuremman väestön normaali todennäköisyysjakauma. Useimmat ihmiset yhdistävät jakautumistodennäköisyyden muotoon, joka syntyy, kun tiedot piirretään, mikä muodostaa kellokäyrän. Normaali käyrä näyttää suuremman pitoisuuden lähellä keskiarvoa tai pistettä, jossa puolet näytteestä sijaitsee kummallakin puolella. Näytteen elementtejä on vähemmän, kun siirrytään pois keskipisteestä.

Normaalia todennäköisyysjakaumaa edustava kellokäyrä on helppo kuvata, jos kuvitellaan, mitä tapahtuu, kun jauhot seulotaan lautaselle. Suurin osa jauhoista laskeutuu kasaan suoraan siivilän alle. Kun siirrytään pois kukkulan yläosasta, jauhot muuttuvat vähemmän syviksi, ja lautasen reunasta löytyy vähän tai ei lainkaan jauhoja.

Näytteen, kuten jauhon, hajaantumistavan määrittämiseksi on tarpeen selittää keskihajonnat. Yksinkertaisimmin sanottuna keskihajonta osoittaa kuinka laajasti jokainen tieto on muista datapisteistä ja keskiarvo. Jos pisteet on ryhmitelty tiiviisti yhteen, keskihajonta on pienempi kuin jos ne ovat hajallaan. Jos esimerkiksi kaupungin keskilämpötila vaihtelee dramaattisesti vuodenajan mukaan, sen keskihajonta on suurempi kuin normaali todennäköisyysjakauma päiväntasaajalla, jossa lämpötila pysyy suhteellisen vakiona ympäri vuoden.

Oletetaan esimerkiksi, että Yhdysvalloissa 27.8 prosenttia myydyistä naisten kengistä on kokoja 8 ja 8.5, 23.7 prosenttia kokoja 7 ja 7.5 ja 17.5 prosenttia kokoja 9 tai 9.5. Näiden tietojen perusteella kenkävalmistajat ovat määrittäneet kengän keskikokoksi 8–8.5; 27.8: n käyttäminen keskiarvona ja yhden kenkäkoon keskihajonnan määrittäminen pitäisi osoittaa, että noin 68 prosenttia kaikista naisista käyttää 7–9.5 kenkiä. Lukujen lisääminen tuottaa 69 prosenttia, hyvin normaalin todennäköisyysjakauman sisällä.

Siirryttäessä ulospäin keskiarvosta, numeroiden pitäisi osoittaa, että noin 99 prosenttia kuluu koon 5 ja koon 11 välillä. Kun otetaan huomioon valmistajien raportit, joiden mukaan 4.8 prosenttia kaikesta myynnistä on kokoa 5 tai 5.5, 11.7 prosenttia on kokoa 6 tai 6.5, 10 prosenttia on kokoa 10 tai 10.5 ja 3 prosenttia kokoa 11, voidaan nähdä, että 98.5 prosenttia kaikesta myynnistä noudattaa normaalin todennäköisyysjakauman periaatetta. Vain 1.5 prosenttia kaikista myydyistä kengistä ylittää kolme keskihajontaa.

Normaalin todennäköisyysjakauman periaatteita käytetään monissa eri sovelluksissa. Äänestäjät käyttävät joskus jakelutodennäköisyyttä keräämiensä tietojen tarkkuuden ennustamiseen. Normaalia käyrää voidaan käyttää myös rahoitussovelluksissa, esimerkiksi tietyn osakkeen kehityksen analysoimiseksi. Opettajat voivat soveltaa normaalin todennäköisyysjakauman lakeja ennakoidakseen tulevia testituloksia tai arvioidakseen käyrän paperit.