Mikä on suurten lukujen laki?

Suurten lukujen laki on tilastollinen lause, jonka mukaan satunnaismuuttujien otoskeskiarvo lähestyy teoreettista keskiarvoa satunnaismuuttujien lukumäärän kasvaessa. Toisin sanoen, mitä suurempi tilastollinen otos on, sitä todennäköisempää on saada tulokset tarkempia kokonaiskuvasta. Pienemmät näytteenumerot vääristävät lopputulosta helpommin, vaikka ne voivat olla myös melko tarkkoja.

Kolikko on hyvä esimerkki, jolla voidaan osoittaa suurten lukujen laki. Usein sitä käytetään alkutason tilastokursseilla osoittamaan, kuinka tehokas tämä laki voi olla. Useimmilla kolikoilla on kaksi puolta, pää ja häntä. Jos kolikko käännetään, logiikan mukaan kolikon laskeutumispäät tai hännänpuolet ovat yhtä suuret. Tämä riippuu tietysti kolikon tasapainosta, sen magneettisista ominaisuuksista ja muista tekijöistä, mutta yleensä tämä on totta.

Jos kolikko käännetään vain muutaman kerran, tulokset eivät välttämättä osoita, että sen todennäköisyys laskeutua päähän ja häntään on yhtä suuri. Esimerkiksi kolikon kääntäminen neljä kertaa voi tuottaa kolme päätä ja yhden hännän. Siitä voisi saada jopa neljä päätä eikä häntää. Tämä on tilastollinen poikkeama.

Suurten lukujen laki sanoo kuitenkin, että otoksen kasvaessa nämä tulokset todennäköisimmin vastaavat mahdollisuuksien todellista esitystä. Jos kolikko käännetään 200 kertaa, on todennäköistä, että monta kertaa se laskeutuu päähän ja häntään. Laki tai suuret luvut eivät kuitenkaan ennusta, että kukin on täsmälleen 100, vain se, että se todennäköisesti edustaa todellisia mahdollisuuksia enemmän kuin pienempi keskiarvo.

Suurten lukujen laki osoittaa, miksi tarvitaan riittävä näyte. Tilastoja käytetään, koska koko populaation käyttämiseen otoksena ei ole tarpeeksi aikaa tai se on epäkäytännöllistä. Väestö otos tarkoittaa kuitenkin sitä, että väestössä on edustavia jäseniä, joita ei lasketa. Jotta otos heijastaisi koko väestöä, tarvitaan riittävä määrä satunnaismuuttujia.

Sen määrittäminen, kuinka suuri näyte tarvitaan normaalisti, riippuu useista tekijöistä, joista tärkein on luottamusväli. Esimerkiksi tilastollinen luottamusväli on se varmuustaso, jonka väestö kuuluu tiettyihin parametreihin. 95 prosentin luottamusvälin asettaminen merkitsisi sitä, että on kohtuullinen varmuus siitä, että 95 prosenttia väestöstä kuuluu näiden parametrien piiriin. Tiettyihin luottamusväleihin tarvittava näyte määritetään kaavalla, joka ottaa huomioon populaation määrän ja halutun luottamusvälin.
Vaikka suurten lukujen laki on yksinkertainen käsite, sen perustelut auttavat lauseet ja kaavat voivat olla varsin monimutkaisia. Yksinkertaisesti sanottuna laki tai suuret luvut ovat paras selitys sille, miksi suuret näytteet ovat parempia kuin pienemmät. Kukaan ei voi taata, että tilastollinen otanta on täysin tarkka, mutta tämä laki auttaa estämään monia epätarkkoja tuloksia.