Mikä on varianssi?

Varianssi, kuten alue, on tilasto, joka liittyy tietyn otoksen tai populaation leviämiseen. Se lasketaan tietylle populaatiolle laskemalla yhteen kunkin elementin ja keskiarvon välisen eron neliöt ja jakamalla summa sitten populaation elementtien lukumäärällä. Mitä tiukemmin väestö on ryhmitelty keskiarvon ympärille, sitä pienempi varianssi on.

Läheisesti liittyvä tilasto on keskihajonta, joka on varianssin neliöjuuri. Keskihajontaa käytetään useammin kuvaavissa tilastoissa, koska se on intuitiivisempi ja jakaa samat yksiköt kuin keskiarvo. Normaalijakaumassa, joka on klassinen kellon muotoinen jakautumiskäyrä, joka on yhteinen monille ilmiöille, hieman yli 95 prosenttia väestöstä on kahden keskihajonnan sisällä.

Varianssi on hyödyllisin ennustaville tilastollisille tekniikoille, kuten regressio tai varianssianalyysi (ANOVA). Regressiossa mallinnetaan muuttuja yhden tai useamman muuttujan ja varianssiin vaikuttavan tekijän summana, mikä edustaa todellisten havaittujen elementtien ja niiden odotettujen arvojen eroa. Esimerkiksi rakennustyöllisyys kaupungissa voitaisiin mallintaa perustason tasolle, johon lisätään kausiluonteinen mukautus vuodenaikaan sekä kansantalouden mukautus ja vaihtelu. Regressiotekniikat yrittävät määrittää pienimmän varianssin mallin, niin että ennusteen odotettu arvo on toivottavasti lähellä havaittua arvoa havainnon jälkeen.

ANOVA, jota käytetään yleisesti kliinisissä tutkimuksissa, on tilastollinen tekniikka varianssilähteiden luokittelemiseksi. Havainnot luokitellaan yhden tai useamman kokeessa kiinnostavan tekijän mukaan. Pienimmän neliösumman tekniikoita käytetään jakamaan varianssit satunnaisvirheiksi, tekijävaikutuksiksi ja vuorovaikutusvaikutuksiksi tavoitteena määritellä tekijän tai tekijöiden vaikutus muuttujaan. Esimerkiksi yritys, joka testaa uutta lannoitetta, voi käyttää ANOVA -koketta sadon sadolla tutkittavana muuttujana ja tekijöinä, joista lannoitetta käytettiin ja kuinka paljon satoa satoi. Miten uusi lannoite verrattuna muihin lannoitteisiin olisi tekijävaikutus kokeessa; jos uusi lannoite ylittäisi kilpailijansa tavanomaisen sademäärän, mutta ei rankkasateiden osalta, se olisi esimerkki vuorovaikutusvaikutuksesta.