Mikä on varianssianalyysi?

Tutkimusta tehtäessä joskus on tarpeen analysoida tietoja vertaamalla useampaa kuin kahta näytettä tai ryhmää. Tietynlainen päättelytilastotesti, varianssianalyysi (ANOVA), mahdollistaa useiden näytteiden tutkimisen samanaikaisesti sen määrittämiseksi, onko niiden välillä merkittävä suhde. Perustelut ovat samat kuin t-testit, vain varianssianalyysi sisältää kahden tai useamman näytteen riippumattomat muuttujat. Näytteiden väliset erot sekä yhden näytteen sisäiset erot määritetään. ANOVA perustuu neljään olettamukseen: mittaustaso, otantamenetelmä, populaation jakauma ja varianssin homogeenisuus.

Jotta voidaan määrittää, ovatko erot merkittäviä, ANOVA käsittelee eroja näytteiden välillä ja niiden sisällä, jota kutsutaan varianssiksi. ANOVA voi selvittää, onko näytteiden välinen varianssi suurempi kuin otosjäsenten. Jos tämän todetaan pitävän paikkansa, eroja pidetään merkittävinä.

ANOVA -testin suorittaminen edellyttää tiettyjen olettamusten hyväksymistä. Ensimmäinen on se, että käytetään riippumatonta satunnaisotantamenetelmää ja otosjäsenten valinta yhdestä populaatiosta ei vaikuta myöhempien populaatioiden jäsenten valintaan. Riippuvaiset muuttujat mitataan ensisijaisesti aikavälisuhteella; on kuitenkin mahdollista soveltaa varianssianalyysiä ordinaalitason mittauksiin. Voidaan olettaa, että populaatio on normaalisti jakautunut, vaikka tämä ei ole todennettavissa, ja populaation vaihtelut ovat samat, mikä tarkoittaa, että populaatiot ovat homogeenisia.

Tutkimushypoteesissa oletetaan, että ainakin yksi keskiarvo on erilainen kuin muut, mutta eri keinoja ei tunnisteta suuremmiksi tai pienemmiksi. Vain se tosiasia, että ero on olemassa, ennustetaan. ANOVA testaa nollahypoteesia, mikä tarkoittaa, että kaikkien keskiarvojen välillä ei ole eroa, joten A = B = C. Tämä edellyttää alfa -arvon asettamista viitaten todennäköisyysasteeseen, jolla nollahypoteesi hylätään.

F-suhde on testitilasto, jota käytetään erityisesti varianssianalyysiin, koska F-pisteet osoittavat, mistä nollahypoteesin hylkäysalue alkaa. Tilastotieteilijä Ronald Fisherin kehittämä kaava F on seuraava: F = ryhmän varianssiarvion (MSB) välinen jaettuna ryhmän sisäisellä varianssiarvolla (MSW) siten, että F = MSB/MSW. Jokainen varianssiarvio koostuu kahdesta osasta – neliöiden (SSB ja SSW) ja vapausasteiden (df) summa. Käyttämällä biologisten, maatalouden ja lääketieteellisten tutkimusten tilastotaulukoita alfa voidaan asettaa ja perustua tähän, ja nollahypoteesi ei eroa voi hylätä. Voidaan päätellä, että kaikkien ryhmien välillä on merkittävä ero, jos näin on.