Voivatko tilastot olla harhaanjohtavia?

On vanha sanonta, että luvut eivät valehtele, mutta valehtelijat tietävät, miten kuvitella. Tietyssä mielessä tämä edustaa ihmisten varovaisuutta tilastojen suhteen. Tilastollinen tulkinta voi saada tiedot näyttämään harhaanjohtavilta. Se riippuu tilastotieteiden tulkinnasta tiedoista ja siitä, mitkä luvut tuodaan esiin tilastollisen raportin keskeisinä kohtina.
Esimerkiksi lukiossa oppilaat opiskelevat nyt keskeisen taipumuksen mittareita, jotka ovat keskiarvo, mediaani, tila ja vaihteluväli. Keskiarvo on kaikkien tietojen summa jaettuna datamäärällä. Esimerkiksi voidaan saada henkilön testitulosten summa ja jakaa se testien lukumäärällä arvosanan määrittämiseksi. Keskiarvoon voi kuitenkin vaikuttaa niin sanottu outlier, luku, joka on kaukana normaalista testausalueesta. Tämä voi viitata siihen, että keskiarvo voi olla harhaanjohtava tapa arvioida suorituskykyä.

Jos henkilö suorittaa viisi testiä täydellisesti eikä läpäise kuudetta testiä ja saa siten nollan, keskiarvo heijastaa tätä. Jos kaikki testit ovat esimerkiksi 100 pisteen arvoisia, keskiarvo on noin 85%. Tämä ei kuitenkaan todellakaan viittaa keskimääräiseen suorituskykyyn tässä tapauksessa nollan ylityksen vuoksi.

Toinen keskeinen taipumus, jota voidaan käyttää, on mediaanin arviointi. Mediaani on numeerisesti järjestetyn tietoryhmän keskimmäinen luku. Jos tilastotieteilijä arvioi mediaanin, se ei välttämättä edusta todellista suorituskyvyn keskiarvoa tai mitä tahansa arvioitavaa. Mediaani ei voi ottaa huomioon tietoaluetta, joka voi olla valtava ja siten harhaanjohtava.

Keskeinen suuntaus, jota tila arvioi, tarkoittaa vain lukua, joka esiintyy useimmin tietojoukossa. Joten esimerkiksi testin tekijällä on moodi 100. Tämä ei kuitenkaan kuvaa sitä, että testin suorittanut henkilö ei suorittanut testiä, mikä on harhaanjohtavaa.

Muita tapoja, joilla tilastot voivat olla harhaanjohtavia, ovat tapa, jolla kysymyksiä esitetään, ehkä kyselyssä, ja missä määrin kysely on edustava otos yhteisöstä. Jos tutkitaan ryhmä lukiolaisia ​​ja kysytään “Kuinka tyytyväinen olet koulutukseesi asteikolla 1-5?” voi saada hyvin erilaisia ​​vastauksia sen mukaan, edustaakö ryhmä “keskimääräistä” opiskelijaa.

Jos kyseenalaistetaan ryhmä oppilaita, jotka kaikki saavat suoran As-asteen ja menevät fantastiseen, hyvin rahoitettuun kouluun, tällaisten tietojen julkaiseminen edustavana otoksena on tarkoituksellisesti harhaanjohtavaa. Jos kysytään eri koulujen oppilailta, joilla on eri arvosanat, kysely on todennäköisesti edustavampi ja oikeudenmukaisempi. Jos kuitenkin kysytään oppilailta, mitä he ajattelevat kouluista, ja julkaistaan ​​sitten tulokset edustavana otoksena väestöstä, vastaukset ovat tällöin erittäin vinoja.
Numerot voivat tuntua hyvin konkreettisilta, ja jotkut joutuvat harhaan lukujen kanssa vain siksi, että ne näyttävät tosiasioilta ja niillä on kiistaton arvo. Näin ollen tilastotietoja voidaan usein käyttää harhaanjohtavasti ihmisten hämmentämiseen numeroilla ja saada kiistanalaiset asiat näyttämään enemmän tosiasioilta. Hyvämaineiset tilastotieteilijät tietävät, että kysymyksiä on yleistettävä, ja niitä on myös esitettävä väestöä edustavilta ihmisiltä.

Luvut ja tilastot voivat kuitenkin olla harhaanjohtavia, koska ne eivät edusta yksilöä. Ne voivat näyttää, kuinka ihmiset “yleensä” reagoivat ideaan, tuotteeseen tai poliittiseen ehdokkaaseen. Ne eivät voi näyttää miltä yksittäinen henkilö kaikista hänen äärettömän vaihtelevista ominaisuuksistaan ​​tuntee.