Mikä on yksinkertainen lineaarinen regressio?

Yksinkertainen lineaarinen regressio koskee tilastoja ja auttaa kuvaamaan (x, y) tietoja, joilla näyttää olevan lineaarinen suhde, mikä mahdollistaa jonkin ennustuksen y: stä, jos x on tiedossa. Nämä tiedot piirretään usein hajontakaavioihin, ja lineaarisen regression kaava luo suoran, joka sopii parhaiten kaikkiin pisteisiin, jos niillä todella on lineaarinen korrelaatio. Se ei sovi täsmälleen kaikkiin pisteisiin, mutta sen pitäisi olla linja, jossa todellisten tietojen ja odotettujen tietojen (jäännökset) erotuksen neliöiden summa luo pienimmän luvun, jota usein kutsutaan pienimmän neliön viivaksi tai viivaksi parhaiten sopiva. Näytetietojen ja populaatiotietojen rivin yhtälö on seuraava: y = b0 + b1x ja Y = B0 + B1x.

Jokainen, joka tuntee algebran, voi huomata tämän suoran samankaltaisuuden y = mx + b kanssa, ja itse asiassa nämä kaksi ovat suhteellisen identtisiä, paitsi että yhtälön oikealla puolella olevat kaksi termiä on kytketty niin, että B1 on kaltevuus tai m. Syy tähän uudelleenjärjestelyyn on silloin tyylikkäästi helppo lisätä lisätermejä ominaisuuksilla, kuten eksponenteilla, jotka saattavat kuvata erilaisia ​​epälineaarisia suhteita.

Kaavat yksinkertaisen lineaarisen regressiolinjan saamiseksi ovat suhteellisen monimutkaisia ​​ja raskaita, ja useimmat ihmiset eivät vie paljon aikaa kirjoittamiseen, koska niiden suorittaminen kestää kauan. Sen sijaan erilaiset ohjelmat, kuten Excel tai monenlaiset tieteelliset laskimet, voivat helposti laskea pienimmän neliön viivan. Rivi soveltuu vain ennustamiseen vain, jos on selvää näyttöä vahvasta korrelaatiosta (x, y) -tietojoukkojen välillä. Laskin luo rivin riippumatta siitä, onko sen käyttämisessä järkeä.

Samaan aikaan luodaan yksinkertainen lineaarinen regressiolinjayhtälö, ihmisten on tarkasteltava korrelaatiotasoa. Tämä tarkoittaa r: n, korrelaatiokerroimen, arvioimista arvotaulukon kanssa sen määrittämiseksi, onko lineaarinen korrelaatio olemassa. Lisäksi tietojen arvioiminen piirtämällä ne hajontakaavioiksi on hyvä tapa saada käsitys, jos tiedoilla on lineaarinen suhde.

Mitä voidaan tehdä yksinkertaisella lineaarisella regressiolinjalla, jos sillä on lineaarinen korrelaatio, on se, että arvot voidaan korvata x: llä, jotta saadaan ennustettu arvo y: lle. Tällä ennustuksella on rajansa. Esillä olevilla tiedoilla, varsinkin jos se on vain näyte, voi olla lineaarinen korrelaatio nyt, mutta ei ehkä myöhemmin lisäämällä lisää näytemateriaalia.

Vaihtoehtoisesti koko näyte voi jakaa korrelaation, kun taas koko populaatio ei. Ennustaminen on siksi rajoitettua, ja käytettävissä olevien tietoarvojen ylittämistä kutsutaan ekstrapoloimiseksi, eikä sitä kannusteta. Lisäksi, jos ihmiset tietävät, että jos lineaarista korrelaatiota ei ole, paras arvio x on kaikkien y -tietojen keskiarvo.

Pohjimmiltaan yksinkertainen lineaarinen regressio on hyödyllinen tilastollinen työkalu, jota voidaan harkinnan mukaan käyttää y -arvojen ennustamiseen kirveen arvon perusteella. Sitä opetetaan lähes aina ajatuksella lineaarisesta korrelaatiosta, koska regressiolinjan hyödyllisyyden määrittäminen edellyttää r: n analysointia. Onneksi monien nykyaikaisten teknisten ohjelmien avulla ihmiset voivat piirtää hajontakaavioita, lisätä regressiolinjoja ja määrittää korrelaatiokerroimen r muutamalla merkinnällä.