Hva en enkel lineær regresjonsmodell er og hvordan den fungerer
- 3850
- 655
- Mats Ødegård
Lineære regresjonsmodeller brukes til å vise eller forutsi forholdet mellom to variabler eller faktorer. Faktoren som blir spådd (faktoren som ligningen løser for) kallesavhengig variabel. Faktorene som brukes til å forutsi verdien av den avhengige variabelen kalles de uavhengige variablene.
I lineær regresjon består hver observasjon av to verdier. En verdi er for den avhengige variabelen og en verdi er for den uavhengige variabelen. I denne enkle modellen tilnærmer en rett linje forholdet mellom den avhengige variabelen og den uavhengige variabelen.
Når to eller flere uavhengige variabler brukes i regresjonsanalyse, er modellen ikke lenger en enkel lineær. Dette er kjent som multippel regresjon.
Formel for en enkel lineær regresjonsmodell
De to faktorene som er involvert i enkel lineær regresjonsanalyse er utpekt x og y. Ligningen som beskriver hvordan y er i slekt med x er kjent som Regresjonsmodell.
Den enkle lineære regresjonsmodellen er representert av:
y = β0 +β1x+ε
Den lineære regresjonsmodellen inneholder et feilbegrep som er representert med ε. Feilbegrepet brukes til å redegjøre for variasjonen i y som ikke kan forklares med det lineære forholdet mellom x og y. Hvis ε ikke var til stede, ville det bety det å vite x ville gi nok informasjon til å bestemme verdien av y.
Det er også parametere som representerer befolkningen som studeres. Disse parametrene for modellen er representert av β0 og β1.
Den enkle lineære regresjonsligningen er tegnet som en rett linje, hvor:
- β0 er y-avskjæringen av regresjonslinjen.
- β1 er skråningen.
- Ε(y) er den gjennomsnittlige eller forventede verdien av y for en gitt verdi av x.
En regresjonslinje kan vise et positivt lineært forhold, et negativt lineært forhold eller ingen forhold.
- Ikke noe forhold: Den grafiske linjen i en enkel lineær regresjon er flat (ikke skrånende). Det er ingen sammenheng mellom de to variablene.
- Positivt forhold: Regresjonslinjen skråner oppover med den nedre enden av linjen ved y-avskjæringen (aksen) på grafen og den øvre enden av linjen som strekker seg oppover i graffeltet, vekk fra X-avskjæringen (Axis). Det er et positivt lineært forhold mellom de to variablene: Når verdien av den ene øker, øker den andre verdien også.
- Negativt forhold: Regresjonslinjen skråner nedover med den øvre enden av linjen ved y-avskjæringen (aksen) på grafen og den nedre enden av linjen som strekker seg nedover i graffeltet, mot X-avskjæringen (Axis). Det er et negativt lineært forhold mellom de to variablene: Når verdien av en øker, reduseres verdien av den andre.
Den estimerte lineære regresjonsligningen
Hvis parametrene til befolkningen var kjent, kunne den enkle lineære regresjonsligningen (vist nedenfor) brukes til å beregne middelverdien av y for en kjent verdi av x.
Ε(y) = β0 +β1x+ε
I praksis er imidlertid ikke parameterverdier generelt ikke kjent, så de må estimeres ved å bruke data fra et utvalg av populasjonen. Befolkningsparametrene estimeres ved å bruke eksemplerstatistikk. Eksempelstatistikken er representert av β0 og β1. Når utvalgsstatistikken er erstattet med populasjonsparametrene, dannes den estimerte regresjonsligningen.
Den estimerte regresjonsligningen er:
(ŷ) = β0 +β1x+ε
Merk: (ŷ) uttales y hatt.
Grafen til den estimerte enkle regresjonsligningen kalles den estimerte regresjonslinjen.
- β0 er y-avskjæringen av regresjonslinjen.
- β1 er skråningen.
- (ŷ) er den estimerte verdien av y for en gitt verdi av x.
Grenser for enkel lineær regresjon
Selv de beste dataene forteller ikke en komplett historie.
Regresjonsanalyse brukes ofte i forskning for å fastslå at det eksisterer en korrelasjon mellom variabler. Men korrelasjon er ikke det samme som årsakssammenheng: en sammenheng mellom to variabler betyr ikke at den ene får den andre til å skje. Selv en linje i en enkel lineær regresjon som passer til datapunktene godt, kan det hende at det ikke garanterer et årsak og virkningsforhold.
Å bruke en lineær regresjonsmodell vil tillate deg å oppdage om det i det hele tatt eksisterer en sammenheng mellom variabler. For å forstå nøyaktig hva det forholdet er, og om en variabel forårsaker en annen, trenger du ytterligere forskning og statistisk analyse.
- « Hva du skal ha på et advokatfirmajobbintervju
- Topp 10 måter å bli berømt og øke verdien som ekspert på »