Lineaarinen regressio

Lineaarinen regressio on regressiomalli  , jota käytetään tilastoissa yhden (selitetyn, riippuvan) muuttujan riippuvuudelle toisesta tai useista muista muuttujista (tekijät, regressorit, riippumattomat muuttujat) lineaarisella riippuvuusfunktiolla .

Lineaarinen regressiomalli on ekonometriassa yleisimmin käytetty ja tutkituin . Eli tutkitaan eri menetelmillä saatujen parametriestimaattien ominaisuuksia tekijöiden todennäköisyysominaisuuksien ja mallin satunnaisvirheiden perusteella. Epälineaaristen mallien arvioiden rajoittavat (asymptoottiset) ominaisuudet johdetaan myös jälkimmäisten lineaaristen mallien approksimaatiosta. Ekonometrisesta näkökulmasta parametrien lineaarisuus on tärkeämpää kuin mallitekijöiden lineaarisuus.

Määritelmä

Regressiomalli

,

missä  ovat mallin parametrit,  on mallin satunnaisvirhe; kutsutaan lineaariseksi regressioksi, jos regressiofunktiolla on muoto

,

missä  ovat regressioparametrit (kertoimet),  ovat regressorit (mallitekijät), k  on mallitekijöiden lukumäärä [1] .

Lineaariset regressiokertoimet osoittavat riippuvan muuttujan muutosnopeuden tietylle tekijälle, kun muut tekijät ovat kiinteitä (lineaarisessa mallissa tämä nopeus on vakio):

Parametria , jolle ei ole tekijöitä, kutsutaan usein vakioksi . Muodollisesti tämä on funktion arvo kaikkien tekijöiden nolla-arvolla. Analyyttisiä tarkoituksia varten on tarkoituksenmukaista ajatella, että vakio on parametri, jonka "tekijä" on yhtä suuri kuin 1 (tai muu mielivaltainen vakio, joten tätä "tekijää" kutsutaan myös vakioksi). Tässä tapauksessa, jos numeroidaan alkuperäisen mallin tekijät ja parametrit uudelleen tätä ajatellen (jättäen tekijöiden kokonaismäärän nimen - k), niin lineaarinen regressiofunktio voidaan kirjoittaa seuraavaan muotoon, joka ei muodollisesti sisältää vakion:

,

missä  on regressoreiden  vektori, on parametrien (kertoimien) sarakevektori.

Lineaarinen malli voi olla joko vakiolla tai ilman vakiota. Tällöin tässä esityksessä ensimmäinen tekijä on joko yhtä suuri kuin yksi tai on vastaavasti tavallinen tekijä.

Pari- ja moninkertainen regressio

Tietyssä tapauksessa, kun tekijä on ainutlaatuinen (vakiota ottamatta huomioon), puhutaan pariliitoksesta tai yksinkertaisesta lineaarisesta regressiosta:

Kun tekijöiden lukumäärä (vakiota huomioimatta) on enemmän kuin yksi, he puhuvat moninkertaisesta regressiosta:

Esimerkkejä

Organisaation kustannusmalli (ilman satunnaista virhettä)

Yksinkertaisin kulutusmalli ( Keynes )

Matriisiesitys

Olkoon näyte n havainnosta muuttujilla y ja x . Olkoon t  havainnon numero otoksessa. Sitten  — muuttujan y arvo t : nnessä havainnossa,  — j :nnen tekijän arvo t :nnessä havainnossa. Vastaavasti on t- : nnen havainnon  regressorien vektori . Sitten jokaisessa havainnossa tapahtuu lineaarinen regressioriippuvuus:

Esitellään merkintä:

on riippuvan muuttujan y  havaintojen vektori  on tekijöiden matriisi.  on satunnaisvirheiden vektori.

Sitten lineaarinen regressiomalli voidaan esittää matriisimuodossa:

Klassinen lineaarinen regressio

Klassisessa lineaarisessa regressiossa oletetaan, että standardiehdon ohella myös seuraavat oletukset täyttyvät ( Gauss-Markov-ehdot ):

  1. Mallin satunnaisvirheiden homosedastisuus (vakio tai yhtä suuri varianssi) tai heteroskedastisuuden puute :
  2. Satunnaisvirheiden autokorrelaation puute :

Nämä mallin matriisiesityksen oletukset on muotoiltu yhdeksi oletukseksi satunnaisvirhevektorin kovarianssimatriisin rakenteesta:

Edellä olevien oletusten lisäksi klassisessa mallissa tekijöiden oletetaan olevan deterministisiä ( ei- stokastisia ). Lisäksi vaaditaan muodollisesti, että matriisilla on täysi arvo ( ), eli oletetaan, että tekijöiden täydellistä kollineaarisuutta ei ole.

Kun klassiset oletukset täyttyvät, tavallisella pienimmän neliösumman menetelmällä voidaan saada riittävän korkealaatuisia estimaatteja mallin parametreista, nimittäin: ne ovat puolueettomia , johdonmukaisia ​​ja tehokkaimpia arvioita .

Arviointimenetelmät

Katso myös

Muistiinpanot

  1. Demidenko, 1981 , s. 6.

Kirjallisuus