Multikollineaarsus - mis see on, määratlus ja mõiste

Lang L: none (table-of-contents):

Anonim

Multikollineaarsus on tugev regulaarse sõltuvuse seos enam kui kahe seletava muutuja vahel mitmekordse regressiooni korral, mis rikub täpselt Gaussi-Markovi oletust.

Teisisõnu on multikollineaarsus rohkem kui kahe selgitava muutuja vahel.

Rõhutame, et seletavate muutujate lineaarne seos (korrelatsioon) peab olema tugev. On väga tavaline, et regressiooni selgitavad muutujad on korrelatsioonis. Seega tuleb juhtida tähelepanu sellele, et see suhe peab olema tugev, kuid mitte kunagi täiuslik, et seda saaks pidada multikollineaarsuse juhtumiks. Lineaarne seos oleks ideaalne, kui korrelatsioonikordaja oleks 1.

Kui see tugev lineaarne (kuid mitte täiuslik) suhe tekib ainult kahe selgitava muutuja vahel, siis ütleme, et tegemist on kollineaarsusega. See oleks multikollineaarsus, kui tugev lineaarne seos tekib rohkem kui kahe sõltumatu muutuja vahel.

Gaussi-Markovi oletus täpse mitte-multikollineaarsuse kohta määratleb, et valimi selgitavad muutujad ei saa olla konstantsed. Lisaks ei tohiks selgitavate muutujate vahel olla täpseid lineaarseid seoseid (puudub täpne multikollineaarsus). Gauss-Markov ei luba meil täpset multikollineaarsust, kuid lähendab multikollineaarsust.

Regressioonanalüüs

Rakendused

On väga konkreetseid, tavaliselt ebareaalseid juhtumeid, kus regressioonimuutujad pole üksteisega täielikult seotud. Nendel juhtudel räägime selgitavate muutujate eksogeensusest. Sotsiaalteadused on üldiselt kuulsad selle poolest, et lisasid ligikaudse multikollineaarsuse oma regressioonidesse.

Täpne multikollineaarsus

Täpne multikollineaarsus tekib siis, kui rohkem kui kaks sõltumatut muutujat on regressiooni teiste sõltumatute muutujate lineaarne kombinatsioon.

Probleemid

Kui Gauss Markov keelab täpse multikollineaarsuse, on see tingitud sellest, et me ei saa tavaliste väikseimate ruutude (OLS) hindajat.

Hinnangulise beeta-sub-i matemaatiline väljendamine maatriksvormis:

Niisiis, kui eksisteerib täpne multikollineaarsus, põhjustab see maatriksil (X'X) determinandi 0 ja pole seetõttu pööratav. Puudumine tähendab, et ei saa arvutada (X'X)-1 ja järelikult ei hinnatud kumbagi beeta-alam-i.

Ligikaudne multikollineaarsus

Ligikaudne multikollineaarsus tekib siis, kui rohkem kui kaks sõltumatut muutujat ei ole regressioonis teiste sõltumatute muutujate lineaarne kombinatsioon (ligikaudne).

Muutuja k tähistab juhuslikku muutujat (sõltumatut ja identset jaotust (i.i.d)). Teie vaatluste sagedust saab rahuldavalt lähendada standardsele normaaljaotusele keskmise 0 ja dispersiooniga 1. Kuna see on juhuslik muutuja, tähendab see, et igas vaatluses i on k väärtus erinev ja sõltumatu mis tahes varasemast väärtusest.

Probleemid

Matemaatiliselt väljendades maatriksvormis:

Niisiis, kui on olemas ligikaudne multikollineaarsus, põhjustab see maatriksi (X'X) ligikaudu 0 ja määramistegur on väga lähedal 1-le.

Lahendus

Multikollineaarsust saab vähendada suurte lineaarsete suhetega muutujate regressorite kõrvaldamisega.

Lineaarne korrelatsioonikordaja