Määramistegur (R ruut)

Lang L: none (table-of-contents):

Määramistegur (R ruut)
Määramistegur (R ruut)
Anonim

Määramiskoefitsient on regressiooniga seletatav muutuja kogu hajumise osa. Määramiskoefitsient, mida nimetatakse ka R-ruuduks, peegeldab mudeli sobivust muutujaga, mida ta kavatseb selgitada.

Oluline on teada, et määramisteguri tulemus võnkub vahemikus 0 kuni 1. Mida lähemal on selle väärtus 1-le, seda suurem on mudeli sobivus muutujaga, mida püüame seletada. Ja vastupidi, mida lähemal nullile, seda vähem on mudel kitsam ja seetõttu ka vähem usaldusväärne.

Eelmises avaldises on meil murdosa. Niisiis, lähme osade kaupa. Kõigepealt analüüsime lugeja, see tähendab ülemist osa.

Neile, kes ei tunne dispersiooni väljendust, soovitan lugeda selle kohta käivat artiklit. Neile, kes seda teavad, võivad nad aru saada, et see on dispersiooni väljendus, kuid kahe põhimõttelise erinevusega.

Esimene erinevus on see, et Y-l on ümbermõõt või mida õpetajad didaktiliselt nimetasid "mütsiks". See mütsi detail on see, et Y on mudeli hinnang selle kohta, mis selgitavate muutujate järgi on väärt Y, kuid see pole Y tegelik väärtus, vaid Y hinnang.

Teiseks oleks vaja jagada T.-ga, mis muudel juhtudel on tähistatud kui N või vaatluste arv. Kuna nimetaja valem seda ka kannaks, eemaldame avaldise lihtsustamiseks mõlemast valemist nimetajad (alt). Nii on sellega lihtsam töötada.

Järgmisena teeme sama analüüsi nimetaja osaga (alumine osa).

Sel juhul on ainsaks erinevuseks algsest dispersioonivalemist selle nimetaja puudumine. See tähendab, et me ei jaga T-ga ega N.-ga. Sel viisil, kui R-ruutu või määramisteguri üldise avaldise kaks osa on selgitatud, näeme näidet.

VariatsioonikordajaLineaarne korrelatsioonikordajaRegressioonanalüüs

Määramisteguri tõlgendamine

Oletame, et tahame selgitada Cristiano Ronaldo löödud väravate arvu tema mängitud mängude arvu põhjal. Eeldame, et mida rohkem mänge mängitakse, seda rohkem väravaid ta lööb. Andmed on seotud viimase 8 hooajaga. Seega annab mudel pärast andmete väljavõtmist järgmise hinnangu:

Nagu graafikult näeme, on seos positiivne. Mida rohkem mänge on muidugi mängitud, seda rohkem väravaid ta hooajal lööb. Sobivus R-ruudu arvutuse põhjal on 0,835. See tähendab, et see on mudel, mille hinnangud sobivad päris muutujaga üsna hästi. Kuigi tehniliselt poleks see õige, võiksime öelda midagi sellist, et mudel seletab 83,5% tegelikust muutujast.

Määramiskoefitsiendi probleem

Määramiskoefitsiendi probleem ja põhjus, miks korrigeeritud määramistegur tekib, on see, et see ei karista ebaoluliste selgitavate muutujate lisamist. See tähendab, et kui mudelile lisatakse viis selgitavat muutujat, mis on vähe seotud eesmärkidega, mille Cristiano Ronaldo hooajal lööb, suureneb R-ruut. Seetõttu on paljud ökonomeetrilised, statistilised ja matemaatilised eksperdid R-ruutu kasutamise vastu kui tegeliku sobivuse headuse mõõdupuule.

Kohandatud määramistegur

Korrigeeritud määramistegur (korrigeeritud R-ruut) on mõõt, mis määrab protsendi, mida seletatakse regressiooni dispersiooniga selgitatud muutuja dispersiooni suhtes. See on sama, mis R-ruut, kuid erinevusega: Kohandatud määramistegur karistab muutujate lisamist.

Nagu me oleme varem öelnud, suureneb mudeli määramistegur isegi siis, kui meie kaasatavad muutujad pole asjakohased. Kuna see on probleem, on selle lahendamiseks korrigeeritud R ruut selline, et:

Valemis on N valimi suurus ja k selgitavate muutujate arv. Matemaatilise deduktsiooni abil on suuremad k väärtused, seda kaugemale on korrigeeritud R-ruut tavapärasest R-ruutust. Ja vastupidi, madalamate k väärtuste korral on lähemal keskmurd murdarvule 1 ja seetõttu on korrigeeritud R ruut ja normaalne R ruut sarnasemad.

Pidades meeles, et k on selgitavate muutujate arv, järeldame, et see ei saa olla null. Kui see oleks null, poleks mudelit. Vähemalt peame ühte muutujat selgitama teise muutujaga. Kuna k peab olema vähemalt 1, ei saa korrigeeritud R-ruut ja tavaline R-ruut olla sama väärtusega. Lisaks sellele on korrigeeritud R-ruut alati väiksem kui tavaline R-ruut.