Kolmogorovi test - Smirnoff (K-S)

Lang L: none (table-of-contents):

Kolmogorovi test - Smirnoff (K-S)
Kolmogorovi test - Smirnoff (K-S)
Anonim

Kolmogorovi-Smirnoffi (K-S) test on mitteparameetriline test, mille eesmärk on teha kindlaks, kas kahe erineva andmekogumi sagedus järgib sama jaotust nende keskmise ümber.

Teisisõnu, Kolmogorovi-Smirnoffi (K-S) test on test, mis kohandub andmete kujuga ja mida kasutatakse selleks, et kontrollida, kas kaks erinevat valimit järgivad sama jaotust.

Miks on see mitteparameetriline test?

Mitteparameetrilise omaduse ilu on see, et see sobib andmetega ja sellest tulenevalt jaotustega, mis võivad järgida andmete sagedust. Lisaks säästab see funktsioon meid eeldamast a priori mis jaotust valim järgib.

K-S testi tähtsus

Mitu korda on meile antud kaks valimit ja arvutatud Pearsoni korrelatsioonikordaja kaks korda mõtlemata? Teisisõnu, kui me tahame näha lineaarset suhet kahe andmekogumi vahel, oleks korrelatsiooni arvutamine õiglane?

See järeldus oleks tõene, kui kahe valimi jaotused järgivad normaalset jaotust. Korrelatsioonikordaja eeldab, et jaotused on normaalsed, kui selle eelduse vahele jätame, on korrelatsioonikordaja tulemus vale. Hüpoteesitestide ja usaldusintervallide puhul eeldame ka, et populatsioon jaotub normaaljaotuse kaudu.

Nagu kõigi statistikat hõlmavate hüpoteesitestide puhul, on ka statistiliselt oluliste tulemuste saamiseks oluline, et andmeid oleks palju. Võime nullhüpoteesi ekslikult tagasi lükata, kuna valim on väike. Lisaks on oluline, et sellel valimil oleks mõned äärmuslikud juhtumid (kõrvalised näitajad(inglise keeles), et anda testi tulemusele järjepidevus.

Katsemenetlus

Järgmiste sammude protseduur.

Hüpotees

Esimene samm on kontrollida, kas mõlemal proovil on sama jaotus. Selleks teostame hüpoteesitesti, eeldades, et mõlemal valimil on sama jaotus alternatiivse hüpoteesi suhtes, et nad on erinevad.

Statistiline

Töötame kahe valimi F kumulatiivse jaotuse funktsioonidega1(x) ja F2(x):

Ära paanitse! Analüüsime ülaltoodud valemit rahulikult:

  • Valemi oluline osa on erinevuse märk (-). Otsime jaotuste vertikaalseid erinevusi. Niisiis lahutame mõlemad kumulatiivsed jaotusfunktsioonid.
  • The operaator "max". Oleme huvitatud suurima või maksimaalse erinevuse leidmisest, et näha, kui erinevad kaks jaotust võivad olla.
  • The absoluutväärtus. Kasutame absoluutväärtust, et operaatorite järjekord ei muudaks tulemust. Teisisõnu pole oluline, millisel F (x) -il on negatiivne märk:

Kriitiline väärtus

Suurte proovide puhul on ligikaudne K-S kriitiline väärtus, mis sõltub olulisuse tasemest (%):

Kus1 ja n2 on F-valimi valimi suurus1(x) ja F2(x).

Mõned arvutatud kriitilised väärtused:

Tagasilükkamise reegel

Rakendus

Väga sageli tahame testida, kas kaks jaotust on üksteisest piisavalt erinevad, kui tahame koostada ennustusstsenaariume (töötame kahe valimiga) või kui tahame hinnata, milline jaotus sobib andmetega kõige paremini (töötame ainult ühe valimiga).