Kvantiil on see punkt, mis jagab juhusliku muutuja jaotuse funktsiooni korrapärasteks intervallideks.
Seetõttu pole andmete statistiline eraldamine jaotusest eraldamine. Muidugi tuleb täita, et rühmad oleksid võrdsed. Sel põhjusel on erinevaid kvantiile, nagu hiljem näeme, sõltuvalt nende tehtud partitsioonide arvust.
Need on väga kasulikud paljudes praktilistes rakendustes, näites näitame ühte.
Kvantiili arvutamise vorm
Kvantiile saab arvutada parameetrilisest ja mitteparameetrilisest vaatenurgast. Vaatame nii üksikasjalikumalt kui ka nn "kvantiili funktsiooni".
- Parameetriline: Neid kasutatakse jaotustes, mille kuju me teame. See tähendab, et jaotus on normaalne, ühtlane, eksponentsiaalne ja nii edasi. Sel viisil eeldatakse, et see on teada ja ka selle peamised parameetrid (aritmeetiline keskmine ja dispersioon).
- Mitteparameetriline: See sobib väikeste proovide jaoks, kus selle täpset kuju on raske teada ja seetõttu ei tea me selle jaotuse funktsiooni. See meetod annab valimi suurenedes eelmisega sarnased väärtused ja seetõttu on mõlema kasutamine ükskõikne.
- Kvantiili funktsioon: Seisame silmitsi tõenäosusliku arvutusvormiga. Eesmärk on arvutada väärtus, millel on jaotusfunktsioonis teatud tõenäosus. Me ei lähe matemaatilistesse küsimustesse, mis raskendavad mõistet.
Kõige sagedasemad kvantiilid
Näitame, millised on statistikas kõige enam kasutatavad kvantiilid. Enamikku neist kasutatakse tavaliselt selleks, et oleks võimalik andmete jaotust üksikasjalikult analüüsida. Lisaks on selle teine kasutusotstarve andmete eraldamine rühmadesse, saades valida kõrgeima või madalaima. Näites näeme seda üksikasjalikumalt.
- Kvartiil: Eraldage väärtused neljaks võrdseks rühmaks ja seal on kolm kvartiili. See on kõige sagedasem. Kvartiil üks (Q1) on kõige madalam ja kolmas kvartiil (Q3) on suurim. Teiselt poolt vastab kvartiil kaks (Q2) mediaanile (Me), mis on positsioonistatistika, mis jagab andmete jaotuse pooleks. Kvantiili väärtused oleksid 0,25 (Q1), 0,5 (Q2) ja 0,75 (Q3).
- Kvintiil: Sarnaselt eelmisega on see harvem ja jagab andmed viieks võrdseks osaks. Seetõttu on neli kvintiili. Kvantiili väärtused oleksid sel juhul 0,20, 0,40, 0,60, 0,80.
- Detsile: Sel juhul jagunevad need kümneks osaks ja seetõttu on üheksa detsiili. Ka see pole liiga sagedane. Nende väärtused oleksid 0,1 kuni 0,9.
- Protsentiilid: Seisame silmitsi variandiga, kus jaotus jaguneb sajaks võrdseks osaks. See võib huvi pakkuda väga suurte proovide puhul. Nende väärtused jäävad vahemikku 0,01 kuni 0,99.
Kvantiili näide
Vaatame näidet, kus meil on rida andmeid teatud valla elanike sissetulekute kohta. Oleme arvutanud kolm kõige tüüpilisemat kvartiili ja kolm detsiili. Lisame kasutatud valemid, võttes arvesse, et detsiilide puhul kasutame samaväärsust protsentiilides. Pidage meeles, et Q2 ja D5 andmed on samaväärsed mediaaniga.
Me võime täheldada, et kõige vähem soodsates tingimustes 25% (1. kvartal) esindavate inimeste sissetulek on 2900. Detsili suhtes on kõige vähem saavate inimeste 10% (D1) sissetulek 2800. Sama tõlgendus tehakse ka ülemustega, kuid vastupidiselt. 25% (3. kvartal), kes teenivad kõige rohkem, saavad 4100 sissetulekut ja 10% 4800 sissetulekut. Kvantiil peegeldab seetõttu asjakohast teavet muutuja kohta lisateabe saamiseks.