Võõrväärtuste tuvastamine normaaljaotuse abil

Lang L: none (table-of-contents):

Anonim

Võõrväärtuste tuvastamine normaaljaotuse kaudu on protsess, mis hõlmab standardhälbe künnise määratlemist ja millega kavatsetakse leida valimi äärmuslikud väärtused.

Teisisõnu tähendab kõrvalekallete tuvastamine normaaljaotuse kaudu andmekogumi äärmuslike väärtuste leidmist standardiseeritud normaalvalemi kaudu.

  • Väärtused äärmused nimetatakse kõrvalised näitajad inglise keeles.
  • Väärtused sisemine nimetatakse siseringi inglise keeles.

Kõrvaliste visuaalne tuvastamine võib olla võimalus, kui teil on väga vähe andmeid. Andmebaasidega töötamisel on väga ebapraktiline, kui peate hälbeid käsitsi leidma. Selle probleemi lahendamiseks võime arvutada, milliseid väärtusi peetakse äärmuslikeks, kui võrrelda neid kõrvalekallete lävega.

Normaaljaotuse korral loetakse väärtust äärmuslikuks, kui see on keskmisest 3 standardhälbe kaugusel. Kuna normaaljaotusel on 2 saba, peame arvestama, et seda saab suumida nii negatiivsest kui ka positiivsest küljest.

Valem kõrvalekallete tuvastamiseks normaaljaotuse abil

Vaatluste komplekti saab väljendada eelmisel viisil, kus x on keskmine väärtus, mille üle väärtused võnkuvad, ja tähistab nimetatud väärtuste võnkumise hajumist. Teisisõnu, sigma on vaatluste kaugus keskmisest väärtusest.

Korrutamistegur määrab, kas tegemist on väljapoole jääva või siseringiga. Kui z võtab väärtused 3 või -3, on normaaljaotuse järgi vaatlus y väljaarvatud.

Et teada väärtust z kasutame eelmist võrrandit:

  • Kui z> = 3 või z = <-3, siis võime normaaljaotuse järgi seda öelda Y see on äärmuslik väärtus või kõrvalmõju.
  • Kui z <3 või z <-3, siis võime normaaljaotuse järgi seda öelda Y on sisemine väärtus või insaider.

Normaalne standard

Kas ülaltoodud võrrand on tuttav?

Täpselt, see on vaatluse väljendus, mis järgib normaalset jaotust, kui see on standardiseeritud või tüpiseeritud. Seda nimetatakse sel viisil, kuna jagamisel standard- või standardhälbega väljendatakse lugeja erinevust kõrvalekalletena.

Sel põhjusel saame seostada hälbe väärtusi z ja seega saab seda osta 3 hälbe künnisega.

Näide

Leidke normaaljaotuse järgi järgmiste vaatluste äärmuslikud väärtused:

Esitame tähelepanekuid graafikul:

Juba algusest peale näeme, et väärtus, mis on kõige kaugem muust, võib suure tõenäosusega olla väär.

Kõigepealt arvutame välja keskmise ja standardhälbe:

x = keskmine = 5,8

sigma = standardhälve = 10,51

Seejärel asendame väärtused valemiga ja arvutame väärtuse z iga vaatluse jaoks:

Ülaltoodud väärtused on sigma korrutustegurid, st z. Kõik, mis on suurem kui 3 või väiksem kui -3, on äärmuslik väärtus.

Näeme, et väärtus z mis ületab 3 standardhälvet, vastab vaatlusele 49.

Seetõttu oleks andmekogumi äärmuslik või välimine väärtus 49.