Klasteranalüüs - mis see on, määratlus ja mõiste

Klasteranalüüs on mitmemõõtmeliste statistiliste tehnikate kogum, mille eesmärk on grupeerida juhtumite või üksikisikute kogum klastriteks või klastriteks.

Klastrianalüüs on seega teatud tüüpi statistiline rühmitus. Eesmärk on muuta igas klastris olevad andmed üksteisega võimalikult sarnaseks ja teiste rühmade suhtes võimalikult erinevaks. Seda saab teha ka muutujatega.

Andmete teisendamine klastrianalüüsis

Üks probleeme, millega andmete rühmitamisel kokku puutume, on see, et andmed on mõnikord erinevates mõõtühikutes. Sel põhjusel tuleb teha klastrite-eelne analüüsietapp, mis võimaldab klastreid.

Levinuim meetod on standardimine. Seda kasutatakse andmete teisendamiseks nii, et nende mõõtühikud oleksid sarnased. Tuleb arvestada kahe reegliga, binaarseid muutujaid ei standardiseerita ja kui need on kategoorilised, muutuvad nad binaarseteks (kohalolek / puudumine).

Klastrianalüüsi meetodid

Klastrianalüüsi tegemiseks on palju meetodeid, kuid veebisaidil Economy-Wiki.com näeme meid iseloomustava lihtsuse põhimõtet järgides kõige asjakohasemat skemaatiliselt.

Hierarhilised meetodid

Esimene liigitus oleks hierarhilised või mittehierarhilised meetodid. Endised rühmitavad üksikisikud hierarhilistesse faasidesse (sellest ka nende nimi). Nii vahetab rühma korraga ainult üks objekt, ülejäänud jäävad samasse kohta.

Need liigitatakse omakorda:

Aglomeratiivsed meetodid

See koosneb üksikisikute rühmitamisest iga kord vähem klastritesse. See algab rühmade arvust, mis on võrdne juhtumite arvuga, ja väheneb.

Tuntumad on:

  • Lähima naabri meetod: Sellisel juhul kasutate andmete rühmitamiseks algoritmi. Mida otsite, on minimaalne kaugus lähimate isikute vahel. See on väga tundlik andmete suhtes, mis võivad põhjustada nn müra. Kaugema naabri meetod on sarnane.
  • Keskmine meetod rühmade vahel: See teeb grupi üksikute ja eriti ühe üksiku vahelise kauguse keskmise arvutamise. On väga kasulik vähendada nn müra.
  • Wardi meetod: See lisab teabe kadumise vältimiseks iga üksiku ja tema klastri keskmise vaheliste hälvete ruudud. See on üks tuntumaid ja sellel on meetodi eelised, mis põhinevad keskmisel, kuid suuremal diskrimineerimisjõul.

Dissotsiatiivsed meetodid

Sel juhul on see, mida teete, lahku. See algab ühest klastrist ja jagunemised pakutakse välja rea ​​nõuete alusel.

Kõige tavalisemad on:

  • Grupi keskmise, lähima ja kõige kaugema naabri meetodi vahel: Need kolm meetodit sarnanevad eelmise juhtumiga, kuid kasutavad dissotsiatiivset meetodit. See tähendab, et seekord on see, mida teeme, eraldi ja mitte grupeerimine.
  • Centroidi meetod: Seda kasutatakse laialdaselt rajatiste asukoha optimeerimise probleemides. Sobivaimate leidmiseks kasutage seda tüüpi analüüse.

Mittehierarhilised meetodid

Sel juhul alustavad nad eelseadistatud lahendusest. See on klasteranalüüsi lähtepunkt. Sel viisil luuakse rühmad eelnevalt ja iga juhtum paigutatakse ühte neist, sõltuvalt selle omadustest. Omakorda võime need jagada teistesse alarühmadesse.

  • Ümberpaigutamise meetodid: Kõige asjakohasemad on tsentroidmeetodid, näiteks k-keskmised. Medioidide omad, näiteks PAM. Või dünaamiliste pilvede oma.
  • Otsesed meetodid: Kõige olulisem on plokkklasterdamine, mida kasutatakse laialdaselt andmekaevanduses.
  • Taandavad meetodid: Need põhinevad faktoranalüüsil.
  • Tiheduse otsimise meetodid: Ühelt poolt võiksid olla tüpoloogilised lähenemised, näiteks modaalne analüüs. Teiselt poolt on meil tõenäosuslikud, nagu Hundi omad.

Klastri analüüsi näited

Vaatame lõpuks mõningaid näiteid klasteranalüüsi rakendustest.

  • Kujutame ette, et meil on rühm riike, mida soovime rühmitada teatud makromajanduslike muutujate, näiteks inflatsiooni või töötuse põhjal. Seda tüüpi analüüsi abil saame teha homogeenseid rühmi, näiteks enam-vähem arenenud riike.
  • Teine näide võib olla teatud sotsiodemograafiliste tunnustega tarbijate seeria. Idee on luua gruppe, millel on sarnased isikud ja mis on omakorda üksteisest väga erinevad.
  • Kuid lisaks majandusele on klastrianalüüs kasulik ka teistes teadustes. Näiteks bioloogias, liikide klassifitseerimiseks või geoloogias, teha sama mineraalidega.

Te aitate arengu ala, jagades leht oma sõpradega

wave wave wave wave wave