lauantai 13. heinäkuuta 2013

Vielä ryhmittelyä...

Aikoinaan monimuuttajamenetelmäkurssilla opittiin, että aineistoa voi luokitella kahteen suuntaan: joko muuttujia keskenään (viime viestin faktorianalyysi) tai havaintoja keskenään. Valitettavasti kurssista on useita vuosia aikaa, joten olen joutunut kaivamaan kirjoista esille vanhoja muistijälkiä. Katsotaan meneekö oikein.

Eli tarkoitus olisi katsoa muodostavatko vastaajat tietynlaisia ryhmiä keskenään. Ilkka Mellinin (2008) mukaan ryhmittelyanalyysi on aina subjektiivista, koska sen teoreettinen perusta ei ole kovin vahva. Tarkoitus olisi ryhmitellä havainnot mahdollisimman erillisiksi kasoiksi. Käytämme
K-keskiarvomenetelmää, koska sen pitäisi toimia suuremmallakin aineistolla. Joudumme kuitenkin aluksi päättämään kuinka montaa ryhmää olisi oletettavissa.

Käytetään tässä hyväksi faktorianalyysissä saatuja tuloksia. Sen mukaan harrastuneisuuden perusteella löytyi Ropeconista neljä kävijäryhmään: "roolipelaajat", "larppaajat", "pelaajat" sekä "cossaajat". Eli määritellään ryhmät neljään.

SPSS antaa seuraavanlaisen tuloksen meille:

Final Cluster Centers               
                                                                                     Cluster               
                                                                  1              2              3            4
REGR factor score   1 for analysis 1    -1,05579    ,08060    ,89859    -,00543
REGR factor score   2 for analysis 1    -,64097    -,02334    -,72189    1,02861
REGR factor score   3 for analysis 1    -,23492    1,24762    -,61982    -,49512
REGR factor score   4 for analysis 1    ,77293    -,26117    -,12412    -,21895


ANOVA                       
    Cluster        Error        F    Sig.
    Mean Square    df    Mean Square    df       
REGR factor score   1 for analysis 1    57,599    3    ,585    409    98,486    ,000
REGR factor score   2 for analysis 1    71,117    3    ,486    409    146,422    ,000
REGR factor score   3 for analysis 1    81,071    3    ,413    409    196,450    ,000
REGR factor score   4 for analysis 1    22,276    3    ,844    409    26,395    ,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.                       

Klusteri 1 kuuluisi "cossaajat", kahteen "pelaajat", kolmeen "roolipelaajat" ja neljään "larppaajat" (jatkuu)

Ei kommentteja:

Lähetä kommentti