4. Rozdział czwarty. Próba odtworzenia modelu na podstawie

Transkrypt

4. Rozdział czwarty. Próba odtworzenia modelu na podstawie
Mariusz Grzęda,
Zróżnicowanie i ewolucja systemów wartości na świecie w koncepcji Ronalda Ingleharta – próba metodologicznej krytyki
Praca magisterska na kierunku Socjologia
Warszawa, 2006
4. Rozdział czwarty. Próba odtworzenia modelu na
podstawie
alternatywnej
miary
związku
pomiędzy
zmiennymi.
Do tej pory podejmowane były próby zweryfikowania rozpatrywanego modelu
zróżnicowania systemów wartości przyjmując (podobnie jak Inglehart), że poziom
pomiaru wszystkich zmiennych w tym modelu jest przynajmniej interwałowy. W
rzeczywistości jednak zmienne uwzględnione w modelu Ingleharta reprezentują
porządkowy poziom pomiaru i w związku z tym posługiwanie się w analizach
czynnikowych współczynnikiem korelacji liniowej Pearsona obliczanym dla danych
porządkowych nie jest podejściem w pełni poprawnym. Innymi słowy podejście takie
łamie założenia dotyczące typu danych, które można wykorzystywać w analizie
czynnikowej. W tym rozdziale problem ten zostanie szerzej przeanalizowany.
Wskazana zostanie również alternatywna miara korelacji pomiędzy zmiennymi
wskaźnikowymi mierzonymi na poziomie porządkowym, której zastosowanie w
analizie czynnikowej nie narusza podstawowych założeń pomiarowych, dzięki czemu
uzyskane wyniki analizy czynnikowej będą bardziej wiarygodne i nieobciążone
błędem wynikającym z naruszania założeń pomiarowych.
4.1 Poziom pomiaru zmiennych w badaniach sondażowych
Założenie o wspomnianym powyżej interwałowym i porządkowym poziomie
pomiaru nawiązuje do koncepcji S.S. Stevensa, która klasyfikuje dane (zmienne)
według rodzaju dopuszczalnych147 przekształceń dokonywanych na wartościach
poszczególnych zmiennych oraz według relacji zachodzących w zbiorze wartości
tych zmiennych. Koncepcja ta wskazuje, że istnieją cztery poziomy pomiaru:
nominalny, porządkowy, interwałowy oraz ilorazowy.
Wartości zmiennych nominalnych oznaczają klasyfikację obiektów obserwacji
według następującej logiki: obiekt posiada daną cechę lub jej nie posiada. Każde
dwa obiekty można zaklasyfikować albo jako różniące się pod względem posiadania
pewnej cechy bądź nie różniące się pod tym względem. Pomiędzy obiektami
występuje relacja równoważności148. Dopuszczalne transformacje na zmiennych
nominalnych to przekształcenia różnowartościowe, czyli takie, które różnym
147
148
Czyli nie prowadzących do utraty informacji.
Czyli symetryczność i przechodniość
127
argumentom przypisują różne wartości. Innymi słowy wszystkie takie przekształcenia,
które zachowują wyjściowe relacje równości i różności pomiędzy obiektami są tu
dozwolone.
Kolejny
poziom
pomiaru
stanowią
zmienne
porządkowe.
Dane
reprezentowane na porządkowym poziomie pomiaru są uporządkowane ze względu
na stopień posiadania danej cechy. Podobnie jak w przypadku skali nominalnej i w
tym przypadku o każdych dwóch obiektach można powiedzieć czy są od siebie różne
czy takie same pod względem mierzonej cechy. Jednak nie tylko. Można bowiem
również określić porządek kategorii reprezentujących mierzoną cechę, to znaczy
wskazać relację większości (bądź mniejszości) łączącą dwie różne kategorie. A
zatem w tym przypadku obiekty są pogrupowane w poszczególne kategorie, które
oznaczają pewien porządek. Zmienne mierzone na poziomie porządkowym można
przekształcać tylko w taki sposób, który zachowuje ten porządek. Należy tu
podkreślić, że wartości skali porządkowej nie mówią nic o odległości pomiędzy
poszczególnymi kategoriami. Są bowiem tylko liczbami porządkowymi, określającymi
dla każdej kategorii jej rangę (miejsce w porządku). Nie wolno zatem wartości
zmiennych porządkowych do siebie dodawać, odejmować ani mnożyć. Jedynym
dopuszczalnym przekształceniem149 danych porządkowych jest dodawanie do każdej
wartości zmiennej pewnej stałej (X+s).
Kolejny
poziom
pomiaru
zmiennych
stanowi
poziom
interwałowy
(przedziałowy). O obiektach, którym przypisywane są wartości na skalach
interwałowych, można mówić nie tylko w kategoriach równości-różności, a także „jest
większy niż” lub „mniejszy niż” (pod względem danej cechy), lecz także można
formułować twierdzenia na temat wielkości zaobserwowanych różnic. Tego rodzaju
zmienne umożliwiają dokładne określenie jaka jest różnica pomiędzy obiektami pod
względem pewnej cechy. Przykładowo można określić, że wartość przypisana
obiektowi A jest pod względem danej cechy mniejsza (albo większa) o x od wartości
obiektu B. Nie wolno natomiast stwierdzić, że wartość A jest y-razy mniejsza (albo
większa) od wartości obiektu B. Wynika to z braku istnienia zera absolutnego150 w
skalach interwałowych. W przypadku skal interwałowych na wartościach zmiennych
dopuszczalne są przekształcenia typu liniowego (tX+s).
149
przekształcenie ściśle monotoniczne rosnące.
przykładem skali interwałowej może być temperatura Celsjusza. Punkt zerowy na tej skali nie
oznacza braku temperatury – czyli nie ma charakteru naturalnego (bezwzględnego, absolutnego).
150
- 128 -
Następny poziom pomiaru zmiennych stanowi poziom ilorazowy (stosunkowy).
Zakłada się, że skale tego rodzaju mają naturalny punkt zerowy. Ponadto o
wartościach tego typu zmiennych można formułować twierdzenia o tym, że obiekt A
ma wartości pewnej zmiennej mierzonej na poziomie ilorazowym x razy
większe/mniejsze od B. Oprócz tego można o obiektach klasyfikowanych za pomocą
tego rodzaju skal formułować twierdzenia na temat równości (różności), większości
(mniejszości), oraz różnicach o pewną wartość. Wartości skal ilorazowych podlegają
przekształceniu podobieństwa (tX).151
W przypadku badań sondażowych (w tym również badań WVS) badacze mają do
czynienia ze zmiennymi, które najczęściej są mierzone na skalach nominalnych lub
porządkowych. Znacznie rzadziej natomiast poziom pomiaru jest interwałowy lub
ilorazowy. Kwestionariusz wywiadu najczęściej jest zorganizowany w ten sposób, że
respondent otrzymuje od ankietera pytanie i jest proszony o odpowiedź. Na zadane
pytanie respondent albo może odpowiedzieć w sposób dowolny (pytanie otwarte)
albo w oparciu o gotowe odpowiedzi (pytanie zamknięte). Warto przypomnieć, że w
przypadku 10 pytań uwzględnionych w modelu zaproponowanym przez Ingleharta
wszystkie zmienne reprezentują odpowiedzi na pytania zamknięte. Odpowiedzi na te
pytania były wyrażane w oparciu o skale zawierające werbalne etykiety lub
ewentualnie liczby całkowite. Zmienne utworzone z odpowiedzi na te pytania mają
charakter porządkowy, ponieważ wszystkie możliwe kategorie odpowiedzi były
uporządkowane ze względu na cechę/opinię/wartość, którą mierzyły. Oznacza to, że
nie można w tym przypadku określić przykładowo tego o ile dany respondent
preferuje pewną opinię nad inną. Na tej podstawie można jedynie stwierdzić (1.) że
osoba odpowiadająca na dane pytanie preferuje wybraną przez siebie odpowiedź
nad innymi możliwościami oraz (2.) że osoba ta w porównaniu z inną wykazuje
większe, mniejsze bądź równe nasilenie danej cechy/wartości/opinii.
4.2 Problem naruszania założeń pomiarowych
W sytuacji, gdy zmienne wskaźnikowe mają charakter porządkowy posługiwanie
się miarą współczynnika korelacji liniowej Pearsona w analizie czynnikowej nie jest w
pełni poprawne, ponieważ zarówno ten współczynnik jak i sama analiza czynnikowa,
151
Renate Mayntz, K. Holm, Peter Huebner, Wprowadzenie do metod socjologii empirycznej, PWN,
Warszawa 1985, s. 48-50 oraz Henryk Banaszak Sławomir Nowotny, Statystyka (skrypt na prawach
rękopisu), Warszawa 1984, zeszyt II s.35
- 129 -
zakłada, że zmienne są przynajmniej na poziomie interwałowym (od tego poziomu
można wykonywać przekształcenia liniowe). Jeżeli zestawimy z tym fakt, że
wszystkie zmienne obserwowalne rozpatrywane w modelu Ingleharta są mierzone na
poziomie porządkowym to okazuje się, że zastosowane podejście nie jest ani
uprawnione metodologicznie ani – jak pokazują badania symulacyjne152 – optymalne.
Kwestia optymalności jest tu rozumiana jako przyjęcie takiej miary związku
pomiędzy zmiennymi, która zapewni że wykonana na jej podstawie analiza
czynnikowa wygeneruje rezultaty „najbliższe” rzeczywistym (prawdziwym) relacjom
pomiędzy rozpatrywanymi zmiennymi.
Wspomniane analizy symulacyjne pokazują, że kwestia doboru odpowiedniej
(adekwatnej do danych) miary korelacji pomiędzy zmiennymi wydaje się sprawą
bardzo istotną i może wpływać na jakość wyników analizy czynnikowej.
Przeprowadzone przez Karla G. Joreskoga i jego współpracowników badania
koncentrują się między innymi na kwestiach wrażliwości wyników analizy
czynnikowej na naruszanie założeń dotyczących skal pomiarowych.
Główną inspiracją i zarazem punktem wyjścia tego eksperymentu było
stwierdzenie,
że
w
naukach
społecznych
większość
wykonywanych
analiz
czynnikowych nie spełnia teoretycznych założeń poziomu pomiaru zmiennych. Jedną
z bardziej rozpowszechnionych praktyk, łamiącą zasady sformułowane przez S.S.
Stevensa jest „nadużywanie” współczynnika korelacji liniowej w przypadku
zmiennych, których poziom pomiaru nie jest (przynajmniej) interwałowy lecz
porządkowy. Ponadto autorzy cytowanego artykułu wskazywali także na brak prac i
analiz podejmujących temat adekwatności stosowania różnych miar związku między
zmiennymi w analizie czynnikowej. Artykuł Joreskoga i innych wypełnia tę lukę i
odpowiada na pytanie, który ze znanych współczynników korelacji jest miarą
najbardziej
odpowiednią
do
prowadzenia
analiz
czynnikowych
na
danych
występujących w naukach społecznych.
Przedmiotem analiz symulacyjnych były cztery różne współczynniki korelacji
zastosowane do tych samych danych. Zastosowano następujące miary związku
pomiędzy zmiennymi: 1. r – współczynnik korelacji liniowej Pearsona; 2. r* –
współczynnik korelacji polichorycznej; 3. rs – współczynnik korelacji rangowej
152
Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Sensitivity of confirmatory maximum
likelihood factor analysis to violations of measurement scale and distributional assumptions, Journal
of Marketing Research , vol. XXIV (May 1987), s. 222-228
- 130 -
Spearmana; 4.
τb
- współczynnik korelacji rangowej Kendalla. Pierwszy z
wymienionych współczynników to dobrze znana i powszechnie stosowana miara
związku
liniowego
odpowiednia
dla
zmiennych
przynajmniej
na
poziomie
interwałowym. (Oznacza to, że jej stosowanie do zmiennych na porządkowym
poziomie pomiaru jest niepoprawne). Natomiast dwie ostatnie miary (3. i 4.) to
współczynniki korelacji używane dla zmiennych porządkowych, porównujące rangi
poszczególnych
przypadków.
Natomiast
trzecia
z
analizowanych
miar
–
współczynnik korelacji polichorycznej, jest miarą mniej znaną, która ze względu na
wyniki badań Joreskoga i innych zostanie szerzej omówiona w następnym
podrozdziale.
Omawiany eksperyment symulacyjny polegał na tym, że autorzy przy pomocy
specjalnego oprogramowania wygenerowali obserwacje, które spełniały założone
warunki modelu czynnikowego. Założono model z jednym czynnikiem wspólnym i
czterema wskaźnikami. Dane dla wskaźników były wygenerowane w oparciu o
wcześniej założone wartości ładunków czynnikowych (czyli wag, współczynników
liniowych
informujących
o
związku
pomiędzy
wartościami
czynnikowymi
a
poszczególnymi zmiennymi). W konsekwencji uzyskiwane dane dla wskaźników
miały charakter ciągły. Aby odtworzyć sytuację jaką często spotyka się w badaniach
sondażowych, gdzie zwykle mamy do czynienia ze skalami składającymi się z
niewielkiej liczby dyskretnych (nieciągłych) kategorii, oznaczających kolejne poziomy
wartości zmiennej, wygenerowane we wcześniejszym kroku dane kategoryzowano w
taki sposób, aby uzyskane rozkłady posiadały pięć uporządkowanych kategorii. W
ten sposób zapewniono, że sytuacja przypominała częsty w badaniach społecznych
przypadek, kiedy to pomiar jest prowadzony na kilkustopniowych skalach z
werbalnymi etykietami wskazującymi respondentowi porządek oferowanych mu
odpowiedzi. Analizę czynnikową metodą największej wiarygodności zawsze
wykonywano dwukrotnie. Najpierw dla danych wygenerowanych na poziomie
ciągłym, a następnie dla danych pokategoryzowanych – na poziomie porządkowym.
W pierwszej kolejności
(dla danych ciągłych) estymowano parametry modelu w
oparciu o macierz współczynników korelacji Pearsona. Następnie po kategoryzacji
zmiennych (do pięciu kategorii) znowu szacowano parametry modelu czynnikowego,
używając wówczas jednej z czterech wyżej wspomnianych miar korelacji. Symulacja
została przeprowadzona w kilku wariantach. Obok miar korelacji manipulowano
- 131 -
również innymi uznanymi za istotne aspektami danych i modelu: – wielkością
zakładanych ładunków czynnikowych – wielkością próby (czyli liczbą przypadków
poddawanych analizie) – typem rozkładów (pokategoryzowanych) zmiennych
wskaźnikowych.
Wyniki przeprowadzonych analiz czynnikowych porównywano między innymi pod
względem parametrów uzyskanych modeli czynnikowych (wartości ładunków
czynnikowych), statystyk informujących o dobroci dopasowania modelu do danych
oraz przypadków, gdy odnalezienie rozwiązania czynnikowego metodą największej
wiarygodności okazywało się niemożliwe (noncovergence) lub błędne (improper
solutions). Wyniki przeprowadzonego eksperymentu pokazują, że w przypadku
danych po kategoryzacji do kilku wartości posługiwanie się współczynnikiem korelacji
polichorycznej daje najlepsze rezultaty rozumiane jako największa zbieżność
wyników analizy czynnikowej z danymi prawdziwymi. Innymi słowy uzyskane
wartości ładunków czynnikowych są wówczas najbliższe wartościom założonym na
początku, na podstawie których były generowane dane. Do określania stopnia
dokładności (accuracy) uzyskanych wyników posłużono się dwiema miarami.
Pierwsza to błąd wynikający z kategoryzacji czyli procedury przekształcenia danych o
charakterze ciągłym (continuous) w zmienne o wartościach dyskretnych (discrete)
(Categorization Bias – CB). Błąd ten został określony jako różnica pomiędzy
ładunkiem czynnikowym wyznaczonym na podstawie zmiennych ciągłych a
ładunkiem wyznaczonym na podstawie danych po kategoryzacji (dyskretnych).
Natomiast druga miara to błąd kwadratowy (Squared Error – SE). Miara ta została
zdefiniowana jako podniesiona do kwadratu różnica pomiędzy prawdziwym
(założonym) ładunkiem czynnikowym a ładunkiem czynnikowym wyznaczonym na
podstawie danych po kategoryzacji. Przeprowadzone porównania koncentrowały się
przede wszystkim na określeniu wpływu jaki ma przyjmowanie różnych miar korelacji
pomiędzy zmiennymi na odchylenie uzyskanych ładunków czynnikowych od wartości
prawdziwych. Analiza przeciętnych wartości obydwu powyżej zdefiniowanych miar
błędów pokazała, że zastosowanie (do danych po kategoryzacji) współczynniki
korelacji polichorycznej (r*) generują ładunki czynnikowe, które w najmniejszym
stopniu są obciążone błędami. W większym stopniu obciążone błędami okazały się
ładunki czynnikowe wygenerowane na podstawie współczynników korelacji liniowej
(r) i specjalne współczynniki dla zmiennych porządkowych współczynnik korelacji
- 132 -
rangowej Spearmana i Kendalla (odpowiednio rs i
τ b ).
Autorzy eksperymentu
zwracają uwagę, że przyczyną zaobserwowanych różnic był fakt, że współczynniki
korelacji polichorycznej (obliczone dla danych po kategoryzacji) jak żadne inne
generowały oszacowania związków pomiędzy wskaźnikami najbliższe wartościom
rzeczywistym. Prawidłowość ta miała miejsce bez względu na wielkość próby a także
przyjęte typy rozkładów zmiennych wskaźnikowych. Pozostałe miary korelacji
systematycznie niedoszacowywały natężenia tych związków. W konsekwencji,
analizy czynnikowe prowadzone w oparciu o silniej obciążone błędami miary
skorelowania
zmiennych
dawały
ładunki
odbiegające od wartości rzeczywistych.
czynnikowe
w
większym
stopniu
153
Innym bardzo interesującym aspektem symulacji przeprowadzonej przez
Joreskoga i innych badaczy jest wynik pokazujący, że statystyka
χ2
– używana jako
miara jakości modelu czynnikowego paradoksalnie częściej sugeruje odrzucanie
wyników analiz czynnikowych, które dawały prawidłowe lub bliskie prawidłowym
szacunki
ładunków
czynnikowych.
Dotyczy
to
przede
wszystkim
analiz
czynnikowych, które opierały się na współczynniku korelacji polichorycznej – tym
właśnie
który
(jak
wspomniano
wyżej)
zapewniał
największą
zgodność
oszacowanego modelu z prawdziwymi relacjami. Co więcej, dla analiz czynnikowych
opartych na współczynniku korelacji
τ b , który we wszystkich wariantach symulacji
dawał wyniki najbardziej odbiegające od rzeczywistych relacji, statystyka
χ2
przyjmowała przeciętnie najmniejsze wartości – najczęściej sugerujące przyjmowanie
modelu. Zdaniem autorów tego badania fakt ten oznacza, że korzystanie z testu
χ2
zwiększa prawdopodobieństwo odrzucania prawidłowych modeli czynnikowych i nie
odrzucania fałszywych.154 Ujmując to w kategoriach statystycznej weryfikacji hipotez
można zatem stwierdzić, że wyniki eksperymentu sugerują, iż posługiwanie się tą
statystyką naraża badacza na częstsze popełnianie błędów zarówno I rodzaju
153
Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Op. cit., s. 222-224
Warto również w tym punkcie dodać, że ta sama prawidłowość dotyczy innych statystyk, służących
do oceny modelu. Autorzy eksperymentu zajmują się następującymi statystykami: a. GFI - indeks
dobroci dopasowania (Goodness-of-Fit Index). Przyjmuje wartości w granicach od 0 do 1.
Teoretyczne może jednak również przyjmować nic nie znaczące wartości negatywne; b. AGFI –
dostosowany indeks dobroci dopasowania (Adjusted Goodness-of-Fit Index). Używa się w tej mierze
kwadratów średnich a nie tak jak w poprzedniej mierze sum kwadratów. c. RMR – pierwiastek ze
średniego kwadratu reszt. Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Op. cit., s. 226
154
- 133 -
(polegających na odrzucaniu hipotezy zerowej, która w rzeczywistości jest
prawdziwa) jak i II rodzaju (polegających na nieodrzucaniu hipotezy zerowej, która w
rzeczywistości jest fałszywa). W tej sytuacji posługiwanie się tymi miarami w analizie
czynnikowej należy uznać, za dość ryzykowne. Warto również zauważyć w tym
miejscu, że wniosek ten potwierdza niewielką przydatność testu
czynnikowej
przeprowadzanej
metodą
największej
χ2w
wiarygodności,
analizie
którą
zasygnalizowano również w podrozdziale A1.
Podsumowując ten punkt rozważań można zwrócić uwagę na dwie sprawy. Po
pierwsze gdy – tak jak w przypadku danych sondażowych – mamy do czynienia ze
zmiennymi na poziomie porządkowym posługiwanie się miarą korelacji liniowej
Pearsona narusza założenia teoretyczne sformułowane przez S. Stevensa i sprawia,
że przeprowadzanie analizy czynnikowej na podstawie macierzy współczynników
Pearsona jest procedurą, która nie ma uzasadnienia metodologicznego. Z drugiej
strony wyniki przytoczonego wyżej eksperymentu symulacyjnego, pokazują że
powszechnie znane współczynniki korelacji rangowej Spearmana (rs) i Kendalla
( τ b ), które nie naruszają ograniczeń związanych ze zmiennymi porządkowymi dają
takie konfiguracje ładunków czynnikowych, które są dalekie od rzeczywistych relacji
łączących wartości ukrytych czynników wspólnych ze zmiennymi obserwowalnymi. W
tej sytuacji wyniki symulacji Joreskoga i innych sugerują, że dobrym podejściem
zarówno z punktu widzenia poprawności metodologicznej jak również jakości
wyników jest posłużenie się w analizie czynnikowej alternatywną miarą –
współczynnikiem korelacji polichorycznej. Jednakże zanim zostaną przedstawione
wyniki przeprowadzenia analiz czynnikowych weryfikujących prawdziwość modelu
Ingleharata na danych WVS na podstawie macierzy współczynników korelacji
polichorycznej przybliżona zostanie ogólna koncepcja i założenia tej miary.
4.3 Koncepcja korelacji polichorycznej
Koncepcja współczynnika korelacji polichorycznej opiera się na założeniu, że
własności mierzone za pomocą skal porządkowych w rzeczywistości mają charakter
ciągły. Innymi słowy zakłada się tu, że pewna cecha i mimo tego, że ma charakter
ciągły może być zmierzona jedynie w sposób dyskretny (czyli przy użyciu niewielkiej
liczby kategorii). Założenie to oznacza, że pewna zmienna obserwowalna X i
- 134 -
(mierzona na poziomie porządkowym) posiada swój ukryty (nieobserwowalny
bezpośrednio) ciągły odpowiednik w postaci zmiennej Yi . Zmienna Yi odnosi się do
tej samej własności co X i – jedynymi różnicami są:
własność i
1. typ skali określającej
2. dostępność zmiennych w bezpośredniej obserwacji (możliwość
bezpośredniego pomiaru X i i brak takiej możliwości w przypadku Yi ). Opierając się
na powyższych założeniach przyjmuje się, że współczynnik korelacji polichorycznej r*
pomiędzy dwoma zmiennymi porządkowymi X i i X j jest współczynnikiem korelacji
liniowej r pomiędzy ich ciągłymi odpowiednikami Yi i Y j . Wyraża to poniższy wzór
[1].155
rX*i X j = rYiY j
[1]
Przenosząc to założenie na grunt metodologii sondażowej można zatem
twierdzić, że w sytuacji udzielania odpowiedzi na pytanie ankietowe założenie to
można uzasadnić w następujący sposób: respondent wskazując pewną odpowiedź
na oferowanej mu skali porządkowej podświadomie wykonuje pewien proces
poznawczy. Proces ten polega na porównaniu oferowanej mu skali z pewnym
kontinuum
(istniejącym
w
jego
umyśle)
odnoszącym
się
do
danej
cechy/opinii/własności etc. Innymi słowy zakłada się, że respondent myśli o danej
cesze nie jako o własności dyskretnej lecz ciągłej. Zakłada się, że respondent
najpierw ustala natężenie danej cechy w swym umyśle (na kontinuum), a następnie
wskazuje taką odpowiedź na oferowanej mu skali, która w jego ocenie jest najbliższa
(rzeczywistego) natężenia danej własności na ukrytym kontinuum. Odpowiedzi
uzyskane w wyniku powyższego procesu są zmiennymi porządkowymi – pomimo
tego, że reprezentują cechę o charakterze ciągłym. Dokładniej jeszcze, można
powiedzieć, że zmienna tego rodzaju reprezentuje cechę o charakterze ciągłym,
która została podzielona na kilka kategorii (tyle kategorii ile punktów ma skala
odpowiedzi na pytanie). W tym kontekście odpowiedzi respondenta (na skali
porządkowej) są więc rezultatem nadawania przez niego progów (granic)
oddzielających poszczególne obszary kontinuum natężenia mierzonej cechy.
Dokładnie taką samą logikę można zastosować do całej populacji, gdzie badacz
może obserwować pewne zmienne jedynie na poziomie porządkowym, które w
155
John Uebersax, The tetrachoric and polychoric correlation
http://ourworld.compuserve.com/homepages/jsuebersax/tetra.htm
- 135 -
coefficients,
2000a,
rzeczywistości mogą mieć rozkład dający się przedstawić w postaci kontinuum
wartości. W tej sytuacji zastosowanie współczynników korelacji polichorycznej do
zmiennych
porządkowych
metodologicznego
punktu
wydaje
się
widzenia.
zatem
Koncepcję
dobrze
uzasadnione
współczynnika
z
korelacji
polichorycznej można przedstawić za pomocą modelu analizy czynnikowej lub
techniki modelowania strukturalnego (będącej ogólniejszym przypadkiem tej
pierwszej). Teoretyczny model współczynnika korelacji polichorycznej pod względem
założeń odpowiada analizie czynnikowej z jednym czynnikiem wspólnym i dwoma
wskaźnikami156. Z uwagi na tę prawidłowość koncepcja korelacji polichorycznej
zostanie przedstawiona właśnie w odniesieniu do terminologii analizy czynnikowej
(zaprezentowanej w podrozdziale 2.3).157
Koncepcja korelacji polichorycznej przyjmuje, że za poziom korelacji liniowej
pomiędzy dwiema zmiennymi nieobserwowalnymi Yi i Y j , odpowiada trzecia
zmienna F (również niedostępna bezpośredniej obserwacji). Co do zmiennej F
zakłada się, że stanowi ona wspólne źródło zróżnicowania wartości Yi i Y j . Wartości
zmiennej F pozostają w statystycznym związku z wartościami zmiennych Yi i Y j . Siłę
tego związku wyrażają wagi odpowiednio bi i b j . Poza tym przyjmuje się również,
że zmienne Yi i Y j posiadają źródła zmienności swoistej, specyficzne tylko dla nich
(zawierające w sobie również błąd pomiaru i oznaczane jako ei i e j ).158 Dodatkowo
zakłada się również, że zmienna ukryta F oraz zmienne ei oraz ej mają rozkłady
normalne, a to z kolei oznacza, że również ukryte zmienne ciągłe Yi i Y j również
muszą mieć rozkłady normalne. Ponadto zakłada się, że źródła wariancji swoistej są
wzajemnie niezależne, a także że są nieskorelowane liniowo z czynnikiem
wspólnym.159 Formalny model uwzględniający te założenia można przedstawić w
następujący sposób:
156
z tą jednak różnicą, że w tym wypadku wskaźniki również nie są bezpośrednio obserwowalne.
John
Uebersax,
Latent
Trait
Models
for
Rater
Agreement,
2000b
http://ourworld.compuserve.com/homepages/jsuebersax/ltrait.htm
158
jak wiadomo z podrozdziału 2.3 wskaźniki oprócz wspólnego źródła zróżnicowania mogą mieć
również swoiste źródła zmienności, które współczynnik korelacji polichorycznmej również
uwzględnia.
159
John Uebersax, op. cit, 2000a
157
- 136 -
Yi = bi F + ei
[2]
Yj = bj F + ej
gdzie:
bi i b j - współczynniki regresji (wagi beta) dla zmiennych Yi i Y j .
ei i e j - swoiste źródła zmienności zmiennych (uwzględniające zarówno specyficzne
źródła zróżnicowania tych zmiennych jak i błąd losowy).
Wyspecyfikowane tutaj założenia na temat koncepcji współczynnika korelacji
polichorycznej (r*) można również przedstawić w sposób graficzny w postaci rysunku
30 i 30a:
Yi
Xi
Yj
Xj
Rys. 30 Schemat koncepcji współczynnika korelacji polichorycznej. Strzałki oznaczają, że
dokładne umiejscowienie obu progów jest szacowane.
- 137 -
Schemat koncepcji wspólczynnika korelacji polichorycznej
Rysunek 30a
Yi
ei
bi
r*=bibj
F
bj
Yj
ej
Współczynnikiem korelacji polichorycznej pomiędzy zmiennymi porządkowymi
X i i X j jest korelacja liniowa pomiędzy Yi i Y j , którą na podstawie
powyższego modelu można odtworzyć jako iloczyn współczynników bi i b j . A
zatem wspierając się na tych założeniach można przyjąć, że współczynnik
korelacji polichorycznej r* jest dany jako:
r* = bi b j
[3]
Powyżej został przedstawiony model teoretyczny pokazujący, jeden ze
sposobów w jaki można rozumieć współczynnik korelacji polichorycznej oraz
jakie relacje łączą go z innymi elementami wyszczególnionego powyżej
modelu teoretycznego. Warto więc dodać, że współczynnik r* można w
związku z powyższymi ustaleniami rozumieć jako miarę informującą o tym jaki
byłby poziom korelacji liniowej Pearsona (r) pomiędzy zmiennymi X i i X j
(wartości dyskretne), gdyby istniała możliwość pomiaru ich wartości za
pomocą kontinuum. W dalszej części zostaną przedstawione najważniejsze
etapy prowadzące do wyznaczenia wartości tego współczynnika.
- 138 -
Punktem wyjścia procedury szacowania współczynnika r* są zaobserwowane
zmienne z wartościami dyskretnymi (oznaczone powyżej jako X i i X j ), a dokładniej
łączny rozkład obu zmiennych. W tym właśnie kontekście szacowane są
dwa
rodzaje parametrów modelu cechy ukrytej, przy okazji którego wyznaczane są
wartości współczynnika korelacji polichorycznej (r*).
Pierwszy rodzaj stanowią tak zwane parametry progowe, które określają
punkty podziału zmiennych ukrytych Yi i Y j (ciągłych odpowiedników zmiennych
obserwowalnych). Owe punkty podziału są po prostu oszacowanymi wartościami
zmiennych Yi i Y j , które dzielą ich kontinua na obszary, które pod względem
proporcji odpowiadają zaobserwowanym częstościom odpowiednich kategorii
zmiennych obserwowalnych X i i X j . W tym miejscu warto przypomnieć, że zakłada
się, iż zmienne Yi i Y j mają rozkłady normalne i w związku z tym szacunki tych
punktów wyznacza się na podstawie tego właśnie teoretycznego rozkładu. Algorytm
poszukujący wartości współczynnika r* jest skonstruowany w ten sposób, że program
dotąd testuje różne wartości wyznaczające granice dla przedziałów zmiennych
ukrytych oraz wartości dla współczynnika r* dopóki nie uzyska takiego rozwiązania,
które generowałoby oczekiwane proporcje zmiennych obserwowalnych, nie różniące
się istotnie od proporcji zaobserwowanych.160
Z obliczeniowego punktu widzenia współczynnik korelacji polichorycznej może
być szacowany na dwa sposoby, które – jak wskazuje John Uebersax – generalnie
nie prowadzą jednak do znaczących różnic w rezultatach. Badacz ma bowiem do
wyboru posłużenie się procedurą dwustopniową lub jednostopniową. W ramach
pierwszej z nich najpierw szacowane są wartości progowe. Szacunki te są
wykonywane osobno dla każdej zmiennej ukrytej. Do ustalenia punktów podziału
kontinuum używane są skumulowane proporcje obserwacji obliczone dla każdej
kategorii obserwowalnej zmiennej (porządkowej).161 W drugim kroku szacuje się
poziom korelacji liniowej pomiędzy nieobserwowalnymi zmiennymi ukrytymi. W
160
John Uebersax, op. cit , 2000a oraz 2000c
Szacunki te odbywają się w oparciu o funkcję odwrotną dystrybuanty standaryzowanego rozkładu
normalnego – tak zwaną funkcję probit. Dla zadanej proporcji jako argumentu funkcja ta zwraca
wartość, która w standaryzowanym rozkładzie normalnym wyznacza tą proporcję – czyli wielkość
obszaru pod krzywą normalną. (J. Uebersax, Estimating the latent trait model by factor analysis of
tetrachoric Correlations, 2000, http://ourworld.compuserve.com/homepages/jsuebersax/irt.htm#intro
161
- 139 -
przypadku gdy korelacja polichoryczna szacowana jest za pomocą procedury
jednostopniowej, zarówno progi jak i współczynniki korelacji są szacowane
jednocześnie.162
Przedstawiona powyżej w ogólnym zarysie koncepcja współczynnika korelacji
polichorycznej pokazuje, że posługiwanie się tą miarą, w przypadku gdy mamy do
czynienia ze zmiennymi na porządkowym poziomie pomiaru nie narusza ograniczeń
właściwych temu typowi zmiennych i pozwala w sposób uprawniony ominąć
ograniczenia związane z dopuszczalnym zakresem przekształceń. Poza tym – jak
pokazują wyniki symulacji Joreskoga przedstawione
w poprzednim podrozdziale
(4.2) – analizy czynnikowe wykorzystujące jako podstawę macierze zawierające te
właśnie współczynniki dają bardzo dobre rezultaty – rozumiane jako wysoki stopień
zgodności uzyskanych wyników z rzeczywistymi relacjami pomiędzy zmiennymi. W
tej sytuacji wykorzystanie współczynnika korelacji r*, przeznaczonego dla danych na
poziomie porządkowym wydaje się w pełni uzasadnione. Można zatem oczekiwać, że
model Ingleharta mógłby uzyskać większy stopień potwierdzenia w danych WVS jeśli
analizy czynnikowe zostaną powtórzone z tą jednak różnicą że wykorzystane
zostaną nie macierze zawierające współczynniki korelacji Pearsona (łamiące
założenia dotyczące dopuszczalnych przekształceń na danych), lecz nie naruszające
założeń i „dobrze zachowujące się” współczynniki korelacji polichorycznej. W
następnej tego rozdziału części przedstawiono wyniki analiz prowadzonych z
wykorzystaniem współczynników korelacji polichorycznej.
162
John Uebersax, op. cit , 2000a
- 140 -