4. Rozdział czwarty. Próba odtworzenia modelu na podstawie
Transkrypt
4. Rozdział czwarty. Próba odtworzenia modelu na podstawie
Mariusz Grzęda, Zróżnicowanie i ewolucja systemów wartości na świecie w koncepcji Ronalda Ingleharta – próba metodologicznej krytyki Praca magisterska na kierunku Socjologia Warszawa, 2006 4. Rozdział czwarty. Próba odtworzenia modelu na podstawie alternatywnej miary związku pomiędzy zmiennymi. Do tej pory podejmowane były próby zweryfikowania rozpatrywanego modelu zróżnicowania systemów wartości przyjmując (podobnie jak Inglehart), że poziom pomiaru wszystkich zmiennych w tym modelu jest przynajmniej interwałowy. W rzeczywistości jednak zmienne uwzględnione w modelu Ingleharta reprezentują porządkowy poziom pomiaru i w związku z tym posługiwanie się w analizach czynnikowych współczynnikiem korelacji liniowej Pearsona obliczanym dla danych porządkowych nie jest podejściem w pełni poprawnym. Innymi słowy podejście takie łamie założenia dotyczące typu danych, które można wykorzystywać w analizie czynnikowej. W tym rozdziale problem ten zostanie szerzej przeanalizowany. Wskazana zostanie również alternatywna miara korelacji pomiędzy zmiennymi wskaźnikowymi mierzonymi na poziomie porządkowym, której zastosowanie w analizie czynnikowej nie narusza podstawowych założeń pomiarowych, dzięki czemu uzyskane wyniki analizy czynnikowej będą bardziej wiarygodne i nieobciążone błędem wynikającym z naruszania założeń pomiarowych. 4.1 Poziom pomiaru zmiennych w badaniach sondażowych Założenie o wspomnianym powyżej interwałowym i porządkowym poziomie pomiaru nawiązuje do koncepcji S.S. Stevensa, która klasyfikuje dane (zmienne) według rodzaju dopuszczalnych147 przekształceń dokonywanych na wartościach poszczególnych zmiennych oraz według relacji zachodzących w zbiorze wartości tych zmiennych. Koncepcja ta wskazuje, że istnieją cztery poziomy pomiaru: nominalny, porządkowy, interwałowy oraz ilorazowy. Wartości zmiennych nominalnych oznaczają klasyfikację obiektów obserwacji według następującej logiki: obiekt posiada daną cechę lub jej nie posiada. Każde dwa obiekty można zaklasyfikować albo jako różniące się pod względem posiadania pewnej cechy bądź nie różniące się pod tym względem. Pomiędzy obiektami występuje relacja równoważności148. Dopuszczalne transformacje na zmiennych nominalnych to przekształcenia różnowartościowe, czyli takie, które różnym 147 148 Czyli nie prowadzących do utraty informacji. Czyli symetryczność i przechodniość 127 argumentom przypisują różne wartości. Innymi słowy wszystkie takie przekształcenia, które zachowują wyjściowe relacje równości i różności pomiędzy obiektami są tu dozwolone. Kolejny poziom pomiaru stanowią zmienne porządkowe. Dane reprezentowane na porządkowym poziomie pomiaru są uporządkowane ze względu na stopień posiadania danej cechy. Podobnie jak w przypadku skali nominalnej i w tym przypadku o każdych dwóch obiektach można powiedzieć czy są od siebie różne czy takie same pod względem mierzonej cechy. Jednak nie tylko. Można bowiem również określić porządek kategorii reprezentujących mierzoną cechę, to znaczy wskazać relację większości (bądź mniejszości) łączącą dwie różne kategorie. A zatem w tym przypadku obiekty są pogrupowane w poszczególne kategorie, które oznaczają pewien porządek. Zmienne mierzone na poziomie porządkowym można przekształcać tylko w taki sposób, który zachowuje ten porządek. Należy tu podkreślić, że wartości skali porządkowej nie mówią nic o odległości pomiędzy poszczególnymi kategoriami. Są bowiem tylko liczbami porządkowymi, określającymi dla każdej kategorii jej rangę (miejsce w porządku). Nie wolno zatem wartości zmiennych porządkowych do siebie dodawać, odejmować ani mnożyć. Jedynym dopuszczalnym przekształceniem149 danych porządkowych jest dodawanie do każdej wartości zmiennej pewnej stałej (X+s). Kolejny poziom pomiaru zmiennych stanowi poziom interwałowy (przedziałowy). O obiektach, którym przypisywane są wartości na skalach interwałowych, można mówić nie tylko w kategoriach równości-różności, a także „jest większy niż” lub „mniejszy niż” (pod względem danej cechy), lecz także można formułować twierdzenia na temat wielkości zaobserwowanych różnic. Tego rodzaju zmienne umożliwiają dokładne określenie jaka jest różnica pomiędzy obiektami pod względem pewnej cechy. Przykładowo można określić, że wartość przypisana obiektowi A jest pod względem danej cechy mniejsza (albo większa) o x od wartości obiektu B. Nie wolno natomiast stwierdzić, że wartość A jest y-razy mniejsza (albo większa) od wartości obiektu B. Wynika to z braku istnienia zera absolutnego150 w skalach interwałowych. W przypadku skal interwałowych na wartościach zmiennych dopuszczalne są przekształcenia typu liniowego (tX+s). 149 przekształcenie ściśle monotoniczne rosnące. przykładem skali interwałowej może być temperatura Celsjusza. Punkt zerowy na tej skali nie oznacza braku temperatury – czyli nie ma charakteru naturalnego (bezwzględnego, absolutnego). 150 - 128 - Następny poziom pomiaru zmiennych stanowi poziom ilorazowy (stosunkowy). Zakłada się, że skale tego rodzaju mają naturalny punkt zerowy. Ponadto o wartościach tego typu zmiennych można formułować twierdzenia o tym, że obiekt A ma wartości pewnej zmiennej mierzonej na poziomie ilorazowym x razy większe/mniejsze od B. Oprócz tego można o obiektach klasyfikowanych za pomocą tego rodzaju skal formułować twierdzenia na temat równości (różności), większości (mniejszości), oraz różnicach o pewną wartość. Wartości skal ilorazowych podlegają przekształceniu podobieństwa (tX).151 W przypadku badań sondażowych (w tym również badań WVS) badacze mają do czynienia ze zmiennymi, które najczęściej są mierzone na skalach nominalnych lub porządkowych. Znacznie rzadziej natomiast poziom pomiaru jest interwałowy lub ilorazowy. Kwestionariusz wywiadu najczęściej jest zorganizowany w ten sposób, że respondent otrzymuje od ankietera pytanie i jest proszony o odpowiedź. Na zadane pytanie respondent albo może odpowiedzieć w sposób dowolny (pytanie otwarte) albo w oparciu o gotowe odpowiedzi (pytanie zamknięte). Warto przypomnieć, że w przypadku 10 pytań uwzględnionych w modelu zaproponowanym przez Ingleharta wszystkie zmienne reprezentują odpowiedzi na pytania zamknięte. Odpowiedzi na te pytania były wyrażane w oparciu o skale zawierające werbalne etykiety lub ewentualnie liczby całkowite. Zmienne utworzone z odpowiedzi na te pytania mają charakter porządkowy, ponieważ wszystkie możliwe kategorie odpowiedzi były uporządkowane ze względu na cechę/opinię/wartość, którą mierzyły. Oznacza to, że nie można w tym przypadku określić przykładowo tego o ile dany respondent preferuje pewną opinię nad inną. Na tej podstawie można jedynie stwierdzić (1.) że osoba odpowiadająca na dane pytanie preferuje wybraną przez siebie odpowiedź nad innymi możliwościami oraz (2.) że osoba ta w porównaniu z inną wykazuje większe, mniejsze bądź równe nasilenie danej cechy/wartości/opinii. 4.2 Problem naruszania założeń pomiarowych W sytuacji, gdy zmienne wskaźnikowe mają charakter porządkowy posługiwanie się miarą współczynnika korelacji liniowej Pearsona w analizie czynnikowej nie jest w pełni poprawne, ponieważ zarówno ten współczynnik jak i sama analiza czynnikowa, 151 Renate Mayntz, K. Holm, Peter Huebner, Wprowadzenie do metod socjologii empirycznej, PWN, Warszawa 1985, s. 48-50 oraz Henryk Banaszak Sławomir Nowotny, Statystyka (skrypt na prawach rękopisu), Warszawa 1984, zeszyt II s.35 - 129 - zakłada, że zmienne są przynajmniej na poziomie interwałowym (od tego poziomu można wykonywać przekształcenia liniowe). Jeżeli zestawimy z tym fakt, że wszystkie zmienne obserwowalne rozpatrywane w modelu Ingleharta są mierzone na poziomie porządkowym to okazuje się, że zastosowane podejście nie jest ani uprawnione metodologicznie ani – jak pokazują badania symulacyjne152 – optymalne. Kwestia optymalności jest tu rozumiana jako przyjęcie takiej miary związku pomiędzy zmiennymi, która zapewni że wykonana na jej podstawie analiza czynnikowa wygeneruje rezultaty „najbliższe” rzeczywistym (prawdziwym) relacjom pomiędzy rozpatrywanymi zmiennymi. Wspomniane analizy symulacyjne pokazują, że kwestia doboru odpowiedniej (adekwatnej do danych) miary korelacji pomiędzy zmiennymi wydaje się sprawą bardzo istotną i może wpływać na jakość wyników analizy czynnikowej. Przeprowadzone przez Karla G. Joreskoga i jego współpracowników badania koncentrują się między innymi na kwestiach wrażliwości wyników analizy czynnikowej na naruszanie założeń dotyczących skal pomiarowych. Główną inspiracją i zarazem punktem wyjścia tego eksperymentu było stwierdzenie, że w naukach społecznych większość wykonywanych analiz czynnikowych nie spełnia teoretycznych założeń poziomu pomiaru zmiennych. Jedną z bardziej rozpowszechnionych praktyk, łamiącą zasady sformułowane przez S.S. Stevensa jest „nadużywanie” współczynnika korelacji liniowej w przypadku zmiennych, których poziom pomiaru nie jest (przynajmniej) interwałowy lecz porządkowy. Ponadto autorzy cytowanego artykułu wskazywali także na brak prac i analiz podejmujących temat adekwatności stosowania różnych miar związku między zmiennymi w analizie czynnikowej. Artykuł Joreskoga i innych wypełnia tę lukę i odpowiada na pytanie, który ze znanych współczynników korelacji jest miarą najbardziej odpowiednią do prowadzenia analiz czynnikowych na danych występujących w naukach społecznych. Przedmiotem analiz symulacyjnych były cztery różne współczynniki korelacji zastosowane do tych samych danych. Zastosowano następujące miary związku pomiędzy zmiennymi: 1. r – współczynnik korelacji liniowej Pearsona; 2. r* – współczynnik korelacji polichorycznej; 3. rs – współczynnik korelacji rangowej 152 Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Sensitivity of confirmatory maximum likelihood factor analysis to violations of measurement scale and distributional assumptions, Journal of Marketing Research , vol. XXIV (May 1987), s. 222-228 - 130 - Spearmana; 4. τb - współczynnik korelacji rangowej Kendalla. Pierwszy z wymienionych współczynników to dobrze znana i powszechnie stosowana miara związku liniowego odpowiednia dla zmiennych przynajmniej na poziomie interwałowym. (Oznacza to, że jej stosowanie do zmiennych na porządkowym poziomie pomiaru jest niepoprawne). Natomiast dwie ostatnie miary (3. i 4.) to współczynniki korelacji używane dla zmiennych porządkowych, porównujące rangi poszczególnych przypadków. Natomiast trzecia z analizowanych miar – współczynnik korelacji polichorycznej, jest miarą mniej znaną, która ze względu na wyniki badań Joreskoga i innych zostanie szerzej omówiona w następnym podrozdziale. Omawiany eksperyment symulacyjny polegał na tym, że autorzy przy pomocy specjalnego oprogramowania wygenerowali obserwacje, które spełniały założone warunki modelu czynnikowego. Założono model z jednym czynnikiem wspólnym i czterema wskaźnikami. Dane dla wskaźników były wygenerowane w oparciu o wcześniej założone wartości ładunków czynnikowych (czyli wag, współczynników liniowych informujących o związku pomiędzy wartościami czynnikowymi a poszczególnymi zmiennymi). W konsekwencji uzyskiwane dane dla wskaźników miały charakter ciągły. Aby odtworzyć sytuację jaką często spotyka się w badaniach sondażowych, gdzie zwykle mamy do czynienia ze skalami składającymi się z niewielkiej liczby dyskretnych (nieciągłych) kategorii, oznaczających kolejne poziomy wartości zmiennej, wygenerowane we wcześniejszym kroku dane kategoryzowano w taki sposób, aby uzyskane rozkłady posiadały pięć uporządkowanych kategorii. W ten sposób zapewniono, że sytuacja przypominała częsty w badaniach społecznych przypadek, kiedy to pomiar jest prowadzony na kilkustopniowych skalach z werbalnymi etykietami wskazującymi respondentowi porządek oferowanych mu odpowiedzi. Analizę czynnikową metodą największej wiarygodności zawsze wykonywano dwukrotnie. Najpierw dla danych wygenerowanych na poziomie ciągłym, a następnie dla danych pokategoryzowanych – na poziomie porządkowym. W pierwszej kolejności (dla danych ciągłych) estymowano parametry modelu w oparciu o macierz współczynników korelacji Pearsona. Następnie po kategoryzacji zmiennych (do pięciu kategorii) znowu szacowano parametry modelu czynnikowego, używając wówczas jednej z czterech wyżej wspomnianych miar korelacji. Symulacja została przeprowadzona w kilku wariantach. Obok miar korelacji manipulowano - 131 - również innymi uznanymi za istotne aspektami danych i modelu: – wielkością zakładanych ładunków czynnikowych – wielkością próby (czyli liczbą przypadków poddawanych analizie) – typem rozkładów (pokategoryzowanych) zmiennych wskaźnikowych. Wyniki przeprowadzonych analiz czynnikowych porównywano między innymi pod względem parametrów uzyskanych modeli czynnikowych (wartości ładunków czynnikowych), statystyk informujących o dobroci dopasowania modelu do danych oraz przypadków, gdy odnalezienie rozwiązania czynnikowego metodą największej wiarygodności okazywało się niemożliwe (noncovergence) lub błędne (improper solutions). Wyniki przeprowadzonego eksperymentu pokazują, że w przypadku danych po kategoryzacji do kilku wartości posługiwanie się współczynnikiem korelacji polichorycznej daje najlepsze rezultaty rozumiane jako największa zbieżność wyników analizy czynnikowej z danymi prawdziwymi. Innymi słowy uzyskane wartości ładunków czynnikowych są wówczas najbliższe wartościom założonym na początku, na podstawie których były generowane dane. Do określania stopnia dokładności (accuracy) uzyskanych wyników posłużono się dwiema miarami. Pierwsza to błąd wynikający z kategoryzacji czyli procedury przekształcenia danych o charakterze ciągłym (continuous) w zmienne o wartościach dyskretnych (discrete) (Categorization Bias – CB). Błąd ten został określony jako różnica pomiędzy ładunkiem czynnikowym wyznaczonym na podstawie zmiennych ciągłych a ładunkiem wyznaczonym na podstawie danych po kategoryzacji (dyskretnych). Natomiast druga miara to błąd kwadratowy (Squared Error – SE). Miara ta została zdefiniowana jako podniesiona do kwadratu różnica pomiędzy prawdziwym (założonym) ładunkiem czynnikowym a ładunkiem czynnikowym wyznaczonym na podstawie danych po kategoryzacji. Przeprowadzone porównania koncentrowały się przede wszystkim na określeniu wpływu jaki ma przyjmowanie różnych miar korelacji pomiędzy zmiennymi na odchylenie uzyskanych ładunków czynnikowych od wartości prawdziwych. Analiza przeciętnych wartości obydwu powyżej zdefiniowanych miar błędów pokazała, że zastosowanie (do danych po kategoryzacji) współczynniki korelacji polichorycznej (r*) generują ładunki czynnikowe, które w najmniejszym stopniu są obciążone błędami. W większym stopniu obciążone błędami okazały się ładunki czynnikowe wygenerowane na podstawie współczynników korelacji liniowej (r) i specjalne współczynniki dla zmiennych porządkowych współczynnik korelacji - 132 - rangowej Spearmana i Kendalla (odpowiednio rs i τ b ). Autorzy eksperymentu zwracają uwagę, że przyczyną zaobserwowanych różnic był fakt, że współczynniki korelacji polichorycznej (obliczone dla danych po kategoryzacji) jak żadne inne generowały oszacowania związków pomiędzy wskaźnikami najbliższe wartościom rzeczywistym. Prawidłowość ta miała miejsce bez względu na wielkość próby a także przyjęte typy rozkładów zmiennych wskaźnikowych. Pozostałe miary korelacji systematycznie niedoszacowywały natężenia tych związków. W konsekwencji, analizy czynnikowe prowadzone w oparciu o silniej obciążone błędami miary skorelowania zmiennych dawały ładunki odbiegające od wartości rzeczywistych. czynnikowe w większym stopniu 153 Innym bardzo interesującym aspektem symulacji przeprowadzonej przez Joreskoga i innych badaczy jest wynik pokazujący, że statystyka χ2 – używana jako miara jakości modelu czynnikowego paradoksalnie częściej sugeruje odrzucanie wyników analiz czynnikowych, które dawały prawidłowe lub bliskie prawidłowym szacunki ładunków czynnikowych. Dotyczy to przede wszystkim analiz czynnikowych, które opierały się na współczynniku korelacji polichorycznej – tym właśnie który (jak wspomniano wyżej) zapewniał największą zgodność oszacowanego modelu z prawdziwymi relacjami. Co więcej, dla analiz czynnikowych opartych na współczynniku korelacji τ b , który we wszystkich wariantach symulacji dawał wyniki najbardziej odbiegające od rzeczywistych relacji, statystyka χ2 przyjmowała przeciętnie najmniejsze wartości – najczęściej sugerujące przyjmowanie modelu. Zdaniem autorów tego badania fakt ten oznacza, że korzystanie z testu χ2 zwiększa prawdopodobieństwo odrzucania prawidłowych modeli czynnikowych i nie odrzucania fałszywych.154 Ujmując to w kategoriach statystycznej weryfikacji hipotez można zatem stwierdzić, że wyniki eksperymentu sugerują, iż posługiwanie się tą statystyką naraża badacza na częstsze popełnianie błędów zarówno I rodzaju 153 Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Op. cit., s. 222-224 Warto również w tym punkcie dodać, że ta sama prawidłowość dotyczy innych statystyk, służących do oceny modelu. Autorzy eksperymentu zajmują się następującymi statystykami: a. GFI - indeks dobroci dopasowania (Goodness-of-Fit Index). Przyjmuje wartości w granicach od 0 do 1. Teoretyczne może jednak również przyjmować nic nie znaczące wartości negatywne; b. AGFI – dostosowany indeks dobroci dopasowania (Adjusted Goodness-of-Fit Index). Używa się w tej mierze kwadratów średnich a nie tak jak w poprzedniej mierze sum kwadratów. c. RMR – pierwiastek ze średniego kwadratu reszt. Emin Babakus, Carl E. Ferguson, JR., Karl G. Joreskog, Op. cit., s. 226 154 - 133 - (polegających na odrzucaniu hipotezy zerowej, która w rzeczywistości jest prawdziwa) jak i II rodzaju (polegających na nieodrzucaniu hipotezy zerowej, która w rzeczywistości jest fałszywa). W tej sytuacji posługiwanie się tymi miarami w analizie czynnikowej należy uznać, za dość ryzykowne. Warto również zauważyć w tym miejscu, że wniosek ten potwierdza niewielką przydatność testu czynnikowej przeprowadzanej metodą największej χ2w wiarygodności, analizie którą zasygnalizowano również w podrozdziale A1. Podsumowując ten punkt rozważań można zwrócić uwagę na dwie sprawy. Po pierwsze gdy – tak jak w przypadku danych sondażowych – mamy do czynienia ze zmiennymi na poziomie porządkowym posługiwanie się miarą korelacji liniowej Pearsona narusza założenia teoretyczne sformułowane przez S. Stevensa i sprawia, że przeprowadzanie analizy czynnikowej na podstawie macierzy współczynników Pearsona jest procedurą, która nie ma uzasadnienia metodologicznego. Z drugiej strony wyniki przytoczonego wyżej eksperymentu symulacyjnego, pokazują że powszechnie znane współczynniki korelacji rangowej Spearmana (rs) i Kendalla ( τ b ), które nie naruszają ograniczeń związanych ze zmiennymi porządkowymi dają takie konfiguracje ładunków czynnikowych, które są dalekie od rzeczywistych relacji łączących wartości ukrytych czynników wspólnych ze zmiennymi obserwowalnymi. W tej sytuacji wyniki symulacji Joreskoga i innych sugerują, że dobrym podejściem zarówno z punktu widzenia poprawności metodologicznej jak również jakości wyników jest posłużenie się w analizie czynnikowej alternatywną miarą – współczynnikiem korelacji polichorycznej. Jednakże zanim zostaną przedstawione wyniki przeprowadzenia analiz czynnikowych weryfikujących prawdziwość modelu Ingleharata na danych WVS na podstawie macierzy współczynników korelacji polichorycznej przybliżona zostanie ogólna koncepcja i założenia tej miary. 4.3 Koncepcja korelacji polichorycznej Koncepcja współczynnika korelacji polichorycznej opiera się na założeniu, że własności mierzone za pomocą skal porządkowych w rzeczywistości mają charakter ciągły. Innymi słowy zakłada się tu, że pewna cecha i mimo tego, że ma charakter ciągły może być zmierzona jedynie w sposób dyskretny (czyli przy użyciu niewielkiej liczby kategorii). Założenie to oznacza, że pewna zmienna obserwowalna X i - 134 - (mierzona na poziomie porządkowym) posiada swój ukryty (nieobserwowalny bezpośrednio) ciągły odpowiednik w postaci zmiennej Yi . Zmienna Yi odnosi się do tej samej własności co X i – jedynymi różnicami są: własność i 1. typ skali określającej 2. dostępność zmiennych w bezpośredniej obserwacji (możliwość bezpośredniego pomiaru X i i brak takiej możliwości w przypadku Yi ). Opierając się na powyższych założeniach przyjmuje się, że współczynnik korelacji polichorycznej r* pomiędzy dwoma zmiennymi porządkowymi X i i X j jest współczynnikiem korelacji liniowej r pomiędzy ich ciągłymi odpowiednikami Yi i Y j . Wyraża to poniższy wzór [1].155 rX*i X j = rYiY j [1] Przenosząc to założenie na grunt metodologii sondażowej można zatem twierdzić, że w sytuacji udzielania odpowiedzi na pytanie ankietowe założenie to można uzasadnić w następujący sposób: respondent wskazując pewną odpowiedź na oferowanej mu skali porządkowej podświadomie wykonuje pewien proces poznawczy. Proces ten polega na porównaniu oferowanej mu skali z pewnym kontinuum (istniejącym w jego umyśle) odnoszącym się do danej cechy/opinii/własności etc. Innymi słowy zakłada się, że respondent myśli o danej cesze nie jako o własności dyskretnej lecz ciągłej. Zakłada się, że respondent najpierw ustala natężenie danej cechy w swym umyśle (na kontinuum), a następnie wskazuje taką odpowiedź na oferowanej mu skali, która w jego ocenie jest najbliższa (rzeczywistego) natężenia danej własności na ukrytym kontinuum. Odpowiedzi uzyskane w wyniku powyższego procesu są zmiennymi porządkowymi – pomimo tego, że reprezentują cechę o charakterze ciągłym. Dokładniej jeszcze, można powiedzieć, że zmienna tego rodzaju reprezentuje cechę o charakterze ciągłym, która została podzielona na kilka kategorii (tyle kategorii ile punktów ma skala odpowiedzi na pytanie). W tym kontekście odpowiedzi respondenta (na skali porządkowej) są więc rezultatem nadawania przez niego progów (granic) oddzielających poszczególne obszary kontinuum natężenia mierzonej cechy. Dokładnie taką samą logikę można zastosować do całej populacji, gdzie badacz może obserwować pewne zmienne jedynie na poziomie porządkowym, które w 155 John Uebersax, The tetrachoric and polychoric correlation http://ourworld.compuserve.com/homepages/jsuebersax/tetra.htm - 135 - coefficients, 2000a, rzeczywistości mogą mieć rozkład dający się przedstawić w postaci kontinuum wartości. W tej sytuacji zastosowanie współczynników korelacji polichorycznej do zmiennych porządkowych metodologicznego punktu wydaje się widzenia. zatem Koncepcję dobrze uzasadnione współczynnika z korelacji polichorycznej można przedstawić za pomocą modelu analizy czynnikowej lub techniki modelowania strukturalnego (będącej ogólniejszym przypadkiem tej pierwszej). Teoretyczny model współczynnika korelacji polichorycznej pod względem założeń odpowiada analizie czynnikowej z jednym czynnikiem wspólnym i dwoma wskaźnikami156. Z uwagi na tę prawidłowość koncepcja korelacji polichorycznej zostanie przedstawiona właśnie w odniesieniu do terminologii analizy czynnikowej (zaprezentowanej w podrozdziale 2.3).157 Koncepcja korelacji polichorycznej przyjmuje, że za poziom korelacji liniowej pomiędzy dwiema zmiennymi nieobserwowalnymi Yi i Y j , odpowiada trzecia zmienna F (również niedostępna bezpośredniej obserwacji). Co do zmiennej F zakłada się, że stanowi ona wspólne źródło zróżnicowania wartości Yi i Y j . Wartości zmiennej F pozostają w statystycznym związku z wartościami zmiennych Yi i Y j . Siłę tego związku wyrażają wagi odpowiednio bi i b j . Poza tym przyjmuje się również, że zmienne Yi i Y j posiadają źródła zmienności swoistej, specyficzne tylko dla nich (zawierające w sobie również błąd pomiaru i oznaczane jako ei i e j ).158 Dodatkowo zakłada się również, że zmienna ukryta F oraz zmienne ei oraz ej mają rozkłady normalne, a to z kolei oznacza, że również ukryte zmienne ciągłe Yi i Y j również muszą mieć rozkłady normalne. Ponadto zakłada się, że źródła wariancji swoistej są wzajemnie niezależne, a także że są nieskorelowane liniowo z czynnikiem wspólnym.159 Formalny model uwzględniający te założenia można przedstawić w następujący sposób: 156 z tą jednak różnicą, że w tym wypadku wskaźniki również nie są bezpośrednio obserwowalne. John Uebersax, Latent Trait Models for Rater Agreement, 2000b http://ourworld.compuserve.com/homepages/jsuebersax/ltrait.htm 158 jak wiadomo z podrozdziału 2.3 wskaźniki oprócz wspólnego źródła zróżnicowania mogą mieć również swoiste źródła zmienności, które współczynnik korelacji polichorycznmej również uwzględnia. 159 John Uebersax, op. cit, 2000a 157 - 136 - Yi = bi F + ei [2] Yj = bj F + ej gdzie: bi i b j - współczynniki regresji (wagi beta) dla zmiennych Yi i Y j . ei i e j - swoiste źródła zmienności zmiennych (uwzględniające zarówno specyficzne źródła zróżnicowania tych zmiennych jak i błąd losowy). Wyspecyfikowane tutaj założenia na temat koncepcji współczynnika korelacji polichorycznej (r*) można również przedstawić w sposób graficzny w postaci rysunku 30 i 30a: Yi Xi Yj Xj Rys. 30 Schemat koncepcji współczynnika korelacji polichorycznej. Strzałki oznaczają, że dokładne umiejscowienie obu progów jest szacowane. - 137 - Schemat koncepcji wspólczynnika korelacji polichorycznej Rysunek 30a Yi ei bi r*=bibj F bj Yj ej Współczynnikiem korelacji polichorycznej pomiędzy zmiennymi porządkowymi X i i X j jest korelacja liniowa pomiędzy Yi i Y j , którą na podstawie powyższego modelu można odtworzyć jako iloczyn współczynników bi i b j . A zatem wspierając się na tych założeniach można przyjąć, że współczynnik korelacji polichorycznej r* jest dany jako: r* = bi b j [3] Powyżej został przedstawiony model teoretyczny pokazujący, jeden ze sposobów w jaki można rozumieć współczynnik korelacji polichorycznej oraz jakie relacje łączą go z innymi elementami wyszczególnionego powyżej modelu teoretycznego. Warto więc dodać, że współczynnik r* można w związku z powyższymi ustaleniami rozumieć jako miarę informującą o tym jaki byłby poziom korelacji liniowej Pearsona (r) pomiędzy zmiennymi X i i X j (wartości dyskretne), gdyby istniała możliwość pomiaru ich wartości za pomocą kontinuum. W dalszej części zostaną przedstawione najważniejsze etapy prowadzące do wyznaczenia wartości tego współczynnika. - 138 - Punktem wyjścia procedury szacowania współczynnika r* są zaobserwowane zmienne z wartościami dyskretnymi (oznaczone powyżej jako X i i X j ), a dokładniej łączny rozkład obu zmiennych. W tym właśnie kontekście szacowane są dwa rodzaje parametrów modelu cechy ukrytej, przy okazji którego wyznaczane są wartości współczynnika korelacji polichorycznej (r*). Pierwszy rodzaj stanowią tak zwane parametry progowe, które określają punkty podziału zmiennych ukrytych Yi i Y j (ciągłych odpowiedników zmiennych obserwowalnych). Owe punkty podziału są po prostu oszacowanymi wartościami zmiennych Yi i Y j , które dzielą ich kontinua na obszary, które pod względem proporcji odpowiadają zaobserwowanym częstościom odpowiednich kategorii zmiennych obserwowalnych X i i X j . W tym miejscu warto przypomnieć, że zakłada się, iż zmienne Yi i Y j mają rozkłady normalne i w związku z tym szacunki tych punktów wyznacza się na podstawie tego właśnie teoretycznego rozkładu. Algorytm poszukujący wartości współczynnika r* jest skonstruowany w ten sposób, że program dotąd testuje różne wartości wyznaczające granice dla przedziałów zmiennych ukrytych oraz wartości dla współczynnika r* dopóki nie uzyska takiego rozwiązania, które generowałoby oczekiwane proporcje zmiennych obserwowalnych, nie różniące się istotnie od proporcji zaobserwowanych.160 Z obliczeniowego punktu widzenia współczynnik korelacji polichorycznej może być szacowany na dwa sposoby, które – jak wskazuje John Uebersax – generalnie nie prowadzą jednak do znaczących różnic w rezultatach. Badacz ma bowiem do wyboru posłużenie się procedurą dwustopniową lub jednostopniową. W ramach pierwszej z nich najpierw szacowane są wartości progowe. Szacunki te są wykonywane osobno dla każdej zmiennej ukrytej. Do ustalenia punktów podziału kontinuum używane są skumulowane proporcje obserwacji obliczone dla każdej kategorii obserwowalnej zmiennej (porządkowej).161 W drugim kroku szacuje się poziom korelacji liniowej pomiędzy nieobserwowalnymi zmiennymi ukrytymi. W 160 John Uebersax, op. cit , 2000a oraz 2000c Szacunki te odbywają się w oparciu o funkcję odwrotną dystrybuanty standaryzowanego rozkładu normalnego – tak zwaną funkcję probit. Dla zadanej proporcji jako argumentu funkcja ta zwraca wartość, która w standaryzowanym rozkładzie normalnym wyznacza tą proporcję – czyli wielkość obszaru pod krzywą normalną. (J. Uebersax, Estimating the latent trait model by factor analysis of tetrachoric Correlations, 2000, http://ourworld.compuserve.com/homepages/jsuebersax/irt.htm#intro 161 - 139 - przypadku gdy korelacja polichoryczna szacowana jest za pomocą procedury jednostopniowej, zarówno progi jak i współczynniki korelacji są szacowane jednocześnie.162 Przedstawiona powyżej w ogólnym zarysie koncepcja współczynnika korelacji polichorycznej pokazuje, że posługiwanie się tą miarą, w przypadku gdy mamy do czynienia ze zmiennymi na porządkowym poziomie pomiaru nie narusza ograniczeń właściwych temu typowi zmiennych i pozwala w sposób uprawniony ominąć ograniczenia związane z dopuszczalnym zakresem przekształceń. Poza tym – jak pokazują wyniki symulacji Joreskoga przedstawione w poprzednim podrozdziale (4.2) – analizy czynnikowe wykorzystujące jako podstawę macierze zawierające te właśnie współczynniki dają bardzo dobre rezultaty – rozumiane jako wysoki stopień zgodności uzyskanych wyników z rzeczywistymi relacjami pomiędzy zmiennymi. W tej sytuacji wykorzystanie współczynnika korelacji r*, przeznaczonego dla danych na poziomie porządkowym wydaje się w pełni uzasadnione. Można zatem oczekiwać, że model Ingleharta mógłby uzyskać większy stopień potwierdzenia w danych WVS jeśli analizy czynnikowe zostaną powtórzone z tą jednak różnicą że wykorzystane zostaną nie macierze zawierające współczynniki korelacji Pearsona (łamiące założenia dotyczące dopuszczalnych przekształceń na danych), lecz nie naruszające założeń i „dobrze zachowujące się” współczynniki korelacji polichorycznej. W następnej tego rozdziału części przedstawiono wyniki analiz prowadzonych z wykorzystaniem współczynników korelacji polichorycznej. 162 John Uebersax, op. cit , 2000a - 140 -