05. Wnioskowanie psychom
Transkrypt
05. Wnioskowanie psychom
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania na Pozycje Testowe (IRT) Teoria Wyników Generycznych (uniwersalizacji). Teorie rzetelności pomiaru Dwa modele psychometryczne opisu błędu pomiaru i rzetelność pomiaru: Klasyczna Teoria Testów (Gulliksen, 1950; Lord i Novick, 1968) oraz Teoria odpowiadania na pozycje Testowe (IRT) Nowoczesną formą KTT jest Teoria Wyników Generycznych. W odniesieniu do wyniku testowego: 1. obserwowany (otrzymany) wynik testu 2. wynik prawdziwy 3. błąd pomiaru W odniesieniu do wariancji wyników testu: 1. wariancja wyników otrzymanych 2. wariancja wyników prawdziwych 3. wariancja błędu. Wynik prawdziwy średnia wyników otrzymanych w nieskończenie wielu niezależnych pomiarach cechy określonym testem u jednej osoby. Jest to średnia wszystkich potencjalnych wyników osoby przy pomiarze określonym testem. Błąd pomiaru testowego - źródła § Właściwości osoby badanej (techniki wypełniania testu, zdolność rozumienia instrukcji, znajomość specyficznego zachowania) § Czynniki osoby badanej o incydentalnym charakterze (zdrowie, zmęczenie, motywacja, napięcie emocjonalne, warunki zewnętrzne – światło, hałas, temperatura, itp.). Założenie 1. Wszystkie błędy jakie otrzymalibyśmy, badając tę samą osobę nieskończenie wiele razy, mają rozkład normalny, a ich średnia wynosi zero Mb = 0 Założenie o nieobciążoności narzędzia pomiarowego. Założenie 2. Błąd pomiaru ma charakter losowy, a więc nie ma związku między wynikiem prawdziwym a błędem pomiaru rpb = 0 Założenie o niezależności, wynik prawdziwy i błąd są nieskorelowane. Założenie 3. Jeżeli błąd pomiaru ma charakter losowy, to również nie możemy oczekiwać istnienia żadnego związku między błędami otrzymanymi w dwóch kolejnych badaniach tym samym testem, a więc rb1b2 = 0 Błędy różnych pomiarów są nieskorelowane. Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana jest ze zróżnicowaniem zbiorowości. Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od wartości oczekiwanej. Rzetelność dokładność (precyzja) pomiaru badanej cechy; Pojęcie rzetelności jest bezpośrednio powiązane z pojęciem błędu pomiaru – nie istnieje pomiar bez błędu, im większy jest błąd, tym mniejsza jest rzetelność pomiaru danym testem Błąd obniża precyzję pomiaru – zamiast wyniku prawdziwego otrzymujemy wynik zniekształcony przez błąd. Interpretacja współczynnika rzetelności Współczynnik rzetelności wskazuje, jaka część wariancji wyników otrzymanych wynika z błędu lub ze zmienności wyników testu (niespójności odpowiedzi testowych), np. rtt=0,80 oznacza, że 80% zróżnicowania wyników uzyskanych z badania testem spowodowana została rzeczywistymi różnicami między ludźmi, a pozostałe 20% to efekt błędu pomiaru. Im mniejsze zróżnicowanie wyników testowych, tym niższa rzetelność testu. Ocena rzetelności indywidualnego wyniku Współczynnik rzetelności testu – parametr opisujący stopień precyzji wyników otrzymywanych za pomocą określonego testu Gdy interesuje nas test dla celów indywidualnej diagnozy, wtedy ważniejsza jest możliwość oceny wyniku prawdziwego konkretnej osoby Do tego celu przydatna jest znajomość standardowego błędu pomiaru. Standardowy błąd pomiaru to odchylenie standardowe różnic X - T Jest to błąd, który popełniamy wtedy, gdy przyjmujemy, że wynikiem prawdziwym danej osoby jest średni wynik, jaki uzyskałaby ta osoba w nieskończenie wielu pomiarach tym samym testem. Interpretacja standardowego błędu wyników otrzymanych Wielokrotne badanie jednej osoby nie jest możliwe (ze względu na motywację oraz pamięć) – z tego względu brany jest pod uwagę rozkład błędów pomiaru u wszystkich osób badanych (nie ma istotnej różnicy pomiędzy efektami losowymi w grupie wielu osób badanych jednorazowo oraz wielokrotnym badaniem jednej osoby – ten sam model czynników losowych). Standardowy błąd pomiaru wskazuje zakres wyników, w obrębie którego lokuje się wynik prawdziwy osoby badanej (z określonym prawdopodobieństwem) i jest identyczny dla wszystkich osób badanych (niezależnie od wyniku otrzymanego) Standardowy błąd pomiaru jest stosowany do wyznaczania przedziału ufności dla wyniku prawdziwego z określoną pewnością (0,99, 0,95) Musi być pomnożony przez wartość „z” rozkładu normalnego, czyli = 2,58 lub 1,96. Przedziały ufności Od wyniku otrzymanego odejmujemy oraz dodajemy pewną stałą wartość Ta stała wartość jest równa (zα/2)(Sbp). z α0,05 = 1,96 z α0,01 = 2,58 z α0,001 = 3,29 Sbp = So√(1 - rtt) WAIS M=100, SD=15 rtt=0,90 Sb=15√1-0,90 = 15x0,316=4,74 dla poz. α0,05 1,96x4,74=9,29 dla poz. α0,01 2,58x4,74=12,23 wynik otrzymany II = 93 wynik prawdziwy: dla 95% ufności 84-102 dla 99% 81-105 Od wyniku otrzymanego odejmujemy (otrzymujemy dolną granicę przedziału) oraz do wyniku otrzymanego dodajemy (otrzymujmy górną granicę przedziału) pewną stałą wartość (błąd pomiaru). Teoria odpowiadania na pozycje testu (item response theory) Teoria IRT konkurencyjna do KTT - to zbiór twierdzeń opisujących sposób, w jaki osoba badana odpowiada na pozycje testu. Ustala się związek między odpowiedziami udzielanymi przez b. a zakładaną, nieobserwowalną cechą leżącą u podstaw zachowań testowych np. odpowiedzi w podskali Rozumienie (WAIS) - to funkcja hipotetycznej, nieobserwowalnej cechy, tj. rozumienia sytuacji i norm społecznych. W klasycznej teorii testów (KTT) przyjmuje się, że związek między wynikiem prawdziwym (wynik stand. z ) a wynikiem otrzymanym w teście jest związkiem prostoliniowym (regresja liniowa) Przedziały ufności (zaznaczone linia przerywaną) są takie same dla wszystkich wyników, a wartość błędu pomiaru zależy od konkretnej badanej populacji. W teorii odpowiadania na pozycje testu (IRT) związek między wynikiem prawdziwym a wynikiem otrzymanym nie jest związkiem liniowym, a szerokość przedziałów ufności jest inna w środku, a inna na krańcach rozkładu (przedziały są szersze dla skrajnych wyników) Błąd standardowy pomiaru nie jest związany z konkretną populacją, podobnie jak nie są z nią związane parametry opisujące pozycje testowe. Teoria uniwersalizacji Teoria uniwersalizacji (wyników generycznych) wykorzystała koncepcję testów równoległych co pozwoliło zrezygnować z nietestowalnych założeń i twierdzeń na rzecz obserwowalnych Zależności (błędy mogą być skorelowane i może to być empirycznie stwierdzone). Testy równoległe - pojęcie Testy równoległe: mierzą tę samą cechę z taką samą dokładnością M1 = M2 S12 = S22 Testy równoważne: mierzą tę samą cechę, ale nie tak samo dokładnie M1 # M2 Testy quasi-równoważne: mierzą tę samą cechę wraz z dodatkowym czynnikiem M1 = M2 + c Podsumowanie Pomiar psychologiczny ma charakter pośredni Aby na podstawie obserwowanego zachowania osoby wyznaczyć pozycję jej cechy latentnej – musimy dysponować modelem wiążącym konstrukt psychologiczny (cechę latentną) z poziomem zachowań. W KTT wynik danej osoby w teście jest sumą dwóch składowych: wyniku prawdziwego danej osoby i błędu pomiaru Ograniczenia modelu - wynik prawdziwy określany jest tylko w stosunku do konkretnego zbioru pozycji testowych, a statystyczne właściwości pozycji testowych nie są bezpośrednio wiązane z zachowaniami testowymi. W RIT buduje się modele wiążące poziom nieobserwowalnej cechy psychologicznej z odpowiedzią na każdą kolejną pozycję testową. Zaletą tych modeli jest to, że poziom mierzonej cechy może zostać oszacowany na podstawie każdej pozycji testowej pod warunkiem, że znane są jej parametry, a statystyczne właściwości tych pozycji są bezpośrednio wiązane z zachowaniami testowymi (Embredson, 2000). Zagadnienia Elementy składowe Klasycznej Teorii Testów Elementy składowe wyniku otrzymanego Co to jest wynik prawdziwy Źródła błędu pomiaru testowego Założenia dotyczące błędu pomiaru Pojecie rzetelności Interpretacja współczynnika rzetelności Standardowy błąd pomiaru Od czego zależy wielkość stand. błędu pomiaru Jak wyznaczamy przedziały ufności Teoria Odpowiadania na Pozycje Testowe – różnice w stosunku do KTT 12. Teoria Uniwersalizacji – pojęcie testów równoległych. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.