(Microsoft PowerPoint - MJ prezentacja I zajecia.ppt [tryb zgodno

Transkrypt

(Microsoft PowerPoint - MJ prezentacja I zajecia.ppt [tryb zgodno
Modelowanie wielopoziomowe
wstęp
Maciej Jakubowski
Artur Pokropek
październik 2008
Plan dzisiejszych zajęć
1)
Co to są dane wielopoziomowe? Dlaczego dane
edukacyjne?
2)
Co to jest modelowanie wielopoziomowe? Jakiego rodzaju
modele są stosowane w praktyce? Zalety i wady modeli
wielopoziomowych
3)
Charakterystyka baz danych, z których będziemy korzystać:
PISA, baza EWD-CKE, baza CKE-PENTOR
4)
Oprogramowanie
5)
Literatura
2
Co to są dane wielopoziomowe?
ZałóŜmy, Ŝe interesuje nas wpływ poglądów politycznych w rodzinie na
decyzje zawodowe jej członków
Losujemy z populacji próbę gospodarstw domowych
W kaŜdym gospodarstwie losujemy lub zapraszamy do badania wszystkich
członków gospodarstwa
Jak pogrupowane są te dane?
Jaka jest liczba unikalnych statystycznie obserwacji?
Czy poglądy polityczne i zawodowe róŜnić się będą bardziej między
rodzinami (gospodarstwami domowymi) czy między członkami rodzin
(osobami)
Czy jeśli chcielibyśmy kontrolować wiek respondentów (przypuszczając,
Ŝe ma kluczowy wpływ zarówno na poglądy jak i pozycję zawodową), to
będzie on wyjaśniał róŜnice wewnątrz rodzin czy między osobami?
Czy badane zaleŜności zachodzą między rodzinami czy wewnątrz rodzin?
3
Co to są dane wielopoziomowe?
ZałóŜmy, Ŝe interesuje nas wpływ metod nauczania na wyniki uczniów
Losujemy z populacji próbę szkół
W kaŜdej szkole losujemy 2 klasy
W kaŜdej klasie losujemy 20 uczniów
Jak pogrupowane są te dane?
Jaka jest liczba unikalnych statystycznie obserwacji?
Czy metody nauczania będą się róŜnić między szkołami, klasami, czy
uczniami? Czy wyniki uczniów będą się róŜnić między szkołami, klasami,
czy uczniami?
ZałóŜmy, Ŝe chcemy kontrolować wpływ wieku nauczycieli. Czy będzie on
się róŜnił między szkołami, klasami, czy uczniami?
Czy wyniki uczniów zaleŜy od cech szkół, klas, czy uczniów (osób i ich
rodzin)?
Czy wpływ metod nauczania na wyniki uczniów zaleŜy od cech szkół,
klas, czy uczniów (osób i ich rodzin)?
4
Jak tworzone są zbiory danych
wielopoziomowych?
losowanie z populacji szkół
szkoła 27
losowanie klas
klasa A
szkoła 53
losowanie klas
klasa C
klasa D
klasa E
5
Jak tworzone są zbiory danych
wielopoziomowych?
cała populacja szkół i uczniów
jako próba z „superpopulacji” szkół i uczniów
szkoła 27
wszystkie klasy i uczniowie
szkoła 53
wszystkie klasy i uczniowie
6
Dlaczego dane edukacyjne?
Współczesne badania edukacyjne najczęściej opierają się o
losową próbę uczniów lub dane dla całej populacji szkół i uczniów
Jeśli mamy do czynienia z próbą uczniów to nie jest to nigdy (w
kaŜdym razie nie znamy takiego przypadku) prosta próba losowa
to byłoby zbyt kosztowne, bardzo skomplikowane organizacyjnie
nie moŜna badać procesów wewnątrzszkolnych
znacznie taniej jest wylosować próbę szkół, a potem uczniów lub
całych klas
wtedy moŜemy badać procesy wewnątrzszkolne, ew. takŜe
róŜnice między klasami (nauczycielami)
Dane edukacyjne mają prawie zawsze strukturę
wielopoziomową (hierarchiczną)
7
dlaczego struktura danych ma znaczenie?
uczniowie w szkołach są podobni do siebie, poniewaŜ:
procesy selekcji i segregacji w systemie szkolnym
pozaszkolne róŜnice między osiedlami, miejscowościami, regionami
uczeni są przez tym samych nauczycieli, uŜywając tych samych metod,
podręczników itp.
efekty rówieśników, motywacja, klimat szkolny – bardzo silne, choć mało
poznane czynniki
jeśli badamy cechy na poziomie szkół (klas, nauczycieli) to mamy
tak naprawdę tyle obserwacji, co szkół (klas, nauczycieli)
dane o uczniach pomagają jednak zwiększyć precyzję przez
uwzględnienie ich cech
zastosowanie zwykłych metod do danych o uczniach
pogrupowanych w szkołach często prowadzi do błędnych
interpretacji
8
Poziomy analizy w Polsce
poziom regionu
dane makroekonomiczne i społeczne (BDR GUS)
poziom powiatu
zarządzanie szkolnictwem średnim, dane o
bezrobociu itp. (BDR GUS)
poziom gminy
zarządzanie przedszkolami i szkolnictwem
podstawowym oraz gimnazjalnym (BDR GUS)
miejscowość/osiedle cechy społeczne i ekonomiczne, w Polsce
dane tylko dla miejscowości = gmina/powiat
szkoła
główny poziom analizy, dane SIO, agregaty z danych
egzaminacyjnych
klasa
agregaty z danych egzaminacyjnych,
potencjalnie dane o nauczycielach (kwestionariusze)
uczeń
pomiar umiejętności, kwestionariusze ucznia i rodziców
wielokrotne pomiary dla tego samego ucznia dane dopiero powstają
9
Modelowanie wielopoziomowe
Opierają się na modelu regresji liniowej, mają korzenie w ANOVA
Wiele nazw:
- Hierarchical Linear Models (HLM)
- Multilevel models
- Mixed models
- Random Effects (intercept, coefficient) models
- Growth models, Latent (curve) variable models – np. dla danych z
wielokrotnym pomiarem umiejętności uczniów
Modele wielopoziomowe dominują w socjologii i badaniach edukacyjnych
wszystkich dyscyplin, ale i w analizach biznesu (firmy i pracownicy),
badaniach sondaŜowych i wszędzie gdzie mamy hierarchiczne dane i
procesy na poziomie indywidualnym i grupowym
Ekonomiści uŜywają regresji liniowej z błędami standardowymi
skorygowanymi o skorelowanie reszt wewnątrz grup („clustered robust
standard errors”) – w pewnych warunkach dają identyczne rezultaty
10
Modelowanie wielopoziomowe a regresja liniowa
Regresja liniowa odnosi wariancję w ciągłej, mierzonej na skali
interwałowej zmiennej zaleŜnej do wariancji we wszelkiego typu
zmiennych niezaleŜnych (ciągłych, mierzonych na skali interwałowej;
porządkowych; nominalnych)
Na przykład model objaśniający wyniki uczniów przez płeć (zmienna
nominalna), status społeczno-ekonomiczny rodziców (ciągła na poziomie
ucznia) oraz średni status w szkole (ciągła na poziomie szkoły)
yij = β 0 + β1 girlij + β2 SESij + β3 SE S j + ε ij
W takim modelu nie bierzemy pod uwagę, Ŝe:
uczniowie pogrupowani są w szkołach, a przez to ich wyniki (reszty z
regresji) są skorelowane wewnątrz szkół
średni wynik szkoły jest zmienną na poziomie szkoły, a nie ucznia, przez co
liczba dostępnych obserwacji jest zawyŜona
szkoły róŜnią się pod względem innych, tzw. ukrytych cech
cechy ukryte mogą być niemierzalne lub po prostu niedostępne czy
pominięte w modelu
11
Modele wielopoziomowy z losową stałą
Dwu- lub trzy-poziomowe modele z losową stałą
Skorygujmy poprzedni model o róŜnice między szkołami
yij = β 0 + β1 girlij + β2 SESij + β3 SE S j + u j + ε ij
u j to tzw. efekt szkoły, a sposób w jaki uwzględnimy go w modelu określa
rodzaj zastosowanego modelu i jego interpretację
w modelach wielopoziomowych zakładamy, Ŝe efekty te mają charakter
losowy, a przez to rozkład normalny o stałej, znanej wariancji
u j ~ (0, σ u2 )
w ten sposób zamiast estymować dla kaŜdej szkoły jej „efekt” (jak w
modelu z efektami stałymi) wystarczy, Ŝe oszacujemy jedynie wariancję
efektów szkół (standardowo przyjmując, Ŝe ich średnia wynosi zero).
Taki model nazywamy wielopoziomowym = hierarchicznym = z losową
stałą = z efektami losowymi
12
Modele wielopoziomowy z losową stałą
i losowym nachyleniem
Zakładamy, Ŝe związek między pochodzeniem społecznym uczniów a
wynikami nie jest taki sam w kaŜdej szkole
Zakładamy przy tym, Ŝe zmiany w nachylenie SES między szkołami mają
charakter losowy, a więc nachylenie ma rozkład normalny o stałej
wariancji
yij = β 0 + β1 girlij + β2 SESij + β3 SE S j + u1 j SESij + u0 j + ε ij
Zwykle zakładamy, Ŝe
u0 j ~ (0, σ u20 )
u1 j ~ (0, σ u21 )
cov(u0 , u1 ) ≠ 0
Czyli, Ŝe efekty losowe mają rozkłady normalne o stałej wariancji i są ze
sobą skorelowane
13
Modele wielopoziomowy z losową stałą
i losowym nachyleniem
Losowe nachylenie moŜemy objaśniać interesującymi nas zmiennymi
ciekawym zagadnieniem jest, czy relacja między pochodzeniem
społecznym a wynikami uczniów w szkole zaleŜy od średniego statusu w
szkole, a więc od środowiska społecznego szkoły
yij = β 0 + β1 girlij + β2 SESij + β3 SE S j + β 4 SESij ⋅ SE S j
+ u1 j SESij + u0 j + ε ij
Oczekujemy (i to na pewno potwierdzą dane), Ŝe zarówno SES ucznia, jak
i średni SES szkoły, pozytywnie wpływają na wyniki
RóŜne teorie przewidują inny efekt interakcji między tymi zmiennymi
Pozytywna ocena parametru β 4 oznacza, Ŝe im wyŜszy średni SES, tym
bardziej stroma relacja między wynikami a pochodzeniem, czyli szkoły o
„lepszym” składzie nie są korzystne dla uczniów z niskim SES
Ocena negatywna sugeruje, Ŝe szkoły o wysokim SES mają zdolność do
wyrównywania szans edukacyjnych, sprzyjając uczniom z niskim SES
14
Jak jest w istocie? Analiza dla Polski PISA 2006
uruchamiamy do-file szacujący podobne modele dla danych z PISA
2006 dla Polski
ESCS to skala statusu społeczno-ekonomicznego oraz zasobów
kulturowo-materialnych rodziny ucznia
pv1scie – to wynik ucznia, a dokładniej pierwsza „plausible value”
mierząca osiągnięcia w naukach ścisłych („science literacy „)
szacujemy pięć modeli:
1.
2.
3.
4.
5.
pusty
ze zmiennymi na poziomie ucznia
ze zmiennymi na poziomie ucznia i szkoły
ze zmiennymi na poziomie ucznia i szkoły oraz losowym
nachyleniem SES w szkole
ze zmiennymi na poziomie ucznia i szkoły oraz losowym
nachyleniem SES w szkole objaśnianym przez średni SES w szkole
15
Jak jest w istocie? Analiza dla Polski PISA 2006
zmienna
girl
model 1
escs
model 2
-0.745
model 3
-0.877
model 4
-0.896
model 5
-0.929
(2.21)
(2.21)
(2.21)
(2.21)
36.817
35.254
35.261
36.361
(1.38)
(1.45)
(1.53)
(1.71)
16.225
16.133
15.921
(4.53)
(4.56)
(4.53)
mean_escs
escs*mean_escs
4.221
(3.07)
_cons
499.786
510.18
514.168
514.057
513.222
var(eij)
6932.0
var(cons)
996.1
var(slope)
corr(cons, slope)
6194.7
494.6
6192.5
452.1
6171.1
443.1
38.2
0.061
6175.2
433.0
32.8
0.062
16
Dlaczego potrzebujemy modeli
wielopoziomowych
Metody analizy wariancji (ANOVA, ANCOVA) dopuszczają jako
zmienne niezaleŜne tylko nominalne lub pojedyncze zmienne
ciągłe, a zmienna zaleŜna musi być ciągła
Stąd wykorzystuje się metodę regresji liniowej dla ciągłych
zmiennych zaleŜnych i podobne metody dla zmiennych nieciągłych
(probit, logit, mlogit, ologit itp.) - w ten sposób moŜna
modelować dowolne zestawy zmiennych
Jednak typowe modele nie biorą pod uwagę pogrupowania danych
i podają błędne (zaniŜone) błędy standardowe
Wiele znanych artykułów wnioskuje w nieuprawiony sposób, Ŝe
badane relacje są istotne statystycznie, poniewaŜ zawyŜa ilość
dostępnej informacji
Modele wielopoziomowe pozwalają na modelowanie relacji
między zmiennymi dowolnego typu poprawne szacując błędy
standardowe
17
Dlaczego potrzebujemy modeli
wielopoziomowych
Niemal te same wyniki moŜemy uzyskać stosując regresję liniową
z efektami stałymi i korektą błędów standardowych z uwagi na
pogrupowanie (np. uczniów w szkołach), co jest obecnie
standardem w ekonometrii i jest łatwo wykonalne w Stata
Modele te nie szacują jednak wariancji w zmiennej zaleŜnej na
róŜnych poziomach analizy, która sama w sobie stanowi często
zainteresowanie analityków
W modelu z efektami stałymi nie moŜemy włączać do analizy
zmiennych na poziomie grupy, bo cała zmienność jest wyjaśniona
przez oszacowane efekty stałe (osobne parametry dla kaŜdej
grupy)
Modele wielopoziomowe szacują wariancję na kaŜdym
poziomie grupy i pozwalają na jej objaśnianie zmiennymi na
tym poziomie
18
Przykład: regresja, regresja z korektą
oraz model wielopoziomowy
zmienna
girl
escs
mean_escs
_cons
regresja liniowa
regresja liniową z
korektą na
pogrupowanie
model
wielopoziomowy
z losową stałą
-0.01
-0.01
-0.88
(2.3)
(2.3)
(2.2)
35.29
35.29
35.25
(1.5)
(1.5)
(1.4)
15.53
15.53
16.23
(2.9)
(5.1)
(4.5)
513.78
513.78
514.17
19
Kiedy moŜna stosować modele
wielopoziomowe
hierarchiczna struktura danych
jeśli analizowane grupy są postrzegane jako losowa próba z
większej populacji (lub superpopulacji)
jeśli kaŜda grupa postrzegana jest jako odrębny podmiot, którym
„rządzą” specyficzne dla kaŜdej grupy prawa, to powinno stosować
się model z efektami stałymi (np. płeć, grupa etniczna itp.)
kiedy chcemy objaśniać procesy „rządzące” grupami, o których
zakładamy, Ŝe są dla tych grup wspólne
jeśli rozmiary grup są niewielkie (<100), wtedy zakładając, Ŝe
grupami rządzą podobne „prawa” szacujemy efekty grup
wykorzystując informację z całej populacji, a nie tylko kilkunastu
obserwacji dla tej grupy, która jest mało precyzyjna
z drugiej strony, zakładamy, Ŝe efekty grupowe mają rozkład
normalny, co nie zawsze jest prawdziwe i musi być testowane
20
Bazy danych, z których będziemy korzystać
PISA: dane z 2000, 2003 i 2006 są publicznie dostępne w
Internecie dla wszystkich uczestniczących krajów
EWD-CKE - losowa próba z bazy danych wykorzystywanej przez
Centralną Komisję Egzaminacyjną do szacowania Edukacyjnej
Wartości Dodanej
CKE-PENTOR - badanie Centralnej Komisji Egzaminacyjnej
zrealizowane przez PENTOR
W oparciu o te dane mają Państwo przeprowadzić badanie na
zaliczenie zajęć
MoŜna teŜ uŜyć innych danych (np. PIRLS, TIMSS), ale po naszej
zgodzie
Dane PISA oraz EWD-CKE poznamy na najbliŜszych zajęciach
21
międzynarodowe badania osiągnięć uczniów
PISA (reading, mathematics, science) – Polska we wszystkich
edycjach
2000 - reading
2003 - mathematics
2006 – science
2009 - reading
PIRLS – reading literacy, 2001, 2006, czwarta klasa, Polska w 2006
po raz pierwszy
TIMSS (mathematics + science), 1995, 1999, 2003, 2007, czwarta i
ósma klasa – Polska nigdy nie uczestniczyła
CIVIC – badanie kompetencji obywatelskich – Polska uczestniczy
22
Pomiar umiejętności
w PISA, PIRLS, TIMSS i NAEP
róŜne przedmioty
i róŜne ich definicje
(PISA – reading, math, science; PIRLS – reading; TIMSS – math, science)
PISA - umiejętności potrzebne w Ŝyciu dorosłym
TIMSS, PIRLS, NAEP - umiejętności ujmowane w curriculum
róŜnice w losowaniu (PISA – szkoły, PIRLS, TIMSS – klasy)
podobne metody pomiaru umiejętności uczniów
skalowanie przez IRT (Item Response Theory)
rotating test booklets
ocena umiejętności ucznia jako plausible values – prawidłowa jeśli
wnioskujemy o całej populacji
23
Plausible values
24
600
RóŜnice
osiągnięciach
uczniów
Science:
średniw
wynik
i odchylenie standardowe,
PISA 2006
PISA 2006
mean performance in science
450
500
550
FIN
CAN
NLD
KOR
HUN
POL
ESP
PRT
IRL
SWE
DNK
SVK
GRC
JPN
AUS
DEU
AUTCZE
CHE
BEL
ISL
LUX
NOR
NZL
GBR
FRA
USA
ITA
TUR
400
MEX
80
90
100
standard deviation of scores
110
25
Poziom kapitału ludzkiego w Polsce:
badanie kompetencji 15-latków PISA 2000 - czytanie
0
.001
Density
.002
.003
.004
Polska a inne kraje: czytanie w PISA 2000
0
200
400
600
plausible value in reading
Polska
800
1000
OECD
26
Poziom kapitału ludzkiego w Polsce:
badanie kompetencji 15-latków PISA 2003 - matematyka
0
.001
Density
.002
.003
.004
Polska a inne kraje: matematyka w PISA 2003
0
200
400
600
plausible value in math
Polska
800
1000
OECD
27
Poziom kapitału ludzkiego w Polsce:
badanie kompetencji 15-latków PISA 2006 - science
0
.001
Density
.002
.003
.004
Polska a inne kraje: science w PISA 2006
0
200
400
600
plausible value in science
Polska
800
1000
OECD
28
Poziom kapitału ludzkiego w Polsce:
zmiany między PISA 2000 a 2006 – czytanie
0
.001
Density
.002
.003
.004
Polska: czytanie w PISA 2000 i PISA 2006
0
200
400
600
plausible value in reading
2000
800
2006
29
Dane PISA
15-latkowie
2000 w Polsce: uczniowie I klasy szkół średnich
2003 i 2006 w Polsce: uczniowie III klas gimnazjów
Porównywalne międzynarodowo, kilkadziesiąt krajów w kaŜdej
edycji, próby od 2 do 20 tysięcy uczniów w kaŜdym kraju
kwestionariusz ucznia i pomiar umiejętności imputowany dla
kaŜdego ucznia dla kaŜdej dziedziny
bogaty zestaw zmiennych charakteryzujących ucznia i jego
rodzinę
mało informacji na poziomie szkoły
zmienne określające motywację, metody uczenia się itp.
w skrócie moŜna stwierdzić, Ŝe PISA to dane dla socjologów, a
PIRLS i TIMSS dla pedagogów i psychologów
30
400
PISA science score
450
500
550
600
650
Relacja między SES rodziców a
wynikiem ucznia w PISA 2006
20
40
60
highest parental occupational status (sei)
Polska
Finlandia
80
OECD
31
0
.001
.002
.003
.004
różnica w wynikach immigrantów, PISA 2006
0
200
400
600
plausible value in science
native
800
1000
migrants
32
baza danych EWD-CKE
losowa próba powstała z danych dla niemal całej populacji
uczniów w Polsce, dostępna dla Państwa i niedługo w Internecie
połączone, na poziomie ucznia, wyniki sprawdzianu
szóstoklasistów z egzaminem gimnazjalnym w obu częściach
3 kohorty:
2002 sprawdzian 2005 egzamin gimnazjalny
2003 sprawdzian 2006 egzamin gimnazjalny
2004 sprawdzian 2007 egzamin gimnazjalny
Wylosowana próba obejmuje 200 szkół z 1-2 klasami dla kaŜdej
kohorty, niemal 28000 uczniów
wyniki oraz płeć i dysleksja jako cechy ucznia
zmienne z baz GUS na poziomie gminy, a w przyszłości zmienne z
baz SIO na poziomie szkoły
zmienne zagregowane do poziomu szkoły i gminy z danych
egzaminacyjnych dla całej populacji
33
Dane CKE-Pentor
Badanie zrealizowane w maju/czerwcu 2006 roku
wylosowano 94 gimnazja, a w nich wylosowano do 20 uczniów
zrealizowano ok. 1500 ankiet z wylosowanymi uczniami i ok. 2500
z wszystkimi uczniami wylosowanych klas
ankiety rodziców – ok. 1800 zrealizowanych ankiet
ankiety dla nauczycieli – ok. 1000 zrealizowanych ankiet
ankiety dyrektorów szkół – ok. 90 zrealizowanych ankiet
dołączono wyniki uczniów z egzaminu gimnazjalnego (dla ok. 1200
uczniów)
ankiety podobne do ankiet PISA + pomiar IQ
raporty opublikowane w Biuletynie Badawczym CKE i dostępne na
WWW.CKE.EDU.PL
skorygowana baza danych będzie dostępna dla Państwa i niedługo
w Internecie
34
Oprogramowanie
Specjalistyczne programy: HLM, Mplus …
niektóre bardzo drogie, choć dostępne teŜ wersje studenckie
w większości tylko do szacowania modeli wielopoziomowych
Wielozadaniowe pakiety statystyczne
SAS – PROC MIXED – pierwszy pakiet
SPSS – SPSS MIXED – popularny wśród socjologów, ale mało
zaawansowany, nieelastyczny
Stata – popularny wśród ekonomistów, ale i w naukach
społecznych. Od wersji 10 nieograniczone moŜliwości
modelowania wielopoziomowego. Dodatkowe pakiety pisane
przez uŜytkowników umoŜliwiają przeprowadzenie niemal
kaŜdej analizy statystycznej. Pakiet analiz danych
sondaŜowych.
R – język analiz statystycznych, nieograniczone moŜliwości,
ale nieco trudniejszy
35
Literatura
Rabe-Hesketh S., Skrondal A. (2005, II wydanie 2008). Multilevel
and Longitudinal Modeling Using Stata. Stata Press.
Raudenbush S. W., Bryk A., 2002, “Hierarchical Linear Models”,
wyd. II, Sage
Snijders Tom A.B., Bosker Roel J., 1999, “Multilevel Analysis: An
Introduction to Basic and Advanced Multilevel Modeling”, Sage
Goldstein H., 1999, „Multilevel Statistical Models” (poprawione
wydanie II dostępne na: www.ats.ucla.edu/stat/examples/
msm_goldstein/goldstein.pdf)
36
Dziękuję za uwagę!
37