POBIERZ wykład nr 12
Transkrypt
POBIERZ wykład nr 12
2017-01-23 Hipotezy statystyczne Testy statystyczne Testowanie hipotez statystycznych pozwala na sprawdzenie na podstawie wyników próby, przy zadanym poziomie ufności, czy jakieś twierdzenie (hipotezę) dotyczące populacji generalnej jest prawdziwe. Taką procedurę nazywamy testem statystycznym. Przykłady: 1) Czy próbka pochodzi z rozkładu normalnego? 2) Czy na podstawie próby można powiedzieć, że wartość oczekiwana jest większa niż pewna wybrana liczba? 3) Czy wariancje dwóch rozkładów, z których mamy dwie różne próbki, są sobie równe czy nie? Jak widać mamy zawsze do czynienia z pewną hipotezą zerową H0, którą sprawdzamy i hipotezą alternatywną H1, którą przyjmiemy gdy w wyniku testu odrzucamy H0. Hipotezy można podzielić też na proste (jednoznacznie określają rozkład, funkcję gęstości prawdopodobieństwa lub dystrybuantę zmiennej losowej) i złożone (pozostałe). Inny podział: parametryczna i nieparametryczna. RPiS 2016/2017 1) Sformułowanie hipotezy zerowej H 0. 2) Określenie rozmiaru próbki n. 3) Ustalamy poziom istotności a, zwany również poziomem błędu testu. Jest to prawdopodobieństwo popełnienia błędu I-go rodzaju, a więc odrzucenia, w wyniku testu, hipotezy H 0, podczas gdy jest ona w rzeczywistości prawdziwa. Zazwyczaj a<0.1. 4) Sformułowanie hipotezy alternatywnej H 1. 5) Zakładamy chwilowo, że H0 jest prawdziwa, i wybieramy statystykę testową d, zależną od próby, o znanym rozkładzie prawdopodobieństwa. 6) Wyznaczmy obszar krytyczny W dla wartości d, zależny od a, H1 i n, w taki sposób, że prawdopodobieństwo, że dW wynosi a. 7) Wyliczamy, otrzymaną na podstawie pobranej próby, wartość statystyki d. Gdy należy ona do obszaru krytycznego W to odrzucamy H0, w przeciwnym razie twierdzimy, że nie ma podstaw do odrzucenia H0. 1 RPiS 2016/2017 Testy statystyczne - uwagi 1 / 2 nY 1 s 2 ( X ) s 2 (Y ) var( X ) var(Y ) nY nX 1 s 2 ( X ) s 2 (Y ) s 2 ( X ) s 2 (Y ) 1 nY n X nY nX ( X E ( X )) n Gdy nie znamy odchylenia standardowego s: t Ma ona rozkład t-Studenta o n-1 stopniach swobody. S ( X ) H1 E(X)≠X0 E(X)>X0 E(X)<X0 W (znane s) W (nieznane s) |u|>u1-a/2 u>u1-a u<ua |t|>t1-a/2 t>t1-a t<ta 4 Gdy sX2 i sY2 są nieznane lecz równe, statystyką testową jest t X Y n nY S ( X ,Y ) X n X nY S ( X ,Y ) (n X 1) S 2 ( X ) (nY 1) S 2 (Y ) n X nY 2 Ma ona rozkład t-Studenta o (nX+nY-2) stopniach swobody. 1 s 2 ( X ) s 2 (Y ) var( X Y ) var(U ) nY nX Zał. Próbka o liczebności n pochodzi z rozkładu N(E(X),s2). Badamy H0: E(X)=X0. Statystyką testową jest: ( X E ( X )) n Gdy znamy odchylenie standardowe s: U s (X ) Ma ona rozkład N(0,1). Testy statystyczne dotyczące równości dwóch wartości oczekiwanych nX H0 E ( X ) E (Y ) 0 RPiS 2016/2017 Zał. Dwie populacje i dwie próbki: pierwsza o liczebności nX pochodzi z rozkładu N(E(X),sX2), druga o liczebności nY pochodzi z rozkładu N(E(Y),sY2). Badamy H0: E(X)=E(Y). X Y Gdy sX2 i sY2 są znane statystyką testową jest U s 2 ( X ) s 2 (Y ) Ma ona rozkład N(0,1). s 2 ( X ) s 2 (Y ) E (U ) nY nX 3 Testy statystyczne dotyczące równości dwóch wartości oczekiwanych 2 Testy statystyczne dotyczące E(X) Określenie obszaru krytycznego na podstawie a jest niejednoznaczne. Można to poprawić wprowadzając prawdopodobieństwo błędu II-go rodzaju: przyjęciu fałszywej H0, gdy w rzeczywistości prawdziwa jest hipoteza alternatywna H1. Prawdopodobieństwo to oznaczamy b, a 1-b nazywamy mocą testu. Jeżeli znamy f(d|H0) (a) i f(d|H1) (b) to obszar krytyczny wyznaczamy jako zakres wartości d, który minimalizuje b przy zadanym a. Zazwyczaj znamy tylko f(d|H0) i nie znamy mocy testu co oznacza, że nie możemy twierdzić, że H0 jest prawdziwa, a tylko, że nie odrzucamy H0. Test statystyczny, przy nieznajomości b, nazywamy testem istotności. W praktyce opracowane są zestawy statystyk testowych i zakresy obszaru krytycznego dla różnych rodzajów hipotez H0 i H1. W większości testów zakładamy, że próbka pochodzi z rozkładu normalnego. RPiS 2016/2017 Schemat postępowania: H1 W H1 W E(X)≠E(Y) E(X)>E(Y) |u|>u1-a/2 u>u1-a E(X)≠E(Y) E(X)>E(Y) |t|>t1-a/2 t>t1-a RPiS 2016/2017 5 RPiS 2016/2017 6 1 2017-01-23 Testy statystyczne dotyczące równości dwóch wartości oczekiwanych Gdy t sX2 i sY2 Testy statystyczne dotyczące var(X) są nieznane i są różne, statystyką testową jest X Y 2 Zał. Próbka o liczebności n pochodzi z rozkładu N(E(X),s2). Badamy H0: s2(X)=s02. (n 1) S 2 ( X ) Statystyką testową jest: Q 2 2 s0 2 2 Ma ona rozkład n1 ( x) (Chi-kwadrat o n-1 stopniach swobody). S ( X ) S (Y ) nX nY Ma ona rozkład przybliżany przez rozkład t-Studenta o efektywnej liczbie stopniach swobody int(neff). neff 2, n 1 2, n 1 Q2 < a / 2 Q2 > 1a / 2 W s2(X)> s02 |t|>t1-a/2 t>t1-a s2(X)< s02 Q2 > 12,an1 2, n 1 Q2 < a H1 E(X)≠E(Y) E(X)>E(Y) RPiS 2016/2017 7 Testy statystyczne dotyczące równości dwóch wariancji W H1 s2(X)≠ s02 2 S 2 ( X ) S 2 (Y ) nY nX 2 2 2 2 1 S (X ) 1 S 2 (Y ) n X 1 n X nY 1 nY RPiS 2016/2017 Testy statystyczne dotyczące równości wariancji Zał. Dwie populacje i dwie próbki: pierwsza o liczebności nX pochodzi z rozkładu N(E(X),sX2), druga o liczebności nY pochodzi z rozkładu N(E(Y),sY2) i na podstawie próby S2(X)>S2(Y). Badamy H0: sX2=sY2. S2(X ) Statystyką testową jest: F F (n X 1, nY 1) 2 Dla Ma ona rozkład Fishera-Snedecora o (nX-1) i (nY-1) stopniach swobody. Inne nazwy: rozkład F-Fishera, F, F-ratio. b a2 F (a , b ) a b2 S2(X)>S2(Y): F F (n X 1, nY 1) S (Y ) H1 W F>F1-a(nX-1,nY-1) F-1>Fa(nY-1,nX-1) F<Fa/2(nX-1,nY-1) F>F1-a/2(nX-1,nY-1) sX2 Fa(nX,nY)=(F1-a (nY,nX))-1 9 S2(X ) S 2 (Y ) sX2 > sY2 sX2 < sY2 RPiS 2016/2017 8 ≠ sY2 Przykład: test równości wartości oczekiwanych dwóch rozkładów przy nieznajomości ich wariancji Równość wielu wariancji – test Bartletta. RPiS 2016/2017 10 2