POBIERZ wykład nr 12

Transkrypt

POBIERZ wykład nr 12
2017-01-23
Hipotezy statystyczne


Testy statystyczne
Testowanie hipotez statystycznych pozwala na sprawdzenie na
podstawie wyników próby, przy zadanym poziomie ufności, czy
jakieś twierdzenie (hipotezę) dotyczące populacji generalnej jest
prawdziwe. Taką procedurę nazywamy testem statystycznym.
Przykłady:
1) Czy próbka pochodzi z rozkładu normalnego?
2) Czy na podstawie próby można powiedzieć, że wartość
oczekiwana jest większa niż pewna wybrana liczba?
3) Czy wariancje dwóch rozkładów, z których mamy dwie różne
próbki, są sobie równe czy nie?

Jak widać mamy zawsze do czynienia z pewną hipotezą zerową
H0, którą sprawdzamy i hipotezą alternatywną H1, którą
przyjmiemy gdy w wyniku testu odrzucamy H0.

Hipotezy można podzielić też na proste (jednoznacznie określają
rozkład, funkcję gęstości prawdopodobieństwa lub dystrybuantę
zmiennej losowej) i złożone (pozostałe).
Inny podział: parametryczna i nieparametryczna.

RPiS 2016/2017
1) Sformułowanie hipotezy zerowej H 0.
2) Określenie rozmiaru próbki n.
3) Ustalamy poziom istotności a, zwany również poziomem błędu
testu. Jest to prawdopodobieństwo popełnienia błędu I-go rodzaju,
a więc odrzucenia, w wyniku testu, hipotezy H 0, podczas gdy jest ona w
rzeczywistości prawdziwa. Zazwyczaj a<0.1.
4) Sformułowanie hipotezy alternatywnej H 1.
5) Zakładamy chwilowo, że H0 jest prawdziwa, i wybieramy statystykę
testową d, zależną od próby, o znanym rozkładzie prawdopodobieństwa.
6) Wyznaczmy obszar krytyczny W dla wartości d, zależny od a, H1 i n, w
taki sposób, że prawdopodobieństwo, że dW wynosi a.
7) Wyliczamy, otrzymaną na podstawie pobranej próby, wartość statystyki
d. Gdy należy ona do obszaru krytycznego W to odrzucamy H0, w
przeciwnym razie twierdzimy, że nie ma podstaw do odrzucenia H0.
1
RPiS 2016/2017
Testy statystyczne - uwagi




1 / 2
nY
1


 s 2 ( X ) s 2 (Y ) 
 var( X )  var(Y ) 
 

nY 
 nX
1
 s 2 ( X ) s 2 (Y )   s 2 ( X ) s 2 (Y ) 
 
 1
 


nY   n X
nY 
 nX
( X  E ( X )) n
Gdy nie znamy odchylenia standardowego s: t 
Ma ona rozkład t-Studenta o n-1 stopniach swobody. S ( X )
H1
E(X)≠X0
E(X)>X0
E(X)<X0
W
(znane s)
W
(nieznane s)
|u|>u1-a/2
u>u1-a
u<ua
|t|>t1-a/2
t>t1-a
t<ta
4

Gdy sX2 i sY2 są nieznane lecz równe, statystyką testową jest
t
X Y
n  nY
S ( X ,Y ) X
n X nY
S ( X ,Y ) 
(n X  1) S 2 ( X )  (nY  1) S 2 (Y )
n X  nY  2
Ma ona rozkład t-Studenta o (nX+nY-2) stopniach swobody.
1
 s 2 ( X ) s 2 (Y ) 
 var( X  Y ) 
var(U )  

nY 
 nX

Zał. Próbka o liczebności n pochodzi z rozkładu N(E(X),s2).
Badamy H0: E(X)=X0.
Statystyką testową jest:
( X  E ( X )) n
Gdy znamy odchylenie standardowe s: U 
s (X )
Ma ona rozkład N(0,1).
Testy statystyczne dotyczące równości
dwóch wartości oczekiwanych
nX
H0
E ( X )  E (Y )   0

RPiS 2016/2017
Zał. Dwie populacje i dwie próbki: pierwsza o liczebności nX
pochodzi z rozkładu N(E(X),sX2), druga o liczebności nY pochodzi z
rozkładu N(E(Y),sY2).
Badamy H0: E(X)=E(Y).
X Y
Gdy sX2 i sY2 są znane statystyką testową jest U 
s 2 ( X ) s 2 (Y )
Ma ona rozkład N(0,1).

 s 2 ( X ) s 2 (Y ) 

E (U )  

nY 
 nX

3
Testy statystyczne dotyczące równości
dwóch wartości oczekiwanych

2
Testy statystyczne dotyczące E(X)
Określenie obszaru krytycznego na podstawie a jest
niejednoznaczne. Można to poprawić wprowadzając
prawdopodobieństwo błędu II-go rodzaju: przyjęciu fałszywej H0,
gdy w rzeczywistości prawdziwa jest hipoteza alternatywna H1.
Prawdopodobieństwo to oznaczamy b, a 1-b nazywamy mocą
testu.
Jeżeli znamy f(d|H0) (a) i f(d|H1) (b) to obszar krytyczny wyznaczamy
jako zakres wartości d, który minimalizuje b przy zadanym a.
Zazwyczaj znamy tylko f(d|H0) i nie znamy mocy testu co oznacza,
że nie możemy twierdzić, że H0 jest prawdziwa, a tylko, że nie
odrzucamy H0. Test statystyczny, przy nieznajomości b, nazywamy
testem istotności.
W praktyce opracowane są zestawy statystyk testowych i zakresy
obszaru krytycznego dla różnych rodzajów hipotez H0 i H1. W
większości testów zakładamy, że próbka pochodzi z rozkładu
normalnego.
RPiS 2016/2017

Schemat postępowania:

H1
W
H1
W
E(X)≠E(Y)
E(X)>E(Y)
|u|>u1-a/2
u>u1-a
E(X)≠E(Y)
E(X)>E(Y)
|t|>t1-a/2
t>t1-a
RPiS 2016/2017
5
RPiS 2016/2017
6
1
2017-01-23
Testy statystyczne dotyczące równości
dwóch wartości oczekiwanych

Gdy
t
sX2
i
sY2
Testy statystyczne dotyczące var(X)


są nieznane i są różne, statystyką testową jest
X Y
2

Zał. Próbka o liczebności n pochodzi z rozkładu N(E(X),s2).
Badamy H0: s2(X)=s02.
(n  1) S 2 ( X )
Statystyką testową jest: Q 2 
2
s0
2
2
Ma ona rozkład  n1 ( x) (Chi-kwadrat o n-1 stopniach swobody).
S ( X ) S (Y )

nX
nY
Ma ona rozkład przybliżany przez rozkład t-Studenta o efektywnej
liczbie stopniach swobody int(neff).
neff
2, n 1
2, n 1
Q2 < a / 2  Q2 > 1a / 2
W
s2(X)> s02
|t|>t1-a/2
t>t1-a
s2(X)< s02
Q2 > 12,an1
2, n 1
Q2 <  a
H1
E(X)≠E(Y)
E(X)>E(Y)
RPiS 2016/2017
7
Testy statystyczne dotyczące równości
dwóch wariancji



W
H1
s2(X)≠ s02
2
 S 2 ( X ) S 2 (Y ) 



nY 
 nX

2
2
2
2
1  S (X ) 
1  S 2 (Y ) 

 


n X  1  n X  nY  1  nY 
RPiS 2016/2017
Testy statystyczne dotyczące równości
wariancji
Zał. Dwie populacje i dwie próbki: pierwsza o liczebności nX
pochodzi z rozkładu N(E(X),sX2), druga o liczebności nY pochodzi z
rozkładu N(E(Y),sY2) i na podstawie próby S2(X)>S2(Y).
Badamy H0: sX2=sY2.
S2(X )
Statystyką testową jest: F  F (n X  1, nY  1)  2
Dla
Ma ona rozkład Fishera-Snedecora
o (nX-1) i (nY-1) stopniach swobody.
Inne nazwy: rozkład F-Fishera, F,
F-ratio.
b a2
F (a , b ) 
a  b2
S2(X)>S2(Y):
F  F (n X  1, nY  1) 
S (Y )
H1
W
F>F1-a(nX-1,nY-1)
F-1>Fa(nY-1,nX-1)
F<Fa/2(nX-1,nY-1)  F>F1-a/2(nX-1,nY-1)
sX2
Fa(nX,nY)=(F1-a (nY,nX))-1
9
S2(X )
S 2 (Y )
sX2 > sY2
sX2 < sY2
RPiS 2016/2017
8
≠ sY2

Przykład: test równości wartości oczekiwanych dwóch rozkładów
przy nieznajomości ich wariancji

Równość wielu wariancji – test Bartletta.
RPiS 2016/2017
10
2