Anne prawdziwa masa
Transkrypt
Anne prawdziwa masa
Temat
Testowanie hipotez
statystycznych
Kody znaków:
Ŝółte wyróŜnienie – nowe pojęcie
pomarańczowy – uwaga
kursywa – komentarz
Anna Rajfura
1
Zagadnienia omawiane na zajęciach
1. Idea i pojęcia teorii testowania hipotez
statystycznych
2. Testowanie hipotezy dotyczącej:
a. średniej z rozkładu normalnego
b. porównaniu dwóch średnich
z rozkładów normalnych
c. porównaniu dwóch wariancji
z rozkładów normalnych
d. porównaniu dwóch frakcji
z rozkładów dwupunktowych
Anna Rajfura
2
Był problem
Cecha X – masa owocu pewnej odmiany
ZałoŜenie
Cecha X ma w populacji rozkład normalny,
X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane
Cel
Wyznaczyć ocenę średniej masy jednego
owocu tej odmiany µ
Anna Rajfura
3
Był problem cd.
Działanie
Estymujemy parametr µ na podstawie
wylosowanej próby: x 1 , x 2 , ..., x n ;
np. 191,2; 193,0; 195,1; 184,3; 197,6;
200,8; 194,2; 198,7; 189,5; 200,2
Anna Rajfura
4
Był problem cd.
Wynik
Ocena punktowa µ wynosi
x = 194,46 g
Ocena przedziałowa
µ ∈ 190,75 ; 198,17
Anna Rajfura
P = 95%
5
Jest problem
Cecha X – masa owocu pewnej odmiany
ZałoŜenie
Cecha X ma w populacji rozkład normalny,
X ~ N( µ , σ 2 ), gdzie µ , σ 2 – nieznane
Cel
Wyznaczyć ocenę średniej masy jednego
owocu tej odmiany µ
Zbadać wartość średniej masy jednego
owocu tej odmiany µ.
Anna Rajfura
6
Jest problem cd.
Pytanie
Czy moŜna przyjąć, Ŝe średnia masa
jednego owocu tej odmiany µ
jest równa 200?
µ = 200
Decyzja
tak / nie
Anna Rajfura
7
Jest problem cd.
µ = 200
Badana hipoteza
Weryfikacja hipotezy
(Testowanie hipotezy)
tak / nie
Anna Rajfura
Decyzja
8
Idea testowania hipotez - przykład
Badamy krąŜek o wymiarach zbliŜonych do
monety jednozłotowej ze stronami
oznaczonymi: A, B.
Mamy ustalić,
czy krąŜek jest symetryczny?
(podczas rzutów tym krąŜkiem kaŜda ze
stron będzie się pojawiać z jednakową
częstością).
Chcemy dostać odpowiedź: tak/nie
Anna Rajfura
9
Hipoteza merytoryczna
1. Formułujemy hipotezę merytoryczną
(stwierdzenie):
krąŜek jest symetryczny
inaczej:
stosunek wyników A do B wynosi 1:1
inaczej:
p-stwo otrzymania wyniku A wynosi 0,5
Anna Rajfura
10
Testowanie hipotezy
2. Wybieramy wartość testową (test) do
zbadania hipotezy:
liczba wyników A w próbie, ozn. L A
3. Określamy regułę podejmowania decyzji
„tak/nie” odnośnie hipotezy na podstawie
wartości testowej dla próby
3. Losujemy próbę: x 1 , x 2 , ..., x n
4. Wyznaczamy wartość testową dla
wylosowanej próby
Anna Rajfura
11
Testowanie hipotezy cd.
5. Formułujemy wniosek odnośnie hipotezy
(podejmujemy decyzję „odrzucić/nie
odrzucić”)
Anna Rajfura
12
Idea testowania hipotez – przykład cd.
Przykładowa reguła podejmowania decyzji:
Jeśli wypadnie od 4, 5 lub 6 wyników A
w 10-elementowej próbie, to krąŜek
uznamy za symetryczny, w przeciwnym
przypadku - za niesymetryczny.
Anna Rajfura
13
Idea testowania hipotez – przykład 1
Wylosowana próba:
A B B B B A B B B B
Wyznaczamy liczbę wyników A w próbie
(wartości testu):
LA = 2
Formułujemy wniosek odnośnie hipotezy:
na podstawie próby odrzucamy hipotezę,
Ŝe krąŜek jest symetryczny
Anna Rajfura
14
Idea testowania hipotez – przykład 2
Wylosowana próba:
A A B A B A A B B A
Wyznaczamy liczbę wyników A w próbie
(wartość testu):
LA = 6
Formułujemy wniosek odnośnie hipotezy:
na podstawie próby przyjmujemy hipotezę,
Ŝe krąŜek jest symetryczny
Anna Rajfura
15
Teoretyczne podstawy testowania hipotez
Doświadczenie losowe:
rzut symetrycznym krąŜkiem ze stronami
A, B
hipoteza
o symetryczności jest
prawdziwa
Anna Rajfura
16
Teoretyczne podstawy cd.
X – liczba wyników A w 10 - elementowej
próbie
X~B( n = 10, p = 0,5)
Wyznaczymy rozkład p-stwa zmiennej
losowej X ze wzoru Bernoulliego
Anna Rajfura
17
Teoretyczne podstawy cd.
Wykres funkcji rozkładu p-stwa zmiennej
losowej X
p-stwo
0,3
0,2
0,1
0
0
1
2
3
4
5
6
7
8
9
10
wartości X
Anna Rajfura
18
Teoretyczne podstawy cd.
wartość X pstwo
0
0,001
1
0,010
2
0,044
3
0,117
4
0,205
5
0,246
6
0,205
7
0,117
8
0,044
9
0,010
10
0,001
Anna Rajfura
P { X = 0} = 0,001
p-stwo zdarzenia,
Ŝe w próbie
wypadnie 0 wyników A
(Ŝadnego wyniku A, same
wyniki B)
wynosi 0,001
19
Teoretyczne podstawy cd.
wartość X pstwo Przykładowa reguła
0
0,001 podejmowania decyzji:
1
0,010
hipotezę odrzucimy jeśli
2
0,044
X = 0 lub X = 10
3
0,117
4
0,205
5
0,246
6
0,205
7
0,117
8
0,044
9
0,010
10
0,001
Anna Rajfura
20
Teoretyczne podstawy cd.
wartość X pstwo Przykładowa reguła
0
0,001 podejmowania decyzji:
1
0,010
hipotezę odrzucimy jeśli
2
0,044
X = 0 lub X = 10
3
0,117
4
0,205
Odrzucając hipotezę
5
0,246
popełniamy błąd, bo jest
6
0,205
ona prawdziwa.
7
0,117
8
0,044
9
0,010
10
0,001
Anna Rajfura
21
Teoretyczne podstawy cd.
wartość X pstwo Przykładowa reguła:
0
0,001
hipotezę odrzucimy jeśli
1
0,010
X = 0 lub X = 10
2
0,044
3
0,117
Hipotezę odrzucamy
4
0,205
z p-stwem
5
0,246
6
0,205
P{ X = 0 lub X = 10} =
7
0,117
= P{ X = 0} + P{ X = 10} =
8
0,044
= 0,001 +0,001 = 0,002
9
0,010
10
0,001
Anna Rajfura
22
Teoretyczne podstawy cd.
wartość X pstwo Przykładowa reguła:
0
0,001
hipotezę odrzucimy jeśli
1
0,010
X = 0 lub X = 10
2
0,044
3
0,117
Hipotezę odrzucamy
4
0,205
z p-stwem 0,002
5
0,246
6
0,205
Odrzucając hipotezę
7
0,117
popełnimy błąd
8
0,044
9
0,010 Błąd popełniamy z pstwem
10
0,001
0,002
Anna Rajfura
23
Teoretyczne podstawy cd.
wartość X pstwo Przykładowa reguła:
0
0,001
hipotezę odrzucimy jeśli
1
0,010
X = 0 lub X = 10
2
0,044
3
0,117
Błędną decyzję
4
0,205
o
odrzuceniu
hipotezy
5
0,246
prawdziwej podejmujemy
6
0,205
z pstwem 0,002
7
0,117
8
0,044
9
0,010
10
0,001
Anna Rajfura
24
Teoretyczne podstawy cd.
Dalej:
Jeśli liczba wyników A w próbie wyniesie
od 1 do 9, to hipotezy nie moŜna odrzucić
(„hipotezę przyjmujemy”).
Przyjmując hipotezę prawdziwą nie
popełniamy błędu. Poprawną decyzję
o przyjęciu hipotezy podejmujemy
z p-stwem 0,998.
Anna Rajfura
25
Teoretyczne podstawy cd.
Inna reguła podejmowania decyzji:
hipotezę odrzucimy jeśli
X ∈ { 0, 1, 2, 3, 7, 8, 9, 10 }
Przy tej regule p-stwo popełnienia błędu
(podjęcia błędnej decyzji o odrzuceniu
hipotezy prawdziwej) wynosi
P (X ∈ { 0, 1, 2, 3, 7, 8, 9, 10 }) = 0,344
Anna Rajfura
26
Teoretyczne podstawy cd.
Inne reguły podejmowania decyzji:
Odrzucenie hipotezy
przy liczbie wyników A
X =0
X ≤1
Pstwo
popełnienia błędu
lub
X = 10
0,002
lub
X ≥9
0,022
X ≥8
lub
X ≤2
X ≤ 3 lub
X ≥7
X ≥6
lub
X ≤4
X ∈ { 0, 1, ..., 10 }
0,110
Anna Rajfura
0,344
0,754
1
27
Teoretyczne podstawy cd.
Inne reguły podejmowania decyzji:
Odrzucenie hipotezy
przy liczbie wyników A
X =0
X ≤1
Pstwo
popełnienia błędu
lub
X = 10
0,002
lub
X ≥9
0,022
X ≥8
lub
X ≤2
X ≤ 3 lub
X ≥7
X ≥6
lub
X ≤4
X ∈ { 0, 1, ..., 10 }
0,110
0,344
0,754
1
Jakie p-stwo popełnienia błędu
akceptujemy?
Anna Rajfura
28
Teoretyczne podstawy cd.
Jakie p-stwo popełnienia błędu
akceptujemy?
Graniczne p-stwo błędu – poziom
istotności, ozn. α (alfa)
np. α = 0,05 albo α = 0,01
Jeśli przyjmiemy α = 0,2, to obszar
krytyczny dla hipotezy (odrzucenia
hipotezy) to zbiór {0,1, 2, 8, 9, 10},
a obszar dopuszczalny { 3, 4, 5, 6, 7}.
Anna Rajfura
29
Teoretyczne podstawy cd.
Odrzucenie hipotezy
przy liczbie wyników A
X =0
X ≤1
Pstwo
popełnienia błędu
lub
X = 10
0,002
lub
X ≥9
0,022
X ≥8
lub
X ≤2
X ≤ 3 lub
X ≥7
X ≥6
lub
X ≤4
X ∈ { 0, 1, ..., 10 }
0,110
Anna Rajfura
0,344
0,754
1
30
Teoretyczne podstawy cd.
Dla α = 0,2 obszar krytyczny dla hipotezy
(obszar odrzucenia hipotezy) to zbiór
{0,1, 2, 8, 9, 10}
a obszar dopuszczalny to zbiór
{ 3, 4, 5, 6, 7}
0 1 2 3 4 5 6 7 8 9 10
Anna Rajfura
31
Teoretyczne podstawy cd.
1. Formułujemy hipotezę:
p-stwo otrzymania wyniku A wynosi 0,5
2. Wybieramy test do zbadania hipotezy:
liczba wystąpień wyniku A w próbie
losowej, ozn.: L A
3. Przyjmujemy poziom istotności α (tym
samym wyznaczamy obszar krytyczny
testu)
dla α = 0,2, obszar krytyczny to zbiór
{ 0, 1, 2, 8, 9, 10}
Anna Rajfura
32
Teoretyczne podstawy cd.
4. Losowujemy próbę:
A B B B B A B B B B
5. Wyznaczamy wartości testu dla
wylosowanej próby:
L A =2
Anna Rajfura
33
Teoretyczne podstawy cd.
6. Formułujemy wniosek odnośnie hipotezy
(hipotezę odrzucamy, gdy wartość testu
wpada do obszaru krytycznego;
w przeciwnym przypadku hipotezy nie
odrzucamy
Odrzucamy hipotezę, Ŝe krąŜek jest
symetryczny
Anna Rajfura
34
Terminologia i oznaczenia
Hipoteza statystyczna to dowolne
przypuszczenie dotyczące rozkładu p-stwa
cechy X (typ rozkładu, parametr rozkładu)
Testowaną hipotezę nazywamy hipotezą
zerową, ozn.: H 0
W przykładzie cecha X~B( n , p ); hipoteza
zerowa H 0 : p = 0,5.
Anna Rajfura
35
Terminologia i oznaczenia cd.
Funkcja testowa
ozn. np.: t -Studenta, F -Fishera,
χ 2 chi-kwadrat
W przykładzie funkcja testowa L A = liczba
wyników A
Wartość empiryczna funkcji testowej
(wartość funkcji testowej dla próby), np.:
t emp , F emp , χ 2 emp .
W przykładzie L Aemp = 2
Anna Rajfura
36
Terminologia i oznaczenia cd.
Poziom istotności α.
α – akceptowalne p-stwo popełnienia błędu
(przy odrzucaniu hipotezy prawdziwej), np.
α = 0,01 , α = 0,05
Anna Rajfura
37
Terminologia i oznaczenia cd.
Wartość krytyczna funkcji testowej
(wartość krytyczna testu)
np.: t kryt , F kryt , χ 2 kryt ;
t kryt = t α, v taka, Ŝe P{ | t v | > t α,v } = α ,
gdzie t v jest zmienną losową o rozkładzie
t -Studenta z v stopniami swobody;
F kryt = F α, u , v taka, Ŝe P{ F u , v > F α, u , v }= α ,
gdzie F u , v jest zmienną losową o rozkładzie
F -Fishera z liczbami stopni swobody u , v .
Anna Rajfura
38
Terminologia i oznaczenia cd.
χ 2 kryt = χ 2 α, v taka, Ŝe P{ χ 2 v > χ 2 α, v } = α ,
gdzie χ 2 v jest zmienną losową o rozkładzie
chi-kwadrat z liczbą stopni swobody v .
Wartość p
p = P{| t v | > t
Anna Rajfura
emp
}
39
Błędy wnioskowania
WNIOSEK
STAN
ODRZUCIĆ H 0
RZECZYWISTY
NIE
ODRZUCAĆ
H0
H0
prawdziwa
błąd I
rodzaju,
pstwo = α
wniosek
prawidłowy
wniosek
prawidłowy
błąd II
rodzaju,
pstwo = β
H0
nieprawdziwa
(fałszywa)
Anna Rajfura
40
Błędy wnioskowania - definicje
Błąd I rodzaju - błąd wnioskowania
polegający na odrzuceniu hipotezy
zerowej, która jest prawdziwa; pstwo
wystąpienia tego błędu powinno być małe,
np. α = 0,05 lub α = 0,01; α - poziom
istotności testu.
Błąd II rodzaju - błąd wnioskowania
polegający na nieodrzuceniu hipotezy
zerowej, która jest fałszywa.
Anna Rajfura
41
Hipoteza H 0 : µ = µ 0
ZałoŜenia:
1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane
2. próba losowa: x 1 , x 2 , ..., x n ;
n – liczebność próby
H 0 : µ = µ 0 (porównanie z normą)
test t - Studenta ; poziom istotności α
Funkcja testowa:
t emp =
Anna Rajfura
x − µ0
s
⋅ n
42
Hipoteza H 0 : µ = µ 0 cd.
Wnioskowanie 1:
jeŜeli | t emp | > t α,v= n-1 , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Wnioskowanie 2 (równowaŜne
z wnioskowaniem 1):
jeŜeli wartość p < α , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Anna Rajfura
43
Przykład H 0 : µ = 200
Cecha X – masa owocu pewnej odmiany.
ZałóŜmy, Ŝe X ~ N( µ , σ 2 ), gdzie µ , σ 2 –
nieznane
Hipoteza zerowa H 0 : µ = 200
Test t -Studenta, poziom istotności α =0,05
Próba: 191,2; 193,0; 195,1; 184,3; 197,6;
200,8; 194,2; 198,7; 189,5; 200,2
Anna Rajfura
44
Przykład H 0 : µ = 200 cd.
Parametry próby:
n=10, x = 194,46
g,
s = 5,19 g
Wartość empiryczna funkcji testowej:
t emp
x − µ0
=
⋅ n=
s
194,46 − 200
=
⋅ 10 = −3,3755
5,19
Wartość krytyczna funkcji testowej
t α, v = n-1 = t 0,05, 9 = 2,2622
Anna Rajfura
45
Przykład H 0 : µ = 200 cd.
Wnioskowanie 1 (wniosek statystyczny):
| t emp | =3,3375> 2,2622 = t 0,05,9 , zatem
hipotezę zerową H 0 odrzucamy.
Wniosek merytoryczny:
nie moŜna przyjąć, Ŝe średnia masa owocu
tej odmiany wynosi 200 g.
Anna Rajfura
46
Wartości krytyczne rozkładu t-Studenta
X ~ tν -
X zmienna losowa o rozkładzie t-Studenta z liczbą stopni swobody v,
α - poziom istotności,
t α , ν - wartość krytyczna - liczba taka, Ŝe P(|X| > t α , ν ) = α
ν \
α 0,400 0,300 0,200 0,100
1
2
3
4
5
6
7
8
9
10
11
12
0,050
0,025 0,010 0,005 0,001
1,3764
1,9626
3,0777
6,3137
12,7062
25,4519
63,6559
1,0607
1,3862
1,8856
2,9200
4,3027
6,2054
9,9250
14,0892
31,5998
0,9785
1,2498
1,6377
2,3534
3,1824
4,1765
5,8408
7,4532
12,9244
0,9410
1,1896
1,5332
2,1318
2,7765
3,4954
4,6041
5,5975
8,6101
0,9195
1,1558
1,4759
2,0150
2,5706
3,1634
4,0321
4,7733
6,8685
0,9057
1,1342
1,4398
1,9432
2,4469
2,9687
3,7074
4,3168
5,9587
0,8960
1,1192
1,4149
1,8946
2,3646
2,8412
3,4995
4,0294
5,4081
0,8889
1,1081
1,3968
1,8595
2,3060
2,7515
3,3554
3,8325
5,0414
0,8834
1,0997
1,3830
1,8331
2,2622
2,6850
3,2498
3,6896
4,7809
0,8791
1,0931
1,3722
1,8125
2,2281
2,6338
3,1693
3,5814
4,5868
0,8755
1,0877
1,3634
1,7959
2,2010
2,5931
3,1058
3,4966
4,4369
0,8726
1,0832
1,3562
1,7823
2,1788
2,5600
3,0545
3,4284
4,3178
Anna Rajfura
127,3211 636,5776
47
Przykład – ilustracja graficzna
Ozn.:
t emp
X −µ
=
⋅ n
S
f(x)
0
Anna Rajfura
y = f (x) funkcja
gęstości rozkładu
t-Studenta z v=9
stopniami swobody
wartości t
48
Przykład – ilustracja graficzna cd.
y = f (x) funkcja gęstości
rozkładu t-Studenta z v = 9
stopniami swobody
α
Pole = 2
=
α
0,05
= 0,025
2
Pole = 2
=
0,05
= 0,025
2
Pole=1-α=0,95
- t 0,05, 9= -2,2622
0
t 0,05,9=2,2622
wartości t
obszar dopuszczenia hipotezy
obszar odrzucenia hipotezy
(krytyczny)
Anna Rajfura
49
Przykład – ilustracja graficzna cd.
y = f (x) funkcja gęstości
rozkładu t-Studenta z v = 9
stopniami swobody
Pole = wartość p
Pole = α = 0,05
-t emp=-3,34 - t kryt= -2,26 0
Anna Rajfura
tkryt=2,26
t emp=3,34
wartości t
50
Hipoteza H 0 : µ 1 = µ 2
ZałoŜenia:
1. cecha X 1 ~N( µ 1 , σ 2 ), cecha X 2 ~N( µ 2 , σ 2 ),
µ 1 , µ 2 , σ 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę
z pierwszej populacji oraz n 2 -elementową
próbę z drugiej populacji
H 0 : µ 1 = µ 2 (porównanie
średnich
w dwóch populacjach),
test t-Studenta ,
Anna Rajfura
poziom istotności α
51
Hipoteza H 0 : µ 1 = µ 2 cd.
Funkcja testowa:
t emp
x1 − x 2
=
sr
gdzie:
1
1
sr = s
+
błąd stand. róŜnicy średnich,
n
n
2
1
2
2
(
)
s
⋅
n
−
1
+
s
2
1
1
2 ⋅ (n2 − 1)
se =
wspólna wariancja;
n1 + n2 − 2
2
e
Anna Rajfura
52
Hipoteza H 0 : µ 1 = µ 2 cd.
Wnioskowanie 1:
jeŜeli | t emp |> t α, v = n1+n2-2 , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Wnioskowanie 2:
jeŜeli p < α , to hipotezę H 0 odrzucamy,
w przeciwnym przypadku H 0 nie moŜna
odrzucić.
Anna Rajfura
53
Hipoteza H 0 : σ 1 2 = σ 2 2
ZałoŜenia:
1. cecha X 1 ~N( µ 1 , σ 1 2 ), cecha X 2 ~N( µ 2 , σ 2 2 ),
µ 1 , µ 2, σ 1 2 , σ 2 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę
z pierwszej populacji oraz n 2 – elementową
próbę z drugiej populacji.
H 0 : σ 1 2 = σ 2 2 (porównanie
wariancji
w dwóch populacjach) ,
test F -Fishera ,
Anna Rajfura
poziom istotności α .
54
Hipoteza H 0 : σ 1 2 = σ 2 2 cd.
Funkcja testowa:
2
Femp =
Anna Rajfura
2
2
max (s 1 , s )
min (s 12 , s 22 )
55
Hipoteza H 0 : σ 1 2 = σ 2 2
Wnioskowanie 1:
jeŜeli F emp > F α/2, v licz , v mian , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
UWAGA:
v licz – liczba stopni swobody dla licznika ,
v mian - liczba stopni swobody dla
mianownika, v i = n i – 1.
Anna Rajfura
56
Hipoteza H 0 : σ 1 2 = σ 2 2
Wnioskowanie 2:
jeŜeli wartość p < α , to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Anna Rajfura
57
Hipoteza H 0 : p 1 = p 2
ZałoŜenia:
1. cecha X 1 ma rozkład dwupunktowy
z nieznanym parametrem p 1 ,
2. cecha X 2 ma rozkład dwupunktowy
z nieznanym parametrem p 2 ,
3. pobrano n 1 – elementową próbę
z pierwszej populacji oraz n 2 – elementową
próbę z drugiej populacji, k i – liczba
elementów wyróŜnionych w i -tej próbie;
ki
pi =
ni
Anna Rajfura
k1 + k 2
p =
n1 + n 2
58
Hipoteza H 0 : p 1 = p 2 cd.
H0: p1 = p2
(porównanie frakcji w dwóch
populacjach),
test przybliŜony u
(dla duŜych prób),
poziom istotności α.
Funkcja testowa:
uemp =
Anna Rajfura
p1 − p2
1
1
p (1 − p )
+
n
n
2
1
59
Hipoteza H 0 : p 1 = p 2
cd.
Wnioskowanie:
jeŜeli
u emp
≥u
α ,
1−
2
to hipotezę H 0
odrzucamy, w przeciwnym przypadku H 0
nie moŜna odrzucić.
Anna Rajfura
60
Pojęcia cd.
Hipoteza alternatywna, ozn. H 1 –
przyjmowana po odrzuceniu hipotezy
zerowej.
Moc testu - p-stwo nieodrzucenia
prawdziwej hipotezy alternatywnej. Od
testu wymagamy, aby był najmocniejszy,
czyli z duŜym p-stwem odrzucał fałszywą
hipotezę zerową.
Anna Rajfura
61