X - SGGW

Transkrypt

X - SGGW
Matematyka i statystyka matematyczna dla rolników w SGGW
WYKŁAD 8
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Anna Rajfura, KDiB
Matematyka i statystyka matematyczna dla rolników w SGGW
Było:
Estymacja parametrów rozkładu teoretycznego
• punktowa
• przedziałowa
Anna Rajfura, KDiB
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. Cecha X – masa owocu pewnej odmiany.
• ZałoŜenie:
cecha X ma w populacji rozkład normalny,
X ~ N(µ, σ 2 ), gdzie µ, σ 2 – nieznane;
• Cel:
wyznaczyć ocenę średniej masy jednego owocu tej odmiany µ.
o losujemy próbę: x 1 , x 2 , ..., x n ,
np. 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Estymacja punktowa parametru µ: Estymacja przedziałowa parametru µ:
o wybieramy poziom ufności 1-α,
np. 95%,
x dla próby: x = 194 ,46 g ,
o odczytujemy z tablic wartość
krytyczną rozkładu t-Studenta
t α, n-1 , np. t 0,05, 9 = 2,2622,
Oceną punktową parametru µ jest o obliczamy parametry próby:
średnia arytmetyczna x dla próby;
x = 194 ,46 g , s = 5,19 g,
w przykładzie oceną punktową
o wyznaczamy ze wzoru krańce
średniej masy jednego owocu tej
przedziału ufności.
odmiany µ jest wartość 194,46 g.
Ocena przedziałowa parametru µ to
przedział ufności; w przykładzie 95%
przedziałem ufności dla średniej masy
jednego owocu tej odmiany µ jest
190,75 ; 198,17 .
o obliczamy średnią arytmetyczną
194,46
190,75
194,46
198,17
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Pytanie:
Czy moŜna przyjąć, Ŝe średnia masa jednego owocu tej odmiany µ jest
równa 200?
Decyzja: tak/nie.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Idea testowania hipotez i podstawowe pojęcia
Przykład. Badamy
krąŜek
o
wymiarach
zbliŜonych
do
monety
jednozłotowej ze stronami oznaczonymi: A, B. Mamy ustalić,
czy krąŜek jest symetryczny?
(w wyniku rzutów tym krąŜkiem z jednakową częstością będzie pojawiać
się kaŜda ze stron).
Formułujemy hipotezę merytoryczną:
krąŜek jest symetryczny; stosunek wyników A do B wynosi 1:1; pstwo
otrzymania wyniku A wynosi 0,5.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Sprawdzenie hipotezy
Testowanie (weryfikacja) hipotezy
• wykonujemy pewną liczbę rzutów n (n-elementowa próba), np. n = 10;
• określamy regułę podejmowania decyzji dotyczącej hipotezy na
podstawie wyników w próbie: jeśli wypadnie od 4 do 6 wyników A
w 10-elementowej próbie, to monetę uznamy za symetryczną,
w przeciwnym przypadku uznamy ją za niesymetryczną,
• próba: A B B B B A
B B B B
• wyznaczamy liczbę wyników A w próbie, k A = 2,
• podejmujemy decyzję dotyczącą hipotezy:
na podstawie próby odrzucamy hipotezę, Ŝe moneta jest symetryczna.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Teoretyczny opis doświadczenia
Doświadczenie losowe: rzut symetrycznym krąŜkiem ze stronami A, B
(hipoteza o symetryczności jest prawdziwa);
X – liczba wyników A w 10-elementowej próbie; X~B(n = 10, p = 0,5).
Wykres funkcji rozkładu pstwa zmiennej losowej X
pstwo
0,3
0,25
0,2
0,15
0,1
0,05
0
0
1
2
3
4
5
6
7
8
9 10
wartości X
Matematyka i statystyka matematyczna dla rolników w SGGW
wartość X
pstwo
Anna Rajfura, KDiB
P {X=0} = 0,001
0
0,001
1
0,010
2
0,044
3
0,117
4
0,205
P {X=0 lub X=10} = P{X=0}+P{X=10}=
5
0,246
= 2·0,001 = 0,002
6
0,205
7
0,117
Jeśli liczba wyników A w próbie wyniesie 0 lub 10, to
8
0,044
hipotezę odrzucimy. Odrzucając hipotezę popełniamy
9
0,010
błąd. Ten błąd popełniamy z pstwem 0,002. Błędną decyzję
10
0,001
podejmujemy z pstwem 0,002.
Przykładowa reguła podejmowania decyzji:
hipotezę odrzucimy jeśli X=0 lub X=10.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Jeśli liczba wyników A w próbie wyniesie od 1 do 9, to hipotezy nie moŜna
odrzucić („hipotezę przyjmujemy”). Przyjmując hipotezę nie popełniamy błędu.
Prawidłową decyzję o przyjęciu hipotezy podejmujemy z pstwem 0,998.
Inna reguła podejmowania decyzji:
hipotezę odrzucimy jeśli X ∈ { 0, 1, 2, 3, 7 , 8, 9, 10 }.
Przy tej regule pstwo popełnienia błędu (podjęcia błędnej decyzji
o odrzuceniu hipotezy wynosi P ( X ∈ { 0, 1, 2, 3, 7 , 8, 9, 10 }) = 0,344 .
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Inne reguły podejmowania decyzji:
Odrzucenie hipotezy przy liczbie wyników A Pstwo popełnienia błędu
X =0
lub
X = 10
0,002
X ≤1
lub
X ≥9
0,022
X ≤2
lub
X ≥8
0,011
X ≤3
lub
X ≥7
0,344
X ≤4
lub
X ≥6
0,754
X ∈ { 0 , 1, ..., 10 }
1
Jakie pstwo popełnienia błędu akceptujemy?
Graniczne pstwo błędu – poziom istotności, ozn. α (np. α = 0,05 albo α = 0,01).
Jeśli przyjmiemy α = 0,05, to obszar krytyczny dla hipotezy (odrzucenia hipotezy)
to zbiór { 0, 1, 2, 8, 9, 10}, a obszar dopuszczalny { 3, 4, 5, 6, 7}.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Testowanie hipotez (ogólnie):
• stawiamy hipotezę,
• wybieramy funkcję testową f (statystykę testową, test statystyczny),
• przyjmujemy poziom istotności α; tym samym wyznaczamy obszar
krytyczny testu (wartość krytyczną funkcji testowej f kryt ),
• losujemy próbę,
• wyliczamy wartość funkcji testowej dla próby f emp (wartość empiryczną
funkcji testowej),
• porównujemy f emp z f kryt ,
• hipotezę
odrzucamy,
hipotezy nie odrzucamy.
gdy
f emp ≥ f kryt ;
w przeciwnym
przypadku
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Terminologia i oznaczenia:
Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu
pstwa cechy X (jest to formalny zapis przypuszczenia merytorycznego).
Testowaną hipotezę nazywamy hipotezą zerową, ozn.: H 0 .
W przykładzie cecha X~B(n, p); hipoteza zerowa H 0 : p = 0,5.
Funkcja testowa
np.: t-Studenta, F-Fishera, χ 2 chi-kwadrat.
W przykładzie funkcja testowa k = liczba wyników A.
Wartość empiryczna funkcji testowej (wartość funkcji testowej dla
próby), np.: t emp , F emp , χ 2 emp .
W przykładzie k emp = 2.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Poziom istotności α.
Wartość krytyczna funkcji testowej (wartość krytyczna testu),
np.: t kryt , F kryt , χ 2 kryt .
t kryt = t α,v taka, Ŝe P{ |t v | > t α,v } = α, gdzie t v jest zmienną losową
o rozkładzie t-Studenta z v stopniami swobody.
F kryt = F α,u,v taka, Ŝe P{ F
u,v
> F
α,u,v
}= α, gdzie F u,v jest zmienną losową
o rozkładzie F-Fishera z liczbami stopni swobody u, v.
χ 2 kryt = χ 2 α,
v
taka, Ŝe P{ χ 2 v > χ 2 α,
v
} = α, gdzie χ 2 v jest zmienną losową
o rozkładzie chi-kwadrat z liczbą stopni swobody v.
Wartość p
p = P{|t v | > t
emp }
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Błędy wnioskowania o prawdziwości hipotezy zerowej
Wniosek
Stan rzeczywisty
H 0 prawdziwa
H 0 nieprawdziwa
odrzucić H 0
nie odrzucać H 0
błąd I rodzaju, pstwo = α
wniosek prawidłowy
wniosek prawidłowy
błąd II rodzaju, pstwo = β
(fałszywa)
Błąd I rodzaju - błąd wnioskowania polegający na odrzuceniu hipotezy zerowej,
która jest prawdziwa; pstwo wystąpienia tego błędu powinno być małe, np.
α = 0,05 lub α = 0,01; α - poziom istotności testu.
Błąd II rodzaju - błąd wnioskowania polegający na nieodrzuceniu hipotezy
zerowej, która jest fałszywa.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Hipotezy i testy statystyczne
ZałoŜenia:
1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane parametry,
2. próba losowa: x 1 , x 2 , ...x n ; n – liczebność próby;
H 0 : µ = µ 0 (porównanie z normą), test t-Studenta; poziom istotności α.
t emp =
Funkcja testowa:
x − µ0
⋅ n
s
Wnioskowanie 1:
jeŜeli | t emp | > t α,
n-1 ,
to hipotezę H 0 odrzucamy, w przeciwnym przypadku
H 0 nie moŜna odrzucić.
Wnioskowanie 2 (równowaŜne z wnioskowaniem 1):
jeŜeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku
H 0 nie moŜna odrzucić.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Przykład. Cecha X – masa owocu pewnej odmiany.
ZałoŜenie: X ~ N(µ, σ 2 ), gdzie µ, σ 2 – nieznane.
Hipoteza zerowa H0: µ = 200, test t-Studenta, poziom istotności α = 0,05.
Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2; n=10;
parametry próby: x = 194 ,46 g , s = 5,19 g.
Wartość empiryczna funkcji testowej
t emp =
x − µ0
194,46 − 200
⋅ n=
⋅ 10 = −3,3755 .
s
5,19
Wartość krytyczna funkcji testowej t α,n-1 = t 0,05, 9 = 2,2622.
Wnioskowanie 1 (wniosek statystyczny):| t emp | =3,3375> 2,2622 = t 0,05,9 ,
zatem hipotezę zerową H 0 odrzucamy.
Wniosek merytoryczny: nie moŜna przyjąć, Ŝe średnia masa owocu tej odmiany
wynosi 200 g.
Matematyka i statystyka matematyczna dla rolników w SGGW
Ozn.:
t emp
Anna Rajfura, KDiB
X −µ
=
⋅ n
S
y = f (x) funkcja gęstości
rozkładu t-Studenta z v=9
stopniami swobody
f(x)
0
wartości t
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
y = f (x) funkcja gęstości
rozkładu t-Studenta z v = 9
stopniami swobody
α
Pole = 2
=
α
0,05
= 0,025
2
Pole = 2
=
0,05
= 0,025
2
Pole=1-α=0,95
- t 0,05, 9= -2,2622
0
t 0,05,9=2,2622
obszar dopuszczenia hipotezy
obszar odrzucenia hipotezy
(krytyczny)
wartości t
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
y = f (x) funkcja gęstości
rozkładu t-Studenta z v = 9
stopniami swobody
Pole = wartość p
Pole = α = 0,05
-t emp=-3,34 - t kryt= -2,26 0
tkryt=2,26
t emp=3,34
wartości t
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ~N(µ 1 , σ 2 ), cecha X 2 ~N(µ 2 , σ 2 ), µ 1 , µ 2 , σ 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę losową z pierwszej populacji
n 2 -elementową próbę losową z drugiej populacji.
oraz
H 0 : µ 1 = µ 2 (porównanie średnich w dwóch populacjach), test t-Studenta, poziom
istotności α.
x1 − x2
t
=
emp
Funkcja testowa:
sr
gdzie:
1 1
sr = se2  + 
 n1 n2 
błąd stand. róŜnicy średnich,
s12 ⋅ (n1 − 1) + s22 ⋅ (n2 − 1)
s =
wspólna wariancja
n1 + n2 − 2
Wnioskowanie 1: jeŜeli |t emp |>t α,n1+n2-2 , to hipotezę H 0 odrzucamy, w przeciwnym
2
e
przypadku H 0 nie moŜna odrzucić.
Wnioskowanie 2: jeŜeli p<α, to
przypadku H 0 nie moŜna odrzucić.
hipotezę
H0
odrzucamy,
w przeciwnym
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ~N(µ 1 , σ 2 ), cecha X 2 ~N(µ 2 , σ 2 ), µ 1 , µ 2, σ 2 - nieznane parametry,
2. pobrano n 1 – elementową próbę losową z pierwszej populacji oraz n 2 –
elementową próbę losową z drugiej populacji.
H 0 : σ 1 2 = σ 2 2 (porównanie wariancji w dwóch populacjach), test F-Fishera,
poziom istotności α.
max ( s12 , s22 )
Femp =
Funkcja testowa:
min ( s 2 , s 2 )
1
Wnioskowanie 1:
jeŜeli
F emp > F
2
α/2, v licz, v mian ,
to
hipotezę
H0
odrzucamy,
w przeciwnym przypadku H 0 nie moŜna odrzucić.
UWAGA: v licz – liczba stopni swobody dla licznika, v mian - liczba stopni
swobody dla mianownika,
v i = n i – 1.
Wnioskowanie 2: jeŜeli wartość p<α, to hipotezę H 0 odrzucamy, w przeciwnym
przypadku H 0 nie moŜna odrzucić.
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
ZałoŜenia:
1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1 ,
2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2 ,
3. pobrano n 1 – elementową próbę losową z pierwszej populacji oraz n 2 –
elementową próbę losową z drugiej populacji, k i – liczba elementów
ki
k1 + k 2
p
=
p
=
wyróŜnionych w i-tej próbie; i n ,
n1 + n 2 .
i
H 0 : p 1 = p 2 (porównanie frakcji w dwóch populacjach), test przybliŜony u
(dla duŜych prób), poziom istotności α.
u emp =
Funkcja testowa:
Wnioskowanie:
jeŜeli
u emp
p1 − p2

1 
+ 
 n1 n 2 
1
p (1 − p )
≥u
1−
α
2
,
to
hipotezę
w przeciwnym przypadku H 0 nie moŜna odrzucić.
H0
odrzucamy,
Matematyka i statystyka matematyczna dla rolników w SGGW
Anna Rajfura, KDiB
Pojęcia cd.:
Hipoteza alternatywna, ozn. H 1 – przyjmowana po odrzuceniu hipotezy zerowej.
Moc testu - p-stwo nieodrzucenia prawdziwej hipotezy alternatywnej. Od testu
wymagamy, aby był najmocniejszy, czyli z duŜym p-stwem odrzucał fałszywą
hipotezę zerową.