zadania11i12
Transkrypt
zadania11i12
Statystyczna Analiza Danych - Zadania z 11 i 12 wykładu
Aleksander Adamowski (s1869)
Zadanie 1.
W teście psychotechnicznym dla kierowców zmierzono czasy reakcji 9ciu losowo wybranych
kierowców. Otrzymano średnią próbkową 7 (sek.) i wariancję próbkową 1 (sek.2). Wyznacz 95
% przedział ufności dla wartości średniej czasu reakcji kierowcy zakładając, że czas reakcji
jest zmienną losową o rozkładzie normalnym. Niech m oznacza średni czas reakcji na pewien
bodziec. Poddajemy testowi hipotezę H0: = 5 przy alternatywie H1: 1 ≠5 .
Rozw.:
Statystyka testowa: =0,05
Z=
=0,05
x
−5 7 −5
=
=2 ⋅3 =6
1
1
3
9
z 0,025 =−1,959964 z 0,975 =1,959964 .6 > 1,96 więc odrzucamy H0.
95% Przedział ufności:
[x
−z 0,975 ⋅ , x
z 0,975 ⋅ ]=[7,65332132818002 , 6 ,34667867181998 ] n
n
Podać pwartości odpowiadające następującym wartościom z statystyki testowej: a. z = 2,10, Odp.:
Wykorzystując funkcję pt w języku R na obliczenie wartości rozkładu tStudenta:
> pt(2.10, df=9-1)
[1] 0.9655312
P H ∣Z∣≥z 0,975 =0,9655312
0
b. z = 0,90,
Odp.:
> pt(0.90, df=9-1)
[1] 0.8027979
P H ∣Z∣≥z 0,975 =0,8027979
0
c. z = 1,96,
Odp.:
> pt(1.96, df=9-1)
[1] 0.957171
P H ∣Z∣≥z 0,975 =0,957171
0
d. z = 2,48,
Odp.:
> pt(2.48, df=9-1)
[1] 0.9809442
P H ∣Z∣≥z 0,975 =0,9809442
0
e. z = 0,11.
Odp.:
> pt(-0.11, df=9-1)
[1] 0.4575594
P H ∣Z∣≥z 0,975 =0,4575594
0
Zadanie 2.
Docelowa grubość płytki silikonowej stosowanej w pewnych układach elektronicznych wynosi
245 mm. Średnia grubość płytki dla 50elementowej próbki płytek wynosi 246,18 mm. Wiemy,
że odchylenie standardowe wynosi 3,60 mm. Czy zmierzona średnia grubość płytki różni się
istotnie od wartości docelowej grubości płytki?
Przyjąć poziom istotności testu =0,01. Uzupełnić poniższe punkty.
1. Badany parametr: , 0 =245 mm
2. Hipoteza zerowa: =0
3. Hipoteza alternatywna: ≠0
−0
X
Z=
4. Statystyka testowa:
n
246,18 −245
≈2,317739
3,60
5. Wartość statystyki testowej: 50
6. Wyznaczenie pwartości: p=2 P H Z≥∣z∣=2 ⋅ 1 −2,317739 ≈0,02046 0,01
z=
0
7. Wniosek: nie można odrzucić H0 ;
zmierzona średnia grubość próbki nie różni się istotnie od wartości docelowej.
Zadanie 3.
Na dziewięciu losowo wybranych warszawskich stacjach paliw zanotowano pewnego dnia
ceny benzyny bezołowiowej 98, dla których obliczono średnią próbkową cenę 3,55 zł oraz
odchylenie standardowe (próbkowe) s=0,09 zł. Czy na poziomie istotności 0,05 można
stwierdzić, że wartość średnia tego gatunku benzyny w dniu badania jest większa niż 3,50 zł.
Można założyć, że cena danego gatunku benzyny na losowo wybranej stacji jest zmienną
losową o rozkładzie normalnym.
Rozw.:
1. Badany parametr: , 0 =3,50 zł
2. Hipoteza zerowa: =0
3. Hipoteza alternatywna: 0
−0
X
Z=
4. Statystyka testowa: S
n
3,55−3,50
≈1,6666
0,09
5. Wartość statystyki testowej: 9
6. Wyznaczenie pwartości: p=P H Zz = 1 −T 9 1,6666 ≈0,067 0,05
z=
0
7. Wniosek: nie można odrzucić H0 ;
Nie można stwierdzić, że wartość średnia tego gatunku benzyny w dniu badania jest większa niż 3,50 zł.
Zadanie 4.
Ocenia się, że w województwie X korzystało bezprawnie z pewnej ulgi podatkowej 10%
podatników. Istnieje obawa, że zmiana przepisów podatkowych mogła zwiększyć podany
odsetek osób nieprawidłowo obliczających płacony przez nie podatek. Wylosowano 150
podatników i wykazano, że 21 z nich niesłusznie skorzystało ze wspomnianej ulgi.
Skonstruować odpowiedni test i na tej podstawie ocenić zasadność istniejących obaw.
Rozw.:
1. Badany parametr: p , p0 =0,1
2. Hipoteza zerowa: p=p0
3. Hipoteza alternatywna: pp0
p−p
0
Z=
4. Statystyka testowa: p1−p
n
z=
0,14 −0,1
≈1,63299
0,1 ⋅0,9
150
6. Wyznaczenie pwartości: p=P H Zz = 1 −1,63288 ≈0,051235
21 =0,14
5. Wartość statystyki testowej: p=
150
0
7. Wniosek: tylko na poziomie istotności większym od około 0,051 można odrzucić H0 i przyjąć, że , że
zmiana przepisów podatkowych mogła zwiększyć podany odsetek osób nieprawidłowo obliczających
płacony przez nie podatek.
Przy przyjęciu mniejszego poziomu istotności nie można odrzucić H0 i nie ma podstaw do stwierdzenia, że
odsetek takich osób się zwiększył.
Zadanie 5.
Dla pięciu losowo wybranych kierowców zanotowano następujące czasy reakcji (w sek.) na
pewien bodziec przed i po zażyciu leku psychotropowego:
Kierowca 1
2
3
4
5
Przed zażyciem leku 5,5 6,0 5,5 4,5 5,5
Po zażyciu leku 8,5 7,5 6,0 4,5 5,0
Można przyjąć, że różnica czasów jest zmienną losową o rozk ładzie normalnym o znanym
odchyleniu standardowym =1,5 (sek.). Czy można twierdzić, że wartość średnia czasu
reakcji na bodziec jest większa po zażyciu danego leku niż wartość średnia czasu reakcji przed
zażyciem leku? Przyjąć poziom istotności 0,01. Dokończ rozwiązanie:
1. Model: Di = Xi Yi, i=1,2,...,5 są niezależnymi zmiennymi losowymi o rozkładzie N , 1 ,5 ,
gdzie = D (nieznane)
2. Hipoteza: H0 : D=0 , H1 : D0
D
T=
SD
3. Statystyka testowa: n
4. Obliczona wartość statystyki:
D=−3.0−1.5−0.50.00.5/5
=−0,9
n
1
2≈1,387
∑ Di − D
n−1 i=1
−0,9
t=
≈−1.45
1,387
5
5. Kwantyl: t 0,99, 4=3,746947
6. Zbiór krytyczny C = {t : t ≤t 0,99 }={t : t≤3,746947 }
7. Odpowiedź na pytanie i jej uzasadnienie: na poziomie istotności 0,01 można odrzucić hipotezę
zerową (“wartość średnia czasu reakcji na bodziec po zażyciu leku się nie zmienia”) i przyjąć hipotezę
alternatywną (“wartość średnia czasu reakcji na bodziec jest większa po zażyciu leku”).
Uzasadnienie: wartość t ≈−1.45 statystyki testowej mieści się w zbiorze krytycznym
C={t : t ≤3,746947 } .
S D=
Sprawdzenie w języku R:
kod skryptu Zadania11_5.R:
Zad5X<-c(5.5, 6.0, 5.5, 4.5, 5.5)
Zad5Y<-c(8.5, 7.5, 6.0, 4.5, 5.0)
Zad5N<-length(Zad5X)
Zad5d<-(Zad5X - Zad5Y)
print(Zad5d)
Zad5bard<-mean(Zad5d)
print(paste("bar d:", Zad5bard))
Zad5Sd<-sqrt((1/(Zad5N - 1))*sum((Zad5d - Zad5bard)^2))
print(paste("estymator S_D:", Zad5Sd))
Zad5t<-(Zad5bard / ( Zad5Sd / sqrt(Zad5N) ) )
print(paste("t:", Zad5t))
Zad5kwantyl<-(qt(0.99, df=(Zad5N - 1)))
print(paste("zbior krytyczny C = { t: t <=", Zad5kwantyl, "}"))
Wynik uruchomienia:
> source("Zadania11_5.R")
[1] -3.0 -1.5 -0.5
0.0
0.5
[1] "bar d: -0.9"
[1] "estymator S_D: 1.38744369255116"
[1] "t: -1.45048133524568"
[1] "zbior krytyczny C = { t: t <= 3.74694738797920 }"