Analiza błędów
Transkrypt
Analiza błędów
Estymacja
Estymacją nazywamy szacowanie wartości
parametrów lub postaci rozkładu w populacji
generalnej, na podstawie obserwacji uzyskanych
w próbie losowej.
Opracowanie: dr inż. Małgorzata Rabiej
Estymacja parametryczna
dotyczy szacowania wartości parametrów w
znanym typie rozkładu populacji generalnej.
Estymacja nieparametryczna
dotyczy szacowania nieznanej postaci
funkcyjnej rozkładu.
Opracowanie: dr inż. Małgorzata Rabiej
Estymator.
Definicja.
Estymatorem parametru Q rozkładu
zmiennej losowej X nazywamy taką
statystykę wyznaczoną na podstawie
próby Zn=f(X1, ..., Xn), której rozkład
prawdopodobieństwa zależy od
szacowanego parametru Q.
Opracowanie: dr inż. Małgorzata Rabiej
Błąd szacunku
(estymacji) – różnica pomiędzy wartością
estymatora i parametru
Opracowanie: dr inż. Małgorzata Rabiej
Cechy dobrego estymatora
1. Nieobciążoność
2. Zgodność
3. Efektywność
4. Dostateczność.
Opracowanie: dr inż. Małgorzata Rabiej
Estymator nieobciążony
Estymator nieobciążony to ten, którego
wartość oczekiwana jest dokładnie równa
wartości szacowanego parametru.
(przy wielokrotnym losowaniu próby średnia
z wartości przyjmowanych przez estymator
nieobciążony jest równa wartości
szacowanego parametru).
Opracowanie: dr inż. Małgorzata Rabiej
Obciążoność
Obciążoność oznacza, że oszacowania
dostarczone przez taki estymator są
obarczone błędem systematycznym.
Opracowanie: dr inż. Małgorzata Rabiej
Estymacja
• Obciążeniem estymatora nazywana jest
różnica pomiędzy wartością oczekiwaną i
wartością parametru.
• Dla estymatora nieobciążonego obciążenie = 0.
• Jeśli wraz ze wzrostem liczebności próby
obciążenie bn estymatora maleje, to estymator
nazywany jest estymatorem asymptotycznie
nieobciążonym.
Opracowanie: dr inż. Małgorzata Rabiej
Estymatory zgodne
• Zgodność to własność estymatora
powodująca, że wraz ze wzrostem
liczebności próby wartość estymatora zbliża
się do parametru zbiorowości generalnej.
• Estymator Zn parametru Q nazywamy
zgodnym, jeśli jest stochastycznie zbieżny
do szacowanego parametru Q tzn. jeżeli
lim P{| Zn Q | } 0
n
Opracowanie: dr inż. Małgorzata Rabiej
Efektywność estymatora
Efektywnością estymatora nieobciążonego
parametru Q - nazywamy iloraz wariancji
estymatora najefektywniejszego do wariancji
badanego estymatora.
Spośród wszystkich nieobciążonych estymatorów
parametru Q, ten z nich jest najefektywniejszy,
który posiada najmniejszą wariancję.
Odwrotność wariancji estymatora nosi nazwę
precyzji.
Opracowanie: dr inż. Małgorzata Rabiej
Dostateczność (wystarczalność)
• Estymator jest dostateczny, jeśli zawiera
wszystkie informacje, jakie na temat
parametru występują w próbie.
Opracowanie: dr inż. Małgorzata Rabiej
Estymacja punktowa
polega na tym, że jako wartość parametru
przyjmuje się wartość estymatora tego
parametru, otrzymaną z danej, n-elementowej
próby losowej.
Opracowanie: dr inż. Małgorzata Rabiej
Estymacja przedziałowa
Estymacja przedziałowa polega na zbudowaniu
przedziału liczbowego, który z pewnym, z góry
zadanym prawdopodobieństwem zawiera
nieznaną wartość szacowanego parametru.
To prawdopodobieństwo nazywane jest
współczynnikiem ufności lub poziomem
ufności, a oszacowany przedział - przedziałem
ufności.
Współczynnik ufności oznacza się jako 1-.
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności
jest to losowy przedział wyznaczony za
pomocą rozkładu estymatora, a mający tę
własność, że z dużym, z góry zadanym
prawdopodobieństwem pokrywa wartość
szacowanego parametru.
Zapisujemy go zwykle w postaci
P (a< <b) = 1-.
Opracowanie: dr inż. Małgorzata Rabiej
u
u jest taką wartością w standardowym
rozkładzie normalnym, że pole pod krzywą
gęstości w przedziale (- u , u ) równe jest
1-.
P(|U| u ) = 1-
Opracowanie: dr inż. Małgorzata Rabiej
( u) = 1- (/2),
Opracowanie: dr inż. Małgorzata Rabiej
P(-u U u ) = 1-
( u)- ( -u) = ( u) –(1- ( u))
2(u)-1 =1-
2(u) =2-
( u) = 1- /2
Opracowanie: dr inż. Małgorzata Rabiej
Zakładamy, że 1- = 0,95
= 0,05
/2 = 0,025
czyli 1-/2 = 0,975
( u) = 1- (/2) =0,975
Opracowanie: dr inż. Małgorzata Rabiej
Opracowanie: dr inż. Małgorzata Rabiej
Kwantyle u(p) rzędu p
rozkładu normalnego N(0,1);
p = 1-/2
0,2
0,1
0,05
0,02
0,01
p
0,90
0,95
0,975
0,99
0,995
u(p)
(u)
1,28
1,64
1,96
2,33
2,58
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności dla średniej m w populacji
normalnej ze znanym odchyleniem
standardowym
Założenia: Cecha X ma w populacji generalnej
rozkład N(m, ), - znane.
Pobrano próbę losową (X1, ..., Xn).
Należy, opierając się na próbie pochodzącej z
tej populacji znaleźć przedział ufności dla
parametru m, przyjmując współczynnik ufności
równy 1- .
Opracowanie: dr inż. Małgorzata Rabiej
Estymatorem wartości oczekiwanej jest
n
1
x xi
n i 1
o rozkładzie
N(m,
n
)
Opracowanie: dr inż. Małgorzata Rabiej
• Standaryzując x
otrzymujemy U
xm
U
n
•
o rozkładzie N(0,1)
Opracowanie: dr inż. Małgorzata Rabiej
P(|U| u ) = 1-
P(-u < U < u ) = 1 -
xm
P( u
n u ) 1
P x u
m x u
1
n
n
, x u
x u
n
n
Opracowanie: dr inż. Małgorzata Rabiej
Przykład
• Do napełniania dwukilowych puszek farbą olejną używa
się automatu dozującego. Z doświadczenia wynika, że
rozkład dozowanych ilości farby jest normalny z
odchyleniem standardowym wynoszącym 1,1 dag.
Dokonano 9 losowych pomiarów wagi zawartości puszek
200,8; 199; 198,6; 197,8; 200,2; 199,8; 200,5; 197,5; 198;
Opierając się na powyższych danych wyznaczymy przedział
ufności dla nieznanej średniej wagi farby dozowanej
przez automat przyjmując 1- = 0,95.
Opracowanie: dr inż. Małgorzata Rabiej
Rozwiązanie
m x u
x u
n
n
x =(200,8 + .....) / 9 =199,2
= 0,05
( u) = 1- (/2)=0,975,
Opracowanie: dr inż. Małgorzata Rabiej
1,1
1,1
m 199,2 1,96
199,2 1,96
9
9
198,5 <m <199,9
Otrzymany przedział ufności (198,5; 199,9) jest
jednym z możliwych do otrzymania
przedziałów, które pokrywają z 95% ufnością
nieznana średnią wagę dozowanej farby olejnej.
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności dla średniej m w
populacji normalnej z nieznanym
odchyleniem standardowym.
Założenia: Cecha X ma w populacji generalnej rozkład
N(m, ), m, - nieznane.
Pobrano próbę losową (X1, ..., Xn).
Należy, opierając się na próbie pochodzącej z tej
populacji znaleźć przedział ufności dla parametru
m, przyjmując współczynnik ufności równy 1- .
Opracowanie: dr inż. Małgorzata Rabiej
• W tym przypadku korzystamy z rozkładu tStudenta, który jest niezależny od parametru
xm
t
n
s
Opracowanie: dr inż. Małgorzata Rabiej
• Obliczamy z próby wartość średnią i odchylenie
standardowe s
P(- t, < t < t, ) = 1- ,
xm
P(t ,n 1
n t ,n 1 ) 1
s
s
s
P x t ,n 1
m x t ,n 1
1
n
n
s
,
x t ,n 1
n
x t ,n 1
s
n
Opracowanie: dr inż. Małgorzata Rabiej
Tablice t Studenta.
n
4
5
6
10
11
12
13
18
19
25
26
40
=0,1
2,132
2.015
1.943
1,812
1,796
1,782
1,771
1.734
1.729
1.708
1.706
1.684
= 0,05
2,776
2.571
2.447
2,228
2,201
1,179
2,160
2.552
2.093
2.060
2.056
2.021
= 0,02
3,747
3,365
3.143
2,764
2,718
2,681
2,650
2.878
2.539
2.485
2.479
2.423
=0,01
4,604
4.032
3.707
3,169
3,106
3,055
3,012
3.922
2.861
2.787
2.779
2.704
Przykład.
Wytrzymałość pewnego materiału budowlanego jest
zmienną losową o rozkładzie normalnym N(m,).
W celu oszacowania nieznanej średniej m
wytrzymałości tego materiału dokonano pomiarów
na n = 5 wylosowanych niezależnie sztukach tego
materiału. Otrzymano wartości:
20,4, 19,6, 22,1, 20,8, 21,1.
Przyjmując współczynnik ufności 1- = 0,99
zbudować przedział ufności dla nieznanej średniej.
Opracowanie: dr inż. Małgorzata Rabiej
1
X
n
n
i 1
1
s
n 1
104
Xi
20,8
5
2
(Xi X) 0,676 0,82
• Z tablic t-Studenta odczytujemy dla 1- = 0,99 oraz
dla n-1= 4 stopni swobody wartość t = 4.604
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności dla wariancji 2
w populacji normalnej
Założenia: Cecha X ma w populacji generalnej rozkład
N(m, ), m, - nieznane.
Pobrano próbę losową (X1, ..., Xn).
Należy, opierając się na próbie pochodzącej z tej
populacji znaleźć przedział ufności dla wariancji ,
przyjmując współczynnik ufności równy 1- .
Opracowanie: dr inż. Małgorzata Rabiej
• Budując przedział ufności będziemy opierać
się na statystyce
(n 1)s
2
2
2
Opracowanie: dr inż. Małgorzata Rabiej
W rozkładzie 2 można określić dwie wartości
2
, n 1
2
2
1 , n 1
2
spełniające odpowiednio równości
2
2
P
, n 1
2
2
2
2
P 1
1 , n 1
2
2
Opracowanie: dr inż. Małgorzata Rabiej
• Z wzorów tych wynika:
2
2
2
P 1
1 , n 1
, n 1
2
2
• Po podstawieniu otrzymamy
2
(n 1)s 2
2
P
1
2
1 , n 1
, n 1
2
2
Opracowanie: dr inż. Małgorzata Rabiej
• A po przekształceniach
2
(n 1)s 2
(
n
1
)
s
P 2
2 2
,n 1
1 , n 1
2
2
1
Opracowanie: dr inż. Małgorzata Rabiej
Rozkład 2
n
0,05
0,02
0,01
0,98
0,99
2
5.991
7.824
9.210
0.040
0.020
3
7.815
9.837
11.345
0.185
0.115
4
9.488
11.668 13.277
0.429
0.297
5
11.070 13.388 15.086
0.752
0.554
6
12.592 15.033 16.812
1.134
0.872
7
14.067 16.622 18.475
1.564
1.239
Przykład
Badając wytrzymałość elementu konstrukcyjnego
pewnego urządzenia technicznego dokonano n = 4
niezależnych pomiarów wytrzymałości i
otrzymano następujące wyniki:
120, 102, 135, 115.
Zbudować przedziały ufności dla wariancji
wytrzymałości tego elementu, przyjmując
współczynnik ufności =0,96.
Opracowanie: dr inż. Małgorzata Rabiej
2
(n 1)s 2
(n 1)s
2
P 2
2
,n 1
1 , n 1
2
2
x
=118, s2 = 186
1 - = 0,96
2
, n 1
2
(n-1)s2 = 558
= 0,04
0,185
1
1-1/2 =0,98
2
9,84
1 , n 1
2dr inż. Małgorzata Rabiej
Opracowanie:
Przedział ufności dla wariancji
56,7 < 2 <3016
Przedział ufności dla odchylenia standardowego
7,5 < < 54,9
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności dla odchylenia
standardowego .
Granice przedziału ufności wyznacza się ze
wzoru
s
s
P
1
u
u
1
1
2n
2n
Opracowanie: dr inż. Małgorzata Rabiej
Przedział ufności dla wskaźnika
struktury p.
• Najlepszym estymatorem parametru p jest
wskaźnik struktury uzyskany z próby a więc
k/n czyli częstość sukcesów k w nelementowej próbce
k
p̂
n
Opracowanie: dr inż. Małgorzata Rabiej
Budowę przedziału ufności opiera się w oparciu
o twierdzenie graniczne, że dla dostatecznie
dużego n statystyka p̂ ma w przybliżeniu
rozkład
p(1 p)
N(p,
)
n
a statystyka
U
p̂ p
p(1 p)
n
ma rozkład N(0,1)
Opracowanie: dr inż. Małgorzata Rabiej
p̂(1 p̂)
p̂(1 p̂)
1
P p̂ u
p p̂ u
n
n
Opracowanie: dr inż. Małgorzata Rabiej
Przykład.
Chcemy oszacować jaki procent pracujących
mieszkańców jada obiady w stołówkach
pracowniczych. Pobrano w tym celu próbę liczącą
n=900 osób i okazało się że 300 osób z tej próby
korzysta ze stołówki pracowniczej.
Przyjmując współczynnik ufności =0,95 zbudować
przedział ufności dla procentu badanej kategorii
osób.
Opracowanie: dr inż. Małgorzata Rabiej
k 300
p̂
0,333
n 900
D(p̂)
p̂(1 p̂)
1/ 3 2 / 3
2
0,016
n
900
90
Opracowanie: dr inż. Małgorzata Rabiej
Z tablicy rozkładu normalnego N(0,1) i dla
=0,05 znajdujemy u = 1,96.
Otrzymujemy następujący przedział ufności
0,333 -1,96*0,016 < p < 0,333 + 1,96*0,0016
czyli
0,302 <p <0,364
Opracowanie: dr inż. Małgorzata Rabiej
Wyznaczanie niezbędnej liczby
pomiarów dla próby.
1. Otrzymany przedział ma długość 2d
2. Połowa długości przedziału ufności d jest
miarą maksymalnego błędu szacunku
Opracowanie: dr inż. Małgorzata Rabiej
Populacja ma rozkład normalny i
znane jest odchylenie
standardowe.
,X u
X u
n
n
Opracowanie: dr inż. Małgorzata Rabiej
2d 2u
u
n
d
n
u
n
2
d
2
2
Opracowanie: dr inż. Małgorzata Rabiej
Przykład
Zbadać, ile niezależnych obserwacji powinna
liczyć próba, by na jej podstawie można było
oszacować średni czas wykonywania przez
robotnika pewnej operacji technicznej z błędem
maksymalnym
29
sek,
przy
danym
współczynniku ufności = 0,95. Wiadomo, że czas
wykonywania tej operacji jest zmienną losową o
rozkładzie normalnym N(m, 40)
Opracowanie: dr inż. Małgorzata Rabiej
• =40, 2 =1600.
• Z tablic rozkładu normalnego N(0,1) dla
1- =0,95 odczytujemy u =1,96
(1,96) 1600
n
15,36 16.
2
20
2
Opracowanie: dr inż. Małgorzata Rabiej
Populacja ma rozkład normalny i
nieznana jest wariancja.
s
s
P X t ,n 1
m X t ,n 1
1
n
n
2 2
t s
n 2
d
Opracowanie: dr inż. Małgorzata Rabiej
Minimalna liczebność próby przy
szacowanie wskaźnika struktury
Oznaczmy q=1-p.
u
pq
d
n
2
u pq
n 2
d
Opracowanie: dr inż. Małgorzata Rabiej
Przykład
Zbadać, ile należy wylosować niezależnie
studentów do próby, by oszacować procent
studentów tej uczelni palących papierosy z
błędem maksymalnym 5% przy
współczynniku ufności =0,90.
Przypuszcza się, że szacowany procent
studentów palących wynosi 70%.
Opracowanie: dr inż. Małgorzata Rabiej
• Dla 1-= 0,90 u =1,64.
Mamy d = 0,05 oraz p = 0,7 , q= 0,3
u pq 1,64 0,7 0,3
n 2
225
,
96
226
2
d
0,05
2
2
Opracowanie: dr inż. Małgorzata Rabiej