Ćwiczenie 8

Transkrypt

Ćwiczenie 8
Zadanie
W celu sprawdzenia, czy pipeta jest obarczona błędem
systematycznym stałym lub zmiennym wykonano szereg pomiarów
przy różnych ustawieniach pipety. Wyznacz równanie regresji
liniowej, które pozwoli stwierdzić z jakim błędem mamy do
czynienia. X – wartość ustawiona, Y – wartość zmierzona.
X
4,0
8,0
12,0
16,0
20,0
Y
3,3
6,8
11,0
15,2
18,9
Prosta regresji najmniejszych kwadratów:
y=a xb
Szukamy takich wartości a i b, aby różnice:
yi − y i
były jak najmniejsze.
Współczynniki regresji liniowej:
a=
N ∑ x i y i −∑ x i ∑ y i
2
i
N ∑ x −∑ x i 
2
x i ∑ x i yi −∑ xi2 ∑ yi2
∑
b=
2
∑ x i  − N ∑ xi2
a=0,99
b=−0,84
y −b
a= 
x
b= y −a x
Odchylenie standardowe współczynnika kierunkowego regresji a
oraz współczynnika przesunięcia b wyliczmy ze wzorów:
s a=


s 2xy
N s 2x
2
2
sa ∑ xi
sb=
N
Przedziały ufności dla współczynnika kierunkowego regresji a
oraz współczynnika przesunięcia b wyliczmy ze wzorów:
a−t  / 2 ; df =n−2 s a Aat / 2 ; df =n−2 s a
b−t  / 2 ; df =n−2 s b Bbt / 2 ; df =n−2 s b
Odchylenie standardowe resztkowe:

2

y
−
y


∑
i
i
s xy =
N −2
y  x=4,0=3,12
y  x=8,0=7,08
y  x=12,0=11,04
y  x=16,0=15,00
y  x=20,0=18,96
s xy =0,23
Odchylenie standardowe sa oraz sb wynosi:
s a =0,016
s b=0,21
Przedziały ufności dla współczynnika kierunkowego regresji a
oraz współczynnika przesunięcia b są następujące:
0,94 A1,04
−1,51B−0,17
Miarą współzależności liniowej dwóch zmiennych X i Y jest
kowariancja określona wzorem:
n
1
cov  x , y= ∑  x i − x  yi − y 
n i =1
xi yi
∑
cov  x , y=
− x y
n
Bezpośrednie porównywanie pierwotnych wartości liczbowych
par cech w badanej próbie nie ma merytorycznego uzasadnienia.
Można porównywać ze sobą wartości unormowane różnych cech.
Wartości unormowane są obliczane z następujących wzorów.
xi − x
x '=
sx
y i − y
y'=
sy
Powszechnie przyjęto używać jako miary związku
współzależności między cechami wielkość zwaną
współczynnikiem korelacyjnym Pearsona r:
cov  x , y
r=
=
s x⋅s y
∑  xi −x  y i− y 
2
2

x
−
x


y
−
y



∑
∑
 i
i
Uwaga! W tym przypadku we wzorach na sx oraz sy w mianowniku jest n, a nie n-1!
Lub współczynnika determinacji - r2:
Odchylenie standardowe współczynnika korelacji dla małolicznej
próby wynosi:
1−r 2
sr =
n−1
Współczynnik korelacji r przybiera wartości z zakresu <-1;1>.
Przy zupełnym braku korelacji r = 0. Przy pełnej korelacji r = 1
(korelacja dodatnia) lub r = -1 (korelacja ujemna). Pozostałe
wartości świadczą o częściowej korelacji.
Istotność korelacji można zweryfikować testem t-Studenta.
Hipoteza H0:
=0
cov  X ,Y 
=
xy
Statystykę oblicza się ze wzoru:

r 2  N −2
t d=
1−r 2
df = N −2
Zadanie
Z populacji mężczyzn wybrano losowo próbę złożoną z 6 osób i
określono ich masę oraz wzrost otrzymując następujące pary liczb:
Wzrost (cm) Masa (kg)
161,9
54,3
164,7
51,4
180,6
71,6
188,8
81,5
176,7
75,0
171,6
60,8
Czy pomiędzy tymi cechami istnieje istotna statystycznie
korelacja?
xi yi
∑
cov  x , y=
− x y =96,8
n
s x =9,2
r=

s y =11,03
cov  x , y
=0,95
s x⋅s y
2
r  N −2
td=
=6,08
2
1−r
df =4
t / 2=0,025 ; df =4 =2,776
Odp.:
Istnieje korelacja pomiędzy wzrostem a masą ciała. 0,01<pvalue<0,002
Masa (kg)
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
160
165
170
175
180
Wzrost (cm)
185
190
195
Zadanie
Biorąc dane z poprzedniego zadania oblicz współczynnik
determinacji.
r 2 =0,90
Zadanie
W celu sprawdzenia dokładności dwóch metod stosowanych do
oznaczania stężenia glukozy przygotowano roztwór wzorcowy
glukozy o stężeniu 6 mg/ml. Następnie wykonano 9 pomiarów
dwoma metodami otrzymując następujące wyniki:
Czy metody te różnią się precyzją, jeśli tak, to
która z nich jest bardziej precyzyjna? Co
można powiedzieć o dokładności obydwu
metod?
Metoda I Metoda II
6,15
5,96
6,19
6,12
6,03
6,04
6,12
6,1
6,17
5,9
6,20
5,81
6,04
6,17
6,06
6,01
6,07
6,13
x I =6,11
x II =6,03
s I =0,066
s II =0,12
Sprawdzamy dokładność metod:
F =3,23
F  /2=0,025 ;8 ;8 =4,43
Metody nie różnią się istotnie precyzją.
Sprawdzamy rzetelność metod:
t I=
6,114−6
=5,0
0,066  9
t II =
Odp.:
Metoda I jest niedokładna.
6,027−6
=0,67
0,119  9
t /2=0,025 ;8 =2,306