Korekta Bonferoniego
Transkrypt
Korekta Bonferoniego
Wykład 9 Analiza wariancji (ANOVA) • Sposób analizy danych, gdy porównujemy więcej niż dwie populacje/zabiegi. • Omówimy ANOV-ę w najprostszej postaci. • Te same podstawowe założenia/ograniczenia, co przy teście Studenta: W każdej populacji badana cecha ma rozkład normalny Obserwacje są niezależne i losowe Testujemy hipotezy o średnich w populacjach: µI • Dodatkowe założenie – standardowe odchylenia badanej cechy w badanych populacjach są sobie równe (podobne) – użyjemy uśrednionego SE • Uwaga: ANOVA może być stosowana także wtedy, gdy próby nie są niezależne, np. w zrandomizowanym układzie blokowym (zasada podobna do testu Studenta dla par). Tutaj jednak omówimy tylko układy zrandomizowane zupełne (=jednoblokowe). • Cel: Testujemy hipotezy postaci: H0: µ1 = µ2 = µ3 = … = µk HA: nie wszystkie średnie są równe Dlaczego nie stosujemy wielu testów Studenta? • Wielokrotne porównania: prawdopodo-bieństwo błędu pierwszego rodzaju (odrzucenia prawdziwej hipotezy zerowej) byłoby trudne do kontrolowania. • Estymacja błędu standardowego: ANOVA wykorzystuje informację zawartą we wszystkich obserwacjach: zwykle daje większą precyzję obliczenia/mniejsze SE niż indywidualne testy Studenta dla par. • ANOVA automatycznie porównuje konfiguracje populacji większe niż pary. Korekta Bonferoniego • Przy k testach na poziomie α, przyjmujemy łączny poziom istotności kα. • Prosta, ale na ogół konserwatywna: prawdopodobieństwo błędu pierwszego rodzaju jest mniejsze niż założone kα – w efekcie strata mocy. • Np. przy porównywaniu 5 populacji testem Studenta dla niezależnych prób Bonferoni daje poziom istotności równy 5 5(4 − 1) α = α = 10α . 2 2 • Trzy kategorie: – wewnątrz grup, – pomiędzy grupami, – łącznie. Notacja: k = 3 zabiegi (grupy) Zabieg 1 Zabieg 2 Zabieg 3 1 48 40 39 2 39 48 30 44 32 wewnątrz 35 pomiędzy • W każdej - trzy wartości: SS, df, MS. SS 3 42 4 43 średnia 43 44 34 SS 42 32 46 df MS łącznie 1 • Używamy i do indeksowania grup a j do indeksowania obserwacji w każdej grupie, np: yij . • ∑ = ∑ oznacza sumę ``wewnątrz grupy’’: Notacja, cd.: k : # grup (prób, zabiegów), tutaj k = n1, n2, n3, …, nk : rozmiary grup (# obserwacji) n1 = n3 = y1 , y2, … yk = średnie w grupach y1= y3= = całkowita średnia y(wszystkich obserwacji) y= , n2 = , ,y2 = j ∑y y1 = , y1 = 1j n1 ( 48 + 39 + 42 + 43) 4 440 = 40 11 n* = całkowita liczba obserwacji n* = • Uwzględniające wszystkie grupy * ∑ • UWAGA: Gdy rozmiary prób nie są równe k oznacza sumę po grupach: ∑ y nie jest średnią z k średnich! Można ją obliczyć jako i=1 ∗ np. n∗ = ∑ ni ; tutaj n* = • ∗ ∑∑ y = (n1y1 + n2y2 + …+n3y3) / n* y ij y= n∗ y= (172 + 132 + 136 ) 11 = 40 Wewnątrz grup: wypełniamy drugi rząd w tabeli Suma kwadratów wewnątrz grup (SSW): Liczymy SS dla każdej grupy SS1 = ∑ ( y1 j − y1 ) (SS2, SS3 , itd.) 2 SS1 = ..... SS2 = … = 32, SS3 = … = 46 • SSW = SS∗1+SS2+…+SSk ∗ ∑ SS = ∑∑ ( y i ij − yi ) , tutaj SSW =.... 2 • Stopnie swobody wewnątrz grup: dfw = n* - k, tutaj dfw =... • Średnia suma kwadratów wewnątrz grup: MSW = SSW / dfw , tutaj MSW =... MSW to uśredniona wariancja, np.(wykład 6): s c2 = S S1 + S S 2 n1 + n 2 − 2 • Uśrednione odchylenie standardowe MSW , tutaj sc =... sc = 2 Pomiędzy grupami: wypełniamy pierwszy rząd tabeli • Porównujemy średnie grupowe do całkowitej z wagą daną przez rozmiar grupy. • Suma kwadratów pomiędzy grupami (SSB) ∑n ( y ∗ SSB = i i −y ) • Stopnie swobody pomiędzy grupami (dfb) dfb = k – 1, tutaj dfb = ... • Średnia suma kwadratów pomiędzy grupami (MSB) MSB = SSB/dfb, tutaj MSB =... 2 Tutaj SSB =.... Całkowite: wypełniamy trzeci rząd tabeli • Całkowita suma kwadratów (SST): ∑∑ ( y ∗ SST= ij −y ) • Uwaga: SST = SSW+SSB, tu 348 = 120 + 228 Zwykle nie trzeba liczyć SST z definicji! • Całkowita liczba stopni swobody (dft) dft = n* – 1 , tutaj dft = 2 • Uwaga: dft = dfb+dfw , tutaj 10 = 2 + 8 SST=82+12+22+…+82+52=348 Tablica ANOV-y (ponownie) Ta tabela będzie dostępna na kolokwium i egzaminie: SS SS df Pomiędzy SSB= ∑n (y ∗ i Between Wewnątrz Within −y i MS dfb = k – 1 SSB/dfb ) dfw = n* – k SSW/dfw ∗ ∑ SS = ∑∑ ( y puste Całkowite 2 SSW= ∗ i Total df MS ij − yi ) SST= 2 dft = n* – 1 ∑∑ ( y ∗ ij −y ) 2 3 • Test F (Fishera) • Założenia (jak w ANOV-ie): • Dane dla k ≥ 2 populacji/zabiegów są niezależne • Dane w każdej populacji mają rozkład normalny ze średnią µi (dla populacji I), oraz z tym samym odchyleniem standardowym σ Testujemy H0: µ1 = µ2 = µ3 = … = µk (wszystkie średnie są sobie równe) przeciwko HA: nie wszystkie średnie są sobie równe • HA jest niekierunkowa, ale obszar odrzuceń będzie jednostronny (duże dodatnie wartości statystyki) • Kroki: Obliczenie tabeli ANOV-y Testowanie Jak opisać F test Zdefinować wszystkie µ H0 podać za pomocą wzoru i słownie HA tylko słownie Statystyka testowa Fs = MSB/MSW Przy H0, Fs ma rozkład F Snedecora ze stopniami swobody (dfb, dfw) • Na slajdach podane są wartości krytyczne z książki D.S. Moore i G. P. McCabe „Introduction to the Practice of Statistics” • „numerator df” = dfb, „denominator df” = dfw. • • • • • 4 • Odrzucamy H0 , gdy zaobserwowane Fs > Fkrytyczne • Przykładowy wniosek: „Na poziomie istotności α (nie) mamy przesłanki, aby twierdzić, że grupy różnią się poziomem badanej cechy.” • Przykład: Losową próbę 15 zdrowych mężczyzn podzielono losowo na 3 grupy składające się z 5 mężczyzn. Przez tydzień otrzymywali oni lekarstwo Paxil w dawkach 0, 20 i 40 mg dziennie. Po tym czasie zmierzono im poziom serotoniny. • Czy Paxil wpływa na poziom serotoniny u zdrowych, młodych mężczyzn ? Niech µ1 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 0 mg Paxilu. Niech µ2 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 20 mg Paxilu. Niech µ3 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 40 mg Paxilu. Dawka 0mg 20mg 58,60 72,52 68,59 78,28 n srednia 64,22 62,81 62,51 5 57,60 66,72 80,12 68,44 5 69,28 82,77 76,53 72,33 suma 5 75,70 SS(w) SS(b) 235,87 492,64 249,31 15,36 Tablica ANOV-y Between Within Total SS • Fs = MSB / MSW przy H0 ma rozkład... 40mg 48,62 49,85 df 119,29 334,03 MS • H0: µ1 = µ2 = µ3 ; średni poziom serotoniny nie zależy od dawki Paxilu • HA: średni poziom serotoniny nie jest ten sam we wszystkich grupach (albo średni poziom serotoniny zależy od dawki Paxilu). • Zastosujemy F-Test 15 67,53 604,47 842,02 • • • • Testujemy na poziomie α = 0.05. Wartość krytyczna F.05 = ... . Obserwujemy Fs =... Wniosek:... 5 Na jakiej zasadzie to działa ? Dla przypomnienia: • Statystyka testu Studenta ma w liczniku różnicę między średnimi (y1-y2) • Tę dzielimy przez miarę rozrzutu tej różnicy (SEy1-y2 ) • Jeżeli (y1-y2) jest duże w porównaniu do błędu standardowego, to statystyka testu Studenta jest duża i odrzucamy H0. Dla testu F: • W liczniku mamy „uśredniony kwadrat różnicy między średnimi” (MSB) • W mianowniku mamy oszacowanie zróżnicowania w obserwacji (MSW) • Jeżeli MSB jest duże w porównaniu do MSW, to statystyka testu F jest duża i odrzucamy H0. • Test F jest analogiczny do testu Studenta. Umożliwia jednoczesne porównanie dowolnej liczby średnich. • Test F można stosować również, gdy mamy tylko dwie próby. Wtedy: Statystyka testu F dla dwóch prób jest równa kwadratowi statystyki Studenta (przy (U)SE). Decyzje i p-wartości są dokładnie takie same dla obu testów. 6