(Microsoft PowerPoint - 07.a. Statystyki opisowe, tabele liczno\234ci
Transkrypt
(Microsoft PowerPoint - 07.a. Statystyki opisowe, tabele liczno\234ci
Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA © Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone • • • • Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu na zmianę średniej objętości krwinki czerwonej (MCV) Otrzymano następujące wyniki dla MCV: 86, 112, 182, 93, 94, 93, 134, 113, 95, 102 Przed przystąpieniem do dalszych analiz postanowiono sprawdzić występowanie jednostek nietypowych Znaleźć je na wykresie ramka-wąsy ramka-wąsy uwagi • wartości odstające i ekstremalne: Stanisz statystyki opisowe przykład 2. chorzy • • Stanisz W pewnym doświadczeniu medycznym przebadano 25 osób chorych na pewną chorobę Zebrane dane dotyczące cech (płci, wzrostu, wagi, poziomu cukru) przedstawiono w tabeli, w której ostatnia kolumna przedstawia Poziom umowną skalę natężenia choroby Płeć Wzrost Waga cukru • Wyznaczyć podstawowe statystyki opisowe poszczególnych zmiennych (wzrost, waga, poziom cukru) wraz z medianą, współczynnikiem asymetrii, kurtozą oraz współczynnikiem zmienności Skala nasilenia choroby 1 175 51,5 6,0 M 2 2 169 56,0 6,6 M 3 3 169 81,0 5,6 K 2 4 156 52,0 5,2 M 1 5 164 61,0 6,2 K 1 6 165 56,0 5,8 M 1 7 172 82,0 6,8 K 3 8 170 82,0 6,4 K 3 9 156 48,5 5,7 K 1 10 160 73,0 5,6 M 2 11 168 54,0 5,4 M 1 12 166 51,0 5,8 K 2 13 165 54,0 6,0 K 2 14 168 84,0 5,8 K 2 15 172 86,0 6,6 M 3 16 170 47,5 4,9 K 1 17 169 64,0 5,6 M 1 18 170 52,0 5,9 M 2 19 180 54,5 5,8 M 1 20 177 52,0 5,7 K 1 21 172 90,0 4,6 K 1 22 164 86,0 6,0 K 2 23 172 52,0 5,3 M 1 24 163 51,0 6,5 M 3 25 176 53,0 5,8 M 2 statystyki opisowe przykład 3. kraje Słaby • Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji • Obliczyć statystyki opisowe: - N ważnych - średnia - mediana - minimum - maksimum - kwartyle - rozstępy - odchylenie standardowe - współczynniki zmienności - skośność - kurtozę • Narysować, co się da: - histogramy - ramka-wąsy • Wyciągnąć wnioski statystyki opisowe przykład 3. kraje Słaby • Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji • Obliczyć statystyki opisowe: … Narysować, co się da: … Wyciągnąć wnioski … Podziel tę zbiorowość na 3 bardziej jednorodne podzbiory - niech zmienna LUDNOŚĆ będzie podstawą podziału na trzy grupy: * do 10 mln - A * do 100 mln – B * pow. 100 mln – C Przekoduj zmienną ludność i użyj jej jako zmiennej grupującej w histogramach i wykresach skategoryzowanych • • • • statystyki opisowe przykład 3. kraje Słaby • Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji • Obliczyć statystyki opisowe: … Narysować, co się da: … Wyciągnąć wnioski … Podziel tę zbiorowość nie ze względu na LUDNOŚĆ, a na prognozowaną INFLACJĘ * grupa A - poniżej 3% (3% to mediana inflacji) * grupa B – powyżej 3% Przeprowadź analizy w tych dwóch grupach • • • statystyki opisowe przykład 4. najbogatsi w USA Słaby • Kapitał (w mld USD) 20 najbogatszych Amerykanów w końcu listopada 1999 roku według Forbesa ilustrują następujące dane • Wyciągnąć wnioski • Czy pozycyjna miara skośności rozkładu kapitału wskazuje na ten sam kierunek asymetrii i na tę samą siłę, co klasyczna miara skośności? statystyki opisowe przykład 5. najbogatsi w Wwie Słaby • Dysponujemy fragmentem wydruku statystyk opisowych empirycznego rozkładu wartości rynkowej (w mln zł) posiadanych akcji grupy 25 „władców” warszawskiej giełdy w końcu 1999 roku • Wiedząc ponadto, że suma kwadratów odchyleń wartości rynkowej akcji od ich wartości średniej wynosi 771733.92 (mln zł)2 określić stopień względnego zróżnicowania badanej zmiennej: a) 36.91% b) 10.29% c) 73.85% d) 125.54% Statystyki opisowe (WŁADCY) zmienna WARTRYNK N ważnych Mediana 25 Suma 73,4 Skośność 3570,7 3,01 statystyki opisowe przykład 6. plany budżetowe • Słaby Dane empiryczne dotyczące planów budżetowych na 2000 rok 19 największych polskich miast w zakresie dochodów (X) oraz wydatków (Y) tys. zł zostały przedstawione (numerycznie i graficznie) następująco – vide tabelka i wykres: Statystyki opisowe (BUDŻETY) N ważnych Średnia Mediana zmienna DOCHODY 19 786760,4 604209,0 Dolny Kwartyl 327432,0 Na podstawie danych z wydruku oraz z wykresu ramkowego stwierdzić wyznaczając odpowiednie miary względne, czy zróżnicowanie rozkładów obu cech (dochodów i wydatków) jest: a) takie samo b) większe dla dochodów c) większe dla wydatków d) nie można dokonać porównania na wykresie widać, że: mediana: 625995 kwartyle 25%-75%: (341980,1461621) zakres nieodstających: (218760,2162000) Górny Kwartyl 1335657 Odch.Std. 533890,5 Skośność 0,767 statystyki opisowe przykład 7. tłok • Poniższe dane dotyczą zatłoczenia (liczby pieszych) w słynnych alejach handlowych w 13 wybranych miastach w dzień powszedni (wtorek) oraz dzień weekendowy (sobota) • Czy pozycyjna asymetria rozkładu zatłoczenia w badanych miastach była w dzień powszedni i w sobotę taka sama? • Czy była dodatnia? Słaby statystyki opisowe przykład 8. koszyk dóbr Luszniewicz • Tygodnik Polityka porównał w 2001r. płace oraz koszyk wybranych ;-) dóbr konsumpcyjnych. Wyniki obserwacji zostały przedstawione w tabeli • Która z obserwowanych zmiennych losowych charakteryzuje się najwyższym względnym stopniem zróżnicowania? Czy skośność i kurtoza są w analizowanych rozkładach podobne? Wykonaj histogramy (oddzielny dla płac oraz wielokrotny dla pozostałych zmiennych) oraz wykresy ramka-wąsy i przeanalizuj je • • • • • • Dokonaj standaryzacji wszystkich zmiennych Wykonaj histogramy oraz wykresy ramka-wąsy danych standaryzowanych Ile wynoszą średnie oraz odchylenia standardowe? Czy uległy zmianie liczbowe oceny współczynników skośności i kurtozy? statystyki opisowe przykład 9. firmy • W 2001r. sporządzono ranking 50 największych firm Europy Wschodniej – największych ze względu na kapitalizację rynkową (obroty w mln USD). Dane indywidualne w postaci szeregu rozdzielczego zamieszczone są w tabeli • Przedstaw je w postaci: – przedziałowego szeregu rozdzielczego , czyli tabeli liczności – histogramu – i wykresu ramka-wąsy • Oblicz podstawowe statystyki opisowe, czyli: średnią, medianę, min, max, dolny i górny kwartyl, odchylenie standardowe, skośność, kurtozę oraz klasyczny i pozycyjny wskaźnik zmienności, wyciągnij wnioski Luszniewicz, Słaby statystyki opisowe przykład 9. firmy • • • • Luszniewicz, Słaby Załóżmy, że nie posiadamy danych indywidualnych dla poszczególnych krajów, a jedynie informacje o przedziałowym szeregu rozdzielczym tych 50 firm - ich obroty przedstawiono w postaci k=8 przedziałów klasowych. Przedziałom odpowiadają wagi naturalne i udziałowe Dla każdego przedziału wyznacz jego środek Wyznacz statystyki opisowe dla danych zapisanych przedziałowo – dla środków przedziałów (średnią, medianę, max, min, kwartyle, odchylenie standardowe, współczynniki zmienności, skośność, kurtozę) i porównaj je ze statystykami otrzymanymi poprzednio dla pełnych danych statystyki opisowe przykłady 10, 11, 12. auta, mieszkania, uczelnie smarterlanet • W kolejnych arkuszach excelowych znajdują się dane dotyczące: – samochodów sprzedawanych za pośrednictwem serwisu otomoto w dniu 1.10.2011 – mieszkań sprzedawanych w Warszawie, Wrocławiu i Krakowie w latach 2006-2011 – rankingu uczelni przeprowadzonym przez „Politykę” w 2011r. • Przeanalizuj te dane i wyciągnij ciekawe wnioski