(Microsoft PowerPoint - 07.a. Statystyki opisowe, tabele liczno\234ci

Transkrypt

(Microsoft PowerPoint - 07.a. Statystyki opisowe, tabele liczno\234ci
Statystyki opisowe
i szeregi rozdzielcze
- ćwiczenia
ĆWICZENIA © Piotr Ciskowski
ramka-wąsy
przykład 1. krwinki czerwone
•
•
•
•
Stanisz
W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu na zmianę
średniej objętości krwinki czerwonej (MCV)
Otrzymano następujące wyniki dla MCV: 86, 112, 182, 93, 94, 93, 134, 113, 95, 102
Przed przystąpieniem do dalszych analiz postanowiono sprawdzić występowanie jednostek
nietypowych
Znaleźć je na wykresie ramka-wąsy
ramka-wąsy
uwagi
•
wartości odstające i ekstremalne:
Stanisz
statystyki opisowe
przykład 2. chorzy
•
•
Stanisz
W pewnym doświadczeniu medycznym przebadano 25 osób chorych na pewną chorobę
Zebrane dane dotyczące cech (płci, wzrostu, wagi, poziomu cukru) przedstawiono w tabeli,
w której ostatnia kolumna przedstawia
Poziom
umowną skalę natężenia choroby
Płeć
Wzrost Waga
cukru
•
Wyznaczyć podstawowe statystyki opisowe
poszczególnych zmiennych (wzrost, waga, poziom cukru)
wraz z medianą, współczynnikiem asymetrii, kurtozą
oraz współczynnikiem zmienności
Skala
nasilenia
choroby
1
175
51,5
6,0
M
2
2
169
56,0
6,6
M
3
3
169
81,0
5,6
K
2
4
156
52,0
5,2
M
1
5
164
61,0
6,2
K
1
6
165
56,0
5,8
M
1
7
172
82,0
6,8
K
3
8
170
82,0
6,4
K
3
9
156
48,5
5,7
K
1
10
160
73,0
5,6
M
2
11
168
54,0
5,4
M
1
12
166
51,0
5,8
K
2
13
165
54,0
6,0
K
2
14
168
84,0
5,8
K
2
15
172
86,0
6,6
M
3
16
170
47,5
4,9
K
1
17
169
64,0
5,6
M
1
18
170
52,0
5,9
M
2
19
180
54,5
5,8
M
1
20
177
52,0
5,7
K
1
21
172
90,0
4,6
K
1
22
164
86,0
6,0
K
2
23
172
52,0
5,3
M
1
24
163
51,0
6,5
M
3
25
176
53,0
5,8
M
2
statystyki opisowe
przykład 3. kraje
Słaby
•
Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok)
w zakresie PKB, liczby ludności oraz inflacji
•
Obliczyć statystyki opisowe:
- N ważnych
- średnia
- mediana
- minimum
- maksimum
- kwartyle
- rozstępy
- odchylenie standardowe
- współczynniki zmienności
- skośność
- kurtozę
•
Narysować, co się da:
- histogramy
- ramka-wąsy
•
Wyciągnąć wnioski
statystyki opisowe
przykład 3. kraje
Słaby
•
Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok)
w zakresie PKB, liczby ludności oraz inflacji
•
Obliczyć statystyki opisowe:
…
Narysować, co się da:
…
Wyciągnąć wnioski
…
Podziel tę zbiorowość
na 3 bardziej jednorodne podzbiory
- niech zmienna LUDNOŚĆ będzie
podstawą podziału na trzy grupy:
*
do 10 mln - A
*
do 100 mln – B
* pow. 100 mln – C
Przekoduj zmienną ludność
i użyj jej jako zmiennej grupującej
w histogramach i wykresach
skategoryzowanych
•
•
•
•
statystyki opisowe
przykład 3. kraje
Słaby
•
Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok)
w zakresie PKB, liczby ludności oraz inflacji
•
Obliczyć statystyki opisowe:
…
Narysować, co się da:
…
Wyciągnąć wnioski
…
Podziel tę zbiorowość nie ze względu na LUDNOŚĆ, a na prognozowaną INFLACJĘ
* grupa A - poniżej 3%
(3% to mediana inflacji)
* grupa B – powyżej 3%
Przeprowadź analizy w tych dwóch grupach
•
•
•
statystyki opisowe
przykład 4. najbogatsi w USA
Słaby
•
Kapitał (w mld USD) 20 najbogatszych Amerykanów w końcu listopada 1999 roku według Forbesa
ilustrują następujące dane
•
Wyciągnąć wnioski
•
Czy pozycyjna miara skośności rozkładu kapitału
wskazuje na ten sam kierunek asymetrii
i na tę samą siłę, co klasyczna miara skośności?
statystyki opisowe
przykład 5. najbogatsi w Wwie
Słaby
•
Dysponujemy fragmentem wydruku statystyk opisowych
empirycznego rozkładu wartości rynkowej (w mln zł) posiadanych akcji
grupy 25 „władców” warszawskiej giełdy w końcu 1999 roku
•
Wiedząc ponadto, że suma kwadratów odchyleń wartości rynkowej akcji
od ich wartości średniej wynosi 771733.92 (mln zł)2 określić
stopień względnego zróżnicowania badanej zmiennej:
a) 36.91%
b) 10.29%
c) 73.85%
d) 125.54%
Statystyki opisowe (WŁADCY)
zmienna
WARTRYNK
N ważnych
Mediana
25
Suma
73,4
Skośność
3570,7
3,01
statystyki opisowe
przykład 6. plany budżetowe
•
Słaby
Dane empiryczne dotyczące planów budżetowych na 2000 rok 19 największych polskich miast
w zakresie dochodów (X) oraz wydatków (Y) tys. zł zostały przedstawione
(numerycznie i graficznie) następująco – vide tabelka i wykres:
Statystyki opisowe (BUDŻETY)
N ważnych
Średnia
Mediana
zmienna
DOCHODY
19
786760,4
604209,0
Dolny
Kwartyl
327432,0
Na podstawie danych z wydruku oraz z wykresu ramkowego
stwierdzić wyznaczając odpowiednie miary względne,
czy zróżnicowanie rozkładów obu cech
(dochodów i wydatków) jest:
a) takie samo
b) większe dla dochodów
c) większe dla wydatków
d) nie można dokonać porównania
na wykresie widać, że: mediana: 625995
kwartyle 25%-75%: (341980,1461621)
zakres nieodstających: (218760,2162000)
Górny
Kwartyl
1335657
Odch.Std.
533890,5
Skośność
0,767
statystyki opisowe
przykład 7. tłok
•
Poniższe dane dotyczą zatłoczenia (liczby pieszych) w słynnych alejach handlowych w 13
wybranych miastach w dzień powszedni (wtorek) oraz dzień weekendowy (sobota)
•
Czy pozycyjna asymetria rozkładu zatłoczenia w badanych miastach
była w dzień powszedni i w sobotę taka sama?
•
Czy była dodatnia?
Słaby
statystyki opisowe
przykład 8. koszyk dóbr
Luszniewicz
•
Tygodnik Polityka porównał w 2001r. płace oraz koszyk wybranych ;-) dóbr konsumpcyjnych.
Wyniki obserwacji zostały przedstawione w tabeli
•
Która z obserwowanych zmiennych losowych charakteryzuje się
najwyższym względnym stopniem zróżnicowania?
Czy skośność i kurtoza są w analizowanych rozkładach podobne?
Wykonaj histogramy (oddzielny dla płac oraz wielokrotny dla pozostałych zmiennych)
oraz wykresy ramka-wąsy i przeanalizuj je
•
•
•
•
•
•
Dokonaj standaryzacji
wszystkich zmiennych
Wykonaj histogramy
oraz wykresy ramka-wąsy
danych standaryzowanych
Ile wynoszą średnie
oraz odchylenia standardowe?
Czy uległy zmianie
liczbowe oceny
współczynników skośności
i kurtozy?
statystyki opisowe
przykład 9. firmy
•
W 2001r. sporządzono ranking 50 największych firm Europy Wschodniej
– największych ze względu na kapitalizację rynkową (obroty w mln USD).
Dane indywidualne w postaci szeregu rozdzielczego zamieszczone są w tabeli
•
Przedstaw je w postaci:
–
przedziałowego szeregu rozdzielczego ,
czyli tabeli liczności
– histogramu
– i wykresu ramka-wąsy
•
Oblicz podstawowe statystyki opisowe, czyli:
średnią, medianę, min, max, dolny i górny kwartyl,
odchylenie standardowe, skośność, kurtozę
oraz klasyczny i pozycyjny wskaźnik zmienności,
wyciągnij wnioski
Luszniewicz, Słaby
statystyki opisowe
przykład 9. firmy
•
•
•
•
Luszniewicz, Słaby
Załóżmy, że nie posiadamy danych indywidualnych dla poszczególnych krajów,
a jedynie informacje o przedziałowym szeregu rozdzielczym tych 50 firm
- ich obroty przedstawiono w postaci k=8 przedziałów klasowych.
Przedziałom odpowiadają wagi naturalne i udziałowe
Dla każdego przedziału wyznacz jego środek
Wyznacz statystyki opisowe dla danych zapisanych przedziałowo – dla środków przedziałów
(średnią, medianę, max, min, kwartyle, odchylenie standardowe,
współczynniki zmienności, skośność, kurtozę)
i porównaj je
ze statystykami otrzymanymi poprzednio
dla pełnych danych
statystyki opisowe
przykłady 10, 11, 12. auta, mieszkania, uczelnie
smarterlanet
•
W kolejnych arkuszach excelowych znajdują się dane dotyczące:
– samochodów sprzedawanych za pośrednictwem serwisu otomoto w dniu 1.10.2011
– mieszkań sprzedawanych w Warszawie, Wrocławiu i Krakowie w latach 2006-2011
– rankingu uczelni przeprowadzonym przez „Politykę” w 2011r.
•
Przeanalizuj te dane i wyciągnij ciekawe wnioski