Statystyka matematyczna dla leśników

Transkrypt

Statystyka matematyczna dla leśników
Statystyka matematyczna
dla leśników
Wydział Leśny
Kierunek „leśnictwo”
Studia Stacjonarne I Stopnia
Rok akademicki 2011/2012
Wykład 1
Statystyka
• Nazwa pochodząca o łac. słowa „status” – stan,
państwo i „statisticus” = polityczny
• Początki statystyka: spisy powszechne ludności
• Od XVIII-XIX wieku statystyka zajmowała się
opisem stanu państwa (gospodarki)
• W syntetycznym uproszczeniu: statystyka to
nauka (część matematyki), której przedmiotem
zainteresowania są metody pozyskiwania,
analizy i prezentacji danych opisujących róŜne
zjawiska, przede wszystkim zjawiska masowe
Statystyka - definicje
• nauka zajmująca się badaniem zbiorowości
niejednorodnych (czyli takich, w których
występują róŜnice między poszczególnymi
elementami tych zbiorowości)
• nauka o metodach badania zjawisk masowych
(czyli takich, które ujawniają się podczas badania
większej liczby jednostek).
• dyscyplina matematyki stosowanej, zajmująca się
metodami badania wielkości, których cechą
charakterystyczną jest zmienność
Statystyka w szkole podstawowej
• Klasa IV: odczytywanie danych o otaczającym
świecie, prezentowanie danych w postaci tabelek
lub prostej formie graficznej, wyszukiwania
konkretnych informacji
• Klasa V: korzystanie z formularzy do zbierania
danych, prezentowanie danych w zorganizowany
sposób, np. za pomocą diagramów słupkowych,
wyciąganie prostych wniosków z zebranych danych
• Klasa VI: przygotowanie formularza do zbierania
danych, graficzna prezentacja danych, wyciąganie
wniosków z zebranych danych, średnia
arytmetyczna
Statystyka dla leśnika
• Po co leśnikowi statystyka?
– Umiejętność zbierania danych
– Umiejętność opracowywania danych
– Umiejętność stawiania i sprawdzania hipotez
– Umiejętność znajdowania zaleŜności między
cechami
– Umiejętność przeprowadzania prognoz
– Zdolność do podejmowanie decyzji na
podstawie posiadanych (przetworzonych)
informacji
Statystyka na kierunku „leśnictwo”
• Samodzielny Zakład Dendrometrii i Nauki
o Produkcyjności lasu
– Budynek 34, II piętro, pokój 2/77A
Statystyka na kierunku „leśnictwo”
• Samodzielny Zakład Dendrometrii i Nauki
o Produkcyjności lasu
– Budynek 34, II piętro, pokój 2/77A
• Przedmioty:
– Statystyka matematyczna
– Dendrometria
– Nauka o produkcyjności lasu
– Zajęcia specjalizacyjne i fakultety (m.in.
metody pomiaru biomasy, zastosowanie
modeli wzrostu, dendrochronologia,
biometria, …)
Statystyka na kierunku „leśnictwo”
• Wykłady (15h, środa 14:15-16:00, Aula 2)
– Dr hab. Michał Zasada, prof. SGGW
• Ćwiczenia (30h, sala 2/3 i 2/6)
– Pracownicy: dr inŜ. Rafał Wojtan, dr inŜ.
Robert Tomusiak, dr Szymon Bijak
– Doktoranci: mgr inŜ. Agnieszka Bronisz, mgr
inŜ. Karol Bronisz, mgr inŜ. Maciej
Czajkowski, mgr inŜ. Łukasz Ludwisiak, mgr
inŜ. Michał Magnuszewski, mgr inŜ. Jacek
Sagan
Statystyka na kierunku „leśnictwo”
• A w razie problemów:
– Osobiście: budynek 34, II piętro, pokój 2/77A
(w gablocie obok sekretariatu - godziny
konsultacji prowadzących)
– Telefonicznie: numer wewnętrzny 38081
(sekretariat)
– E-mailowo: [email protected]
Statystyka na kierunku „leśnictwo”
• Ćwiczenia
– zaliczenie, w tym sprawozdania z
poszczególnych zajęć oraz kolokwia w trakcie
semestru
– szczegóły podadzą prowadzący na zajęciach
• Wykłady
– egzamin pisemny w sesji
– warunkiem przystąpienia do egzaminu jest
zaliczenie ćwiczeń
Literatura
• Bruchwald Arkadiusz. Statystyka
matematyczna dla leśników
• Łomnicki Adam. Wprowadzenie do
statystyki dla przyrodników
• Luszniewicz Andrzej, Słaby
Teresa. Statystyka stosowana
• Luszniewicz Andrzej. Statystyka
nie jest trudna
• Kassyk-Rokicka Helena. Statystyka
nie jest trudna
• inne źródła, równieŜ internetowe
Statystyka - podział
• statystyka opisowa (zbieranie danych, ich
prezentacja i sumaryczny opis)
• rachunek prawdopodobieństwa
(zdarzenia losowe)
• wnioskowanie statystyczne
(wykorzystanie teorii statystycznych do
uzyskiwania informacji o całości na
podstawie badania części)
Statystyka - pojęcia
• Zjawiska masowe
– to takie zjawiska, które badane w duŜej masie
zdarzeń ujawniają pewne prawidłowości,
jakich nie moŜna zaobserwować w przypadku
pojedynczych obserwacji
Statystyka - pojęcia
• Badanie statystyczne
– zespół czynności prowadzących do uzyskania
za pomocą metod statystycznych informacji o
objętej badaniami zbiorowości statystycznej
– Badanie pełne i częściowe
Statystyka - pojęcia
• Etapy badań statystycznych
– Obserwacja statystyczna
• zbieranie materiału empirycznego tak, aby moŜliwe
było uchwycenie stanu populacji w określonym
momencie lub zmian zachodzących w czasie
– Opis
• kontrola zebranego materiału, jego porządkowanie,
klasyfikację, określenie wartości róŜnych mierników.
Rezultatem są tablice, wykresy i charakterystyki
liczbowe
– Analiza
• wykrywanie prawidłowości w badanych zjawiskach,
ich interpretacja i formułowanie wniosków
Statystyka - pojęcia
• Zbiorowość statystyczna
– zbiór elementów (obserwacji, przedmiotów,
obiektów, …) podobnych do siebie pod
względem określonych cech
– zbiór jednostek nieidentycznych, powiązanych
ze sobą logicznie
Statystyka - pojęcia
• Zbiorowość statystyczna
– zbiór elementów (obserwacji, przedmiotów,
obiektów, …) podobnych do siebie pod
względem określonych cech
– zbiór jednostek nieidentycznych, powiązanych
ze sobą logicznie
• Populacja generalna (populacja)
– Zbiorowość statystyczna podlegająca badaniu
statystycznemu
– Populacja skończona i nieskończona
Statystyka - pojęcia
• Jednostka statystyczna
– element zbiorowości statystycznej (populacji);
źródło cech
Statystyka - pojęcia
• Cecha
– własność (charakterystyka) jednostek
statystycznych będąca podstawą ich
róŜnicowania
– przedmiot badań
Statystyka - pojęcia
• Cecha
– własność (charakterystyka) jednostek
statystycznych będąca podstawą ich
róŜnicowania
– przedmiot badań
• Rodzaje cech
Statystyka - pojęcia
• Cechy mierzalne (ilościowe): moŜliwe do
opisania za pomocą liczb
– ciągłe: przyjmujące dowolne wartości w
danym przedziale
– skokowe: przyjmująca określone wartości w
danym przedziale,
• Cechy niemierzalne (jakościowe): moŜna
je jedynie opisać słownie lub za pomocą
odpowiednich skal
Statystyka - pojęcia
• Skale pomiarowe
– sposób wyraŜenia danej cechy
– uzaleŜnione są od rodzaju opisywanych
zmiennych
– determinują, co moŜna zrobić z daną cechą /
zmienną
Statystyka - pojęcia
• Skale pomiarowe
– Zmienne jakościowe
• Skala nominalna
• Skala porządkowa (rangowa)
– Zmienne ilościowe
• Skala przedziałowe (interwałowa)
• Skala ilorazowa (stosunkowa)
Skala nominalna
• Pozwala rozpoznawać obiekty jednakowe i
róŜne, bez wypowiadania się o relacjach między
nimi, np. gatunek drzewa, rodzaj drewna, rębnia,
płeć, itp.
• Często pomiar na skali nominalnej jest
liczbowym etykietowaniem badanych obiektów,
np. kody w niektórych bazach danych
• Bardzo słaba skala pomiarowa
• Graficzna prezentacja, dominanta
Skala porządkowa
• Dodatkowo wprowadza relację porządku w
zbiorze zmiennych jakościowych, np. siedlisko
suche, świeŜe, wilgotne, bagienne; drewno
suche, wilgotne; uszkodzenie słabe, średnie,
silne; ...
• Jest skalą mocniejszą niŜ nominalna
• Powoduje najwięcej problemów i nieporozumień,
przedmiot powszechnie popełnianych błędów
Skala porządkowa
• Przykład: skala ocen (ndst, dst, db, bdb)
• Wszelkiego rodzaju obliczenia są tutaj
naduŜyciem: nieznana jest odległość między
poszczególnymi ocenami (róŜnica w między
róŜnymi stopniami jest róŜna; często mieszane
kategorie)
• MoŜliwe jest jedynie określenie, Ŝe np. silny
stopień uszkodzenia jest mocniejszy, niŜ słaby
Skala przedziałowa
• Zachowuje własności skali porządkowej, ale
dodatkowo wyposaŜona jest w stałą jednostkę
miary i umowne zero
• MoŜliwy jest pomiar odległości między
uporządkowanymi zmiennymi
• Jest skalą mocniejszą od porządkowej
Skala przedziałowa
• Przykład: skala Celsjusza dla temperatury
• MoŜliwe jest określenie o ile stopni dana
temperatura róŜni się od innej
• Ale nie moŜna opisać sensownie stosunku
dwóch wartości zmiennych
• Np. średnia temperatura lipca w centralnej
Polsce (17C) róŜni się od średniej rocznej
temperatury tego obszaru (7C) o 10 stopni, ale
nie oznacza to, Ŝe w lipcu jest prawie 2,5 raza
cieplej, niŜ średnio w roku
Skala ilorazowa
• róŜni się od skali przedziałowej tym, Ŝe jest
posiada zero absolutne, a nie umowne
• MoŜliwe jest określenie ile razy dana cecha jest
większa od innej
• Jest to najsilniejsza skala pomiarowa
Skala ilorazowa
• Przykład: skala Kelwina
• Gleba o temperaturze 50C (323K) jest 1.1 raza
(czyli o 10%) cieplejsza od gleby o temperaturze
20C (293K)
• Przykład: liczba kandydatów na studia
• Na WTD (100) było 3 razy mniej kandydatów na
studia, niŜ na WL (300); zerem absolutnym jest
tu brak kandydatów na dany kierunek studiów,
na WL startowało 3x więcej kandydatów, niŜ na
WTD
Statystyka opisowa
Statystyka opisowa
•
•
•
•
Graficzna prezentacja danych
Szeregi rozdzielcze
Sumy i ich własności
Miary statystyczne (miary połoŜenia,
zmienności i asymetrii)
• Jednostki standardowe
Graficzna prezentacja danych
Graficzna prezentacja danych
• WaŜny element wstępnej analizy danych
• Nieodzowna ilustracja problemu i
uzyskanych wyników
• Wielobok liczebności, histogram, szereg
skumulowany, …
– Dobór rodzaju wykresu, skali i szerokości klas
polygon
100
frequency
80
60
40
20
0
0
3
6
9
dk
12
15
18
Histogram for dk
100
frequency
80
60
40
20
0
0
3
6
9
dk
12
15
18
cumulative polygon
250
frequency
200
150
100
50
0
0
3
6
9
dk
12
15
18
cumulative histogram
250
frequency
200
150
100
50
0
0
3
6
9
dk
12
15
18
http://onlinestatbook.com/stat_si
m/histogram/index.html
Szereg rozdzielczy
• Statystyczny sposób prezentacji rozkładu
empirycznego.
• Uporządkowany materiał statystyczny w
przedziałach klasowych utworzonych wg
wartości badanej cechy
Szereg rozdzielczy
• Uzyskuje się go dzieląc dane statystyczne
na pewne kategorie i podając liczebność
(częstość) zbiorów danych
przypadających na kaŜdą z tych kategorii
• Szereg moŜe być:
– strukturalny (cecha jakościowa)
– punktowy (cecha ilościowa, skokowa)
– przedziałowy (cecha ilościowa, ciągła)
Szereg rozdzielczy
xi
4
6
8
10
12
14
16
Σ
ni
23
82
73
45
24
2
1
250
Σni
23
105
178
223
247
249
250
pi
0,092
0,328
0,292
0,180
0,096
0,008
0,004
1,000
Σpi
0,092
0,420
0,712
0,892
0,988
0,996
1,000
Dziękuję za uwagę!