Statystyka procesów transportowych

Transkrypt

Statystyka procesów transportowych
Janusz Woch
Instytut Transportu Politechniki Śląskiej w Katowicach
Statystyka procesów transportowych
Katowice maj 2000
2
Wstęp
SPIS TREŚCI
2
WSTĘP
4
1. Zakres Statystyki Procesów Transportowych
13
1.1 Założenia ogólne przedmiotu zintegrowanego
13
1.2 Potoki ruchu transportowego
15
1.3 Jak badać pojedynczy potok ruchu
17
1.4 Intuicyjne pojęcie prawdopodobieństwa
19
1.5 Model przejścia dla pieszych jednego pasa ruchu (jednokierunkowego) jako
schemat Bernoulli’ego
22
1.6 Wartość oczekiwana i wariancja
24
1.7 Wartość średnia i odchylenie kwadratowe
25
Problemy rozdziału 1
26
2. Inne rozkłady dyskretne
29
2.1 Rozkład dwumianowy – kontynuacja
29
2.2 Rozkład Poissona
30
2.3 Wartość oczekiwana i wariancja w rozkładzie Poissona są równe λ
33
Problemy rozdziału 2
37
3. Znaczenie rozkładu Poissona i ciągłe zmienne losowe
39
3.1 Związki między rozkładem dwumianowym oraz Poissona
39
3.2 Rozkład geometryczny
42
3.3 Ciągłe zmienne losowe
43
3.4 Rozkład jednostajny
46
3.5 Rozkład jednopunktowy
48
Problemy rozdziału 3
49
4. Znaczenie rozkładu wykładniczego
51
4.1 Rozkład wykładniczy
51
4.2 Przesunięty rozkład wykładniczy
55
Problemy rozdziału 4
60
5. Kardynalna zasada badań statystycznych
61
5.1 Dwie różnice między organizacją i regulacją ruchu samochodowego w miastach
a ruchu kolejowego
61
5.2 Rozkład Erlanga rzędu n
66
5.3 Rozkład gamma
67
3
Wstęp
5.4 Przykłady stawiania hipotez statystycznych na podstawie wyników obserwacji
potoków ruchu samochodowego
68
Problemy rozdziału 5
71
6. Różnice między obserwacjami statystycznymi ruchu kolejowego a samochodowego
73
6.1 Obserwacje odstępów między kolejnymi wjazdami na stację rozrządową
73
6.2 Rozkład normalny
77
Problemy rozdziału 6
81
7. Modele luki krytycznej i akceptowalnej
83
7.1 Przypomnienie o różnicach w obrazie statystycznym ruchu samochodowego
a kolejowego
83
7.2 Rząd rozkładu Erlanga jako wskaźnik równomierności potoku ruchu
88
7.3 Związek między rozkładem Poissona a wykładniczym oraz Erlanga
89
7.4 Rozkład luki krytycznej
90
7.5 Inne modele wyboru luki dopuszczalnej
92
Problemy rozdziału 7
94
8. Weryfikacja hipotez statystycznych – dwa rodzaje testów statystycznych
parametryczne i zgodności
95
8.1 Rodzaje testów oraz etapy badań statystycznych
95
8.2 Testy parametryczne
102
Problemy rozdziału 8
112
9. Testy zgodności
113
9.1 Różne sytuacje praktyczne
113
9.2 Test λ Kołmogorowa
114
9.3 Test Kołmogorowa-Smirnowa
121
Problemy rozdziału 9
127
10. Korelacja
129
10.1 Wartość oczekiwana funkcji zmiennej losowej wielowymiarowej
Momenty zmiennej losowej wielowymiarowej
129
10.2 Współczynnik korelacji
132
Problemy rozdziału 10
138
11. Regresja
139
11.1 Regresja pierwszego rodzaju
139
11.2 Regresja drugiego rodzaju
144
Wstęp
4
Problemy rozdziału 11
148
12. Wartość przedsiębiorstwa i papiery wartościowe
149
12.1 Wartość przedsiębiorstwa
149
12.2 Papiery wartościowe i ich ceny
153
12.3 Ryzyko a stopa zysku
157
Problemy rozdziału 12
163
13. Jak grać na giełdzie?
165
13.1 Portfel papierów wartościowych
165
13.2 Zbiór efektywnych portfeli
172
13.3 Wycena aktywów na giełdzie
176
Problemy rozdziału 13
182
Literatura
183
Tablice statystyczne
189-200
Wstęp
5
WSTĘP
Statystyka procesów transportowych jest nową pozycją literaturową w zakresie
modelowania matematycznego procesów transportowych w czasach powszechności dostępu
do techniki komputerowej w obliczeniach statystycznych. Możliwości dzisiejszych
komputerów są podwajane co półtora roku, dając nową generację komputerową, o nowej
jakości zastosowań informatyki. Można więc zaplanować proces dydaktyczny w zakresie
elementarnej statystyki matematycznej, nie martwiąc się niskim poziomem wiedzy o
statystyce matematycznej, zakładając wykorzystanie bogatego oprogramowania komputerów.
Studenci kierunków transportowych powinni przyswoić sobie techniczne możliwości
oprogramowania statystycznego bez znajomości głębokich podstaw matematycznych. Jest to
niezwykle odpowiedzialne zadanie, bowiem nie powinno się dopuszczać do wykorzystywania
oprogramowania statystycznego komputerów bez żadnych podstaw matematycznych,
ponieważ grozi to brakiem umiejętności rozumienia istoty badań procesów transportowych,
jakie odbywają się w różnych okolicznościach działalności systemów transportowych, a więc
grozi opacznymi wnioskami analizy systemów transportowych. W ten sposób dochodzi się do
problemu określenia minimum wiedzy inżyniera transportu o elementarnej statystyce. Zakres
tej książki jest próbą nowego określenia tego minimum w czasach powszechnego dostępu do
oprogramowania statystycznego komputerów.
Związki statystyki z matematyką są wyjątkowe. Według powszechnego przekonania
wnioskowanie matematyczne jest wnioskowaniem dedukcyjnym, a więc od ogółu do
szczegółu, natomiast istotą wnioskowania statystycznego jest wnioskowanie indukcyjne, od
szczegółu do ogółu. Wnioskowanie statystyczne jako takie jest bardziej naturalnym procesem
myślowym niż dedukcja, co pozwala na łatwe przyswojenie procedur wnioskowania
statystycznego, bez głębokich podstaw matematycznych, jak to się zwykle uważa. To jest
podstawowa przesłanka tego przedmiotu, oparta również na obserwacjach
powszechnej
akceptacji komputerów, jako narzędzia rozrywki. Te przesłanki pozwoliły na wprowadzenie
tego przedmiotu w roku 1993/94 w Instytucie Transportu Politechniki Śląskiej w Katowicach
do programu kształcenia kierunku TRANSPORT wraz z odpowiednim laboratorium
komputerowym.
Wstęp
6
Oprócz prawie całkowitego potwierdzenia słuszności powyższych założeń w
ośmioletniej praktyce, dały się również zaobserwować pewne niewłaściwe elementy w
procesie dydaktycznym. Na przykład, stwierdzono, że powszechność komputerów i
kalkulatorów wśród uczniów szkół przygotowujących naszych studentów daje również
ujemny efekt: braku jakichkolwiek doświadczeń obliczeniowych bez wspomagania
technicznego, co powoduje całkowitą bezradność studentów w sytuacjach konieczności
przeprowadzania obliczeń bez wspomagania technicznego oraz zupełny brak wyobraźni
obliczeniowej, pozwalającej na krytyczną ocenę wyników obliczeń statystycznych. Dlatego
podczas wszystkich wykładów podane są elementarne obliczenia statystyczne trochę to
spowalnia wykład, jednak z drugiej strony, pozwala na kształcenie wyobraźni obliczeniowej
studentów, co dzisiaj w dobie powszechnego dostępu do komputerów jest niezbędne. Uwaga,
jaką student poświęci na zdobycie wyobraźni obliczeniowej podczas badania procesów
transportowych, daje później właściwy efekt kształcenia w zakresie statystyki oraz
informatyki, jak również pozwala wprowadzić elementarną wiedzę w zakresie badań
przepustowości sieci transportowych. Tak dzisiaj wygląda słuszna idea przedmiotów
zintegrowanych, łączących treści z wielu dziedzin, dzięki wykorzystaniu współczesnych
narzędzi informatycznych.
W rozdziale 1 przedstawione zostały założenia ogólne przedmiotu zintegrowanego
statystyka procesów transportowych oraz podstawowe pojęcia opisujące potoki ruchu
transportowego, jak również podstawowe sposoby badania pojedynczego potoku ruchu.
W drugiej części przypomina się intuicyjne pojęcie prawdopodobieństwa oraz przedstawia
model przejścia dla pieszych jako schemat Bernoullie’go, gdzie przypomina się pojęcia
histogramu i dystrybuanty rozkładu prawdopodobieństwa od strony graficznej, jako
podstawowe charakterystyki probabilistyczne. Następnie zdefiniowane są
pojęcia wartości
oczekiwanej i wariancji oraz ich statystycznych odpowiedników: wartości średniej i
odchylenia kwadratowego.
W rozdziale 2 przedstawiono kontynuację rozważań dwumianowego rozkładu
prawdopodobieństwa na przykładach modeli zapotrzebowania na energię. Następnie
wprowadzono pojęcie rozkładu Poissona, jako granicy rozkładów dwumianowych, przy
pewnych mocnych założeniach pozwalających na taką aproksymację. Przykład modelu
niezawodności elementów jest ilustracją zastosowań rozkładu Poissona.
Z faktu, że wartość oczekiwana i wariancja są sobie równe, można zbudować metodę
statystycznego testowania hipotezy o rozkładzie Poissona. Na przykładzie badań liczby
7
Wstęp
pojazdów skręcających w prawo na skrzyżowaniu ulic ilustruje się takie badanie statystyczne.
Narysowany jest histogram oraz przedstawiona tablica obliczeń statystycznych ułatwiająca
obliczenia statystyczne. Podano również szereg rozdzielczy opisujący liczby zgłoszeń w
poszczególnych minutach do centrali telefonicznej, ze sformułowaniem hipotezy o rozkładzie
Poissona tych obserwacji.
W rozdziale 3 kontynuowane są badania związków między rozkładem dwumianowym
oraz Poissona. Okazuje się, że rozkład Poissona jest najbardziej losowym zjawiskiem.
Natomiast, gdy stałe traktuje się jako skrajny przypadek zmiennych losowych, to rozkład ten
jest modelowym wyrazem zjawiska najmniej losowego. Tak więc, wskaźnikiem tak
rozumianej „losowości” jest wartość wariancji zmiennej losowej, co pozwala na
usystematyzowanie rozkładów prawdopodobieństwa. Wprowadzono rozkład geometryczny i
ujemny dwumianowy. W drugiej części wprowadzono pojęcie ciągłych zmiennych losowych
na przykładzie wykresu ruchu, będącego podstawowym pojęciem teorii potoków ruchu, po
zdefiniowaniu wartości oczekiwanej i wariancji ciągłych zmiennych losowych opisanych
dystrybuantami
oraz
funkcjami
gęstości
rozkładu
prawdopodobieństwa.
Następnie
wprowadzono pojęcie rozkładu jednostajnego oraz jednopunktowego, jako skrajnego
przypadku rozkładu jednostajnego. Stałe odstępy między pociągami i samochodami są
rozkładem jednopunktowym (o zerowej wariancji).
W rozdziale 4 wprowadzone zostało pojęcie rozkładu wykładniczego, ilustrowanego
modelem centrali telefonicznej, modelem niezawodności urządzeń oraz przykładem losowych
czasów czekania na tramwaj. W dalszej treści wprowadzono pojęcie przesuniętego rozkładu
wykładniczego, jako dobrego modelu odstępu czasu między pojazdami w potokach ruchu
transportowego, z uwagi na tendencję do zachowania bezpiecznego odstępu. Na przykładzie z
inżynierii ruchu kolejowego ilustrowana jest struktura odstępu czasu między pociągami na
torze szlakowym. Przedstawione są wyniki wielu badań statystycznych w inżynierii ruchu
kolejowego, które pozwalają na znaczne uproszczenie badań statystycznych ruchu
kolejowego.
W rozdziale 5 przedstawiono dwie różnice między organizacją i regulacją ruchu
samochodowego a ruchu kolejowego. Ruch samochodowy jest ruchem samoorganizującym
się oraz samoregulującym się, natomiast ruch kolejowy jest organizowany oraz regulowany.
W ruchu kolejowym straty czasu podczas regulacji ruchu przenoszone są w inne odległe od
kolizji miejsce. Wprowadzono pojęcie dobrego histogramu, bez pustych klas, jako
podstawowego narzędzia badań statystycznych. Zwrócono uwagę na psychologiczne
8
Wstęp
uwarunkowania statystyka. Zdefiniowano rozkład Erlanga rzędu n, który okazuje się
rozkładem sumy n niezależnych zmiennych losowych o tym samym rozkładzie
wykładniczym.
Traktując
parametr
n
jako
wskaźnik
losowości
dochodzimy
do
paradoksu,bowiem suma wielu (bardzo) losowych zmiennych daje rozkład jednopunktowy (a
więc stałą o wariancji zero). Wprowadzono pojęcie rozkładu Γ , który jest rozszerzeniem
rozkładu
Erlanga.
Zdefiniowano
podstawowe
pojęcia
do
badań
potoku
ruchu
samochodowego: odstęp, luka oraz odstęp resztowy. Następnie przedstawiono przykłady
badań statystycznych odstępów w potoku głównym zakończonych postawieniem hipotezy.
Wprowadzono kardynalną zasadę badań statystycznych: każde badanie powinno być
przeprowadzone w dwóch etapach – stawianie hipotezy oraz testowanie. Każdy z tych etapów
powinien być przeprowadzony na niezależnych próbkach. Przedyskutowano analizowane
przykłady statystyczne z teorii potoków ruchu.
W rozdziale 6 wprowadzono modelowe ujęcie procesu technologicznego stacji
rozrządowej. Badania statystyczne J. Węgierskiego w latach 60. i doskonalenie modelu
symulacyjnego stacji rozrządowych J. Wocha w latach 70. i 80, pozwoliły sformułować
ogólne wnioski o modelach statystycznych ruchu kolejowego, które podano w rozdziale 6.
Zdefiniowano rozkład normalny oraz zilustrowano tak zwane prawo 3 σ . Przedstawiono
przykłady badań statystycznych procesu technologicznego stacji rozrządowej: czasu
przygotowania składu do rozrządzania oraz czasu rozrządzania stawiając hipotezy o
rozkładzie normalnym badanych operacji ruchowych. Przykłady pozwalają na komentarze i
dyskusję uzyskanych hipotez statystycznych.
W rozdziale 7 stwierdzono, że największe różnice w obrazie statystycznym ruchu
samochodowego i kolejowego powstają w miejscach tworzenia się kolejek, gdzie są
zsumowane wpływy dużej liczby opóźnień. Dla rzadkiego potoku ruchu dobrym modelem jest
przesunięty rozkład wykładniczy. Natomiast dla gęstego potoku ruchu dobrym modelem
statystycznym jest przesunięty rozkład Erlanga. Dla potoku pieszych wchodzących do sklepu
jest przesunięty rozkład wykładniczy. W dalszym ciągu przedstawiono związki drogowoczasowe na drodze ekspresowej podczas manewru włączania się do ruchu. Zdefiniowano
podstawowe pojęcia teorii potoków ruchu oraz statystykę akceptowalnych i odrzuconych luk
na odcinku przyśpieszeń. Zdefiniowano pojęcie luki krytycznej, a następnie obliczono luki
krytyczne dla pojazdów zatrzymanych, w ruchu oraz dla wszystkich pojazdów. Zdefiniowano
różne wskaźniki równomierności potoku ruchu: rząd rozkładu Erlanga odstępu oraz iloraz
minimalnego odstępu do średniego odstępu. W dalszym ciągu przedstawiono graficzną
9
Wstęp
ilustrację związków między rozkładami Poissona a wykładniczym i Erlanga na przykładzie
procesu Poissona. W potokach ruchu transportowego występuje tendencja do utrzymywania
bezpiecznych odstępów, co przy dużym ruchu jest tendencją do wyrównywania odstępów, a z
drugiej strony wyjaśnia, dlaczego potoki ruchu nie są strumieniami Poissona. W dalszym
ciągu zdefiniowane zostały cztery modele probabilistyczne luki krytycznej, a następnie
zdefiniowano cztery modele luki dopuszczalnej, które pozwalają na wyjaśnienie różnych idei
modelowania skrzyżowań uprzywilejowanych.
Rozdział 8 zawiera wprowadzenie narzędzi statystycznych: testów parametrycznych i
zgodności. Na wstępie przypomina się Czytelnikowi o niebezpieczeństwach manipulacji
statystycznych, które także zdarzają się w nauce. Z tych względów statystyka ma również złą
sławę i zawsze z dużą ostrożnością powinno się podchodzić do niejasnych źródeł badań
statystycznych. Zdefiniowano pojęcie hipotezy parametrycznej oraz hipotezy rozkładowej,
wprowadzono pojęcie hipotezy zerowej oraz alternatywnej. Przedstawiono przykład
testowania nowego materiału w produkcji, przy założeniu rozkładu normalnego mierzonych
różnic obserwacji o znanej wariancji. Zdefiniowano zbiór krytyczny testu oraz poziom
istotności testu. W dalszym ciągu przedstawione są testy parametryczne. Przedstawiono
weryfikację hipotezy o wartości oczekiwanej przy znanej wariancji oraz nieznanej wariancji.
Następnie zweryfikowano hipotezę o wariancji w rozkładzie normalnym oraz hipotezy o
równości wartości oczekiwanych o rozkładach normalnych z jednakową nieznaną wariancją,
jak również zweryfikowano hipotezę o wartości oczekiwanej na podstawie próbek o dużej
liczebności.
W rozdziale 9 jeszcze raz apeluje się o „przeźroczystość” testów statystycznych,
pozwalającą na łatwą kontrolę obliczeń statystycznych. Następnie wprowadzono trzy testy
zgodności: test χ 2 Pearsona, test λ
Kołmogorowa oraz test Kołmogorowa-Smirnowa do
porównywania dwóch próbek tej samej populacji. Omówiono przykład badania trwałości
opon z dwóch fabryk.
W rozdziale 10 poświęconym korelacji wprowadzono pojęcia wartości oczekiwanej
funkcji
zmiennej
losowej
wielowymiarowej
oraz
momenty
zmiennej
losowej
wielowymiarowej, jak również pojęcie kowariancji dwóch zmiennych. Wprowadzono
następnie pojęcie współczynnika korelacji, służącego zaprzeczaniu tezie o niezależności
dwóch zmiennych losowych oraz stwierdzaniu zależności liniowej dwóch zmiennych
10
Wstęp
losowych. Przedstawiono dwa przykłady obliczeń współczynnika korelacji dwóch zmiennych
losowych o znanym rozkładzie dwuwymiarowym.
W rozdziale 11 poświęconym regresji zdefiniowano regresję pierwszego rodzaju oraz
przeprowadzono dyskusję rożnych sposobów funkcyjnego opisu zależności dwóch
zmiennych,
na
podstawie
dwuwymiarowych
obserwacji
statystycznych.
Następnie
wprowadzono pojęcie regresji drugiego rodzaju, jako prostej najlepiej przybliżającej
dwuwymiarowe obserwacje statystyczne. Przedstawiono przykład obliczeń linii regresji
pierwszego oraz drugiego rodzaju dla zadanej dwuwymiarowej zmiennej losowej o danym
dwuwymiarowym rozkładzie prawdopodobieństwa.
W rozdziale 12 wprowadzono pojęcia wartości przedsiębiorstwa oraz papierów
wartościowych. Z oceną wartości przedsiębiorstwa wiąże się wiele emocji oraz
nieporozumień w naszym już ponad dziesięcioletnim okresie przekształcania gospodarki.
Wprowadzono trzy różne pojęcia wartości przedsiębiorstwa: księgowej, odtworzeniowej oraz
likwidacyjnej. Zrozumienie znaczenia papierów wartościowych pozwala nam zrozumieć
działająca od 1991 roku giełda warszawska. Obliczenie wartości rynkowej obligacji nie jest
zbyt złożonym zagadnieniem matematycznym, jednak dopiero uczymy się takich analiz w
teorii, jak i w praktyce. W dalszym ciągu przedstawia się analizę ryzyka i stopy zysku dla
prezentacji tych pojęć na historycznych przykładach z różnych giełd światowych.
W rozdziale 13 przedstawione zostały statystyczne narzędzia służące grze na giełdzie.
Miarą ryzyka, jaką ekonomiści używają, jest wariancja lub jej pierwiastek kwadratowy –
dyspersja, której statystycznym odpowiednikiem jest odchylenie standardowe. Im wyższe
ryzyko tkwiące w walorze, tym większym oczekiwanym zyskiem powinno być wynagrodzone
w przyszłości. Gdy stosujemy łączenie walorów skorelowanych ujemnie, można zmniejszyć
oczekiwane ryzyko. Jest to podstawowy wniosek z analizy statystycznej, który dotychczas był
intuicyjnie stosowany przez rolników łączących ujemnie skorelowane uprawy. Oczywiście
rolnicy nie mieli takich różnorodnych możliwości, jak gracze giełdowi. Następnie
zdefiniowano zbiór efektywnych portfeli oraz przeanalizowano wycenę na giełdzie
warszawskiej w roku 1992, co jest wyjątkową wartością historyczną i humorystyczną.
Zdefiniowano współczynniki β
charakteryzujące ryzyko papieru w danym portfelu
rynkowym.
Autor ma nadzieję, że niniejsza publikacja znajdzie czytelników wśród studentów
politechnik, w szczególności kierunków transportowych. Uwagi Czytelników są niezwykle
Wstęp
11
cenne dla doskonalenia następnych publikacji, dlatego autor będzie niezmiernie wdzięczny za
uwagi przesłane pod adresem e-mail: [email protected].
http://www.SystemyTransportowe.pl
http://www.polsl.pl