wykładu

Transkrypt

wykładu
Ekonometria dla Finansów i Rachunkowości
Dr Adam Kucharski
Spis treści
1 Optymalizacja liniowa
1.1 Programowanie liniowe . . . . . . . . . . .
1.2 Metoda graficzna . . . . . . . . . . . . . .
1.3 Algorytm simplex . . . . . . . . . . . . . .
1.4 Wyceny dualne . . . . . . . . . . . . . . .
1.5 Zadanie transportowe . . . . . . . . . . .
1.6 Wybrane modyfikacje klasycznego zadania
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
transportowego
2 Modele opisowe
2.1 Pojęcia podstawowe . . . . . . . . . . . . . . .
2.2 Równanie stochastyczne a deterministyczne . .
2.3 Metoda Najmniejszych Kwadratów . . . . . . .
2.4 Model regresji liniowej . . . . . . . . . . . . . .
2.5 Statystyczna weryfikacja jakości modelu . . . .
2.6 Autokorelacja składnika losowego . . . . . . . .
2.7 Weryfikacja merytoryczna . . . . . . . . . . . .
2.8 Zmienne zero-jedynkowe . . . . . . . . . . . . .
2.9 Modele ekonometryczne a prognozowanie . . .
2.10 Modele trendu . . . . . . . . . . . . . . . . . .
2.11 Przykład estymacji modelu jednorównaniowego
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
6
11
12
18
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
19
20
21
22
24
26
28
29
31
31
33
Ekonometria dla FiR
1
Opracował: dr Adam Kucharski
Optymalizacja liniowa
1.1
Programowanie liniowe
Problem decyzyjny istnieje wtedy kiedy zachodzą następujące okoliczności:
1. Pojawia się decydent (osoba lub grupa osób), który musi rozwiązać problem;
2. Decydent chce osiągnąć pewien cel;
3. Istnieją co najmniej dwa sposoby na osiągnięcie zakładanego celu;
4. Istnieje otoczenie, które wpływa na sposób rozwiązania problemu lub jego wynik.
Proces podejmowania decyzji może zostać wsparty przez odpowiednio skonstruowane modele
matematyczne zwane też modelami decyzyjnymi. Normalna jest tutaj sytuacja, w której należy
dokonać wyboru pomiędzy wieloma możliwymi decyzjami, zwanymi decyzjami dopuszczalnymi. Dają one decydentowi szansę na spełnienie ograniczeń jakie często narzuca na przykład
otoczenie. Przydatny staje się zestaw narzędzi pozwalający podjąć najlepszą z decyzji.
Ostatnie zdanie oznacza, że decydent posługuje się pewnym kryterium, które pozwala mu odróżnić lepsze decyzje od gorszych. Na zbiorze decyzji dopuszczalnych określana jest tzw. funkcja
kryterium (funkcja celu), dla której poszukuje się wartości największej lub najmniejszej. Zmienne
zawierające w sobie konkretne decyzje nazywać będziemy zmiennymi decyzyjnymi.
Programowanie liniowe (PL) zalicza się do znacznie szerszej grupy metod programowania
matematycznego. Metody na nim bazujące są bardzo popularne ze względu na swoją prostotę
oraz dlatego, że spora część innych modeli decyzyjnych da się przekształcić do postaci zadania
PL. Charakteryzuje się ono tym, że zarówno funkcja celu oraz zbiór decyzji dopuszczalnych
opisany przy pomocy równań i nierówności mają postać liniową. Ogólna postać takiego zadania
jest następująca:
f (x) = c1 x1 + c2 x2 + . . . + cn xn → max / min

a11 x1




..


.

ak1 x1


..


.



am1 x1
+
+
+
a12 x2
..
.
ak2 x2
..
.
+ ... +
+ ... +
+ ... +
a1n xn
..
.
6
..
.
b1
..
.
akn xn
..
.
=
..
.
bk
..
.
funkcja celu
ograniczenia
+
+ ... +
+ am2 x2 + . . . + amn xn > bm
x1 > 0, x2 > 0, . . . , xn > 0
warunki brzegowe
Zmienne xj (j = 1, 2, . . . , n) są to właśnie zmienne decyzyjne. Dla uproszczenia zakładać
będziemy, że wszystkie prawe strony ograniczeń są nieujemne (czyli bj > 0 dla j = 1, 2, . . . , m).
Wypadkowa ograniczeń i warunków brzegowych tworzy zbiór rozwiązań dopuszczalnych.
Poszukiwanie rozwiązania wiąże się z następującymi twierdzeniami:
Twierdzenie 1.1 Zbiór rozwiązań dopuszczalnych zadania PL zbiorem domkniętym, wypukłym,
o skończonej liczbie wierzchołków.
Twierdzenie 1.2 Funkcja liniowa f (x) określona na domkniętym zbiorze wypukłym X, o skończonej liczbie wierzchołków osiąga swoją wartość największą (najmniejszą) w wierzchołku tego
zbioru. Jeżeli wartość taką osiąga w więcej niż jednym wierzchołku, to osiąga ją również w każdym punkcie będącym wypukłą kombinacją takich wierzchołków.
2 z 37
Ekonometria dla FiR
1.2
Opracował: dr Adam Kucharski
Metoda graficzna
Jeżeli problem da się opisać przy pomocy tylko dwóch zmiennych decyzyjnych (x1 , x2 ) wówczas
da się go rozwiązać graficznie. Metoda graficzna ma właściwie walory wyłącznie dydaktyczne,
ponieważ dobrze ilustruje sposób poszukiwania rozwiązania optymalnego na zbiorze rozwiązań
dopuszczalnych. Zbiór ten wyznacza się w prostokątnym układzie współrzędnych (ograniczonym
do pierwszej ćwiartki ze względu na warunki brzegowe) wyznaczając część wspólną nierówności i
równań tworzących ograniczenia zadania. W przypadku kiedy ograniczenia podane są wyłącznie
jako nierówności, zbiór rozwiązań dopuszczalnych jest wielobokiem wypukłym.
Poszukiwanie optymalnego rozwiązania można przeprowadzić na dwa sposoby:
1. Wyznaczyć współrzędne wszystkich wierzchołków zbioru i podstawić je do funkcji celu;
2. Wyznaczyć rozwiązanie w oparciu o gradient funkcji celu.
Pierwsze z podejść przestaje być wygodne gdy liczba wierzchołków zbioru rozwiązań dopuszczalnych jest duża. Dlatego omówiony zostanie drugi sposób.
Gradientem funkcji celu jest wektor zawierający pochodne f (x) względem zmiennych decyzyjnych. Tworzą go więc współczynniki funkcji celu. Gradient pokazuje kierunek najszybszego
wzrostu wartości f (x) niezależny od wartości zmiennych decyzyjnych. Jeżeli współrzędne gradientu są zbyt małe lub zbyt duże, aby wygodnie umieścić go na rysunku, można pomnożyć
gradient przez odpowiednio dobraną stałą.
Gradient nanosi się na wykres, zaczepiając go w początku układu współrzędnych. Następnie
wykreśla się prostą prostopadłą do gradientu (tzw. warstwicę) tak, aby przechodziła przez zbiór
X. Poszukując wartości największej f (x) przesuwamy warstwicę równolegle w kierunku jaki pokazuje gradient (czyli oddalając się od początku układu współrzędnych) tak długo dopóki nie
dotrzemy do ostatniego punktu (wierzchołka) przed opuszczenie zbioru X. Jest to właśnie punkt
optymalny. Poszukując wartości najmniejszej postępuje się podobnie, z tą różnicą, że warstwicę
przesuwamy w kierunku przeciwnym.
Przykład zastosowania metody graficznej1
Mały zakład wytwarza dwa produkty A i B, których ceny zbytu wynoszą odpowiednio 3
zł/szt. oraz 4 zł/szt. Należy opracować dzienny plan produkcji zakładu tak, aby wartość produkcji liczona w cenach zbytu była możliwie największa. Produkcja jest limitowana głównie
przez dwa czynniki: dostępny czas pracy maszyn i surowiec podstawowy. Dzienny limit czasu
pracy maszyn wynosi 500 minut. Umowy z producentem surowca podstawowego wskazują, że
każdego dnia zakład będzie miał do dyspozycji 350 kg tego surowca (bezpieczny poziom). Zakład jest zainteresowany takim programem dziennej produkcji, przy którym osiągał będzie zysk
minimum 600 zł. Sztuka wyrobu A wymaga 1 minuty czasu pracy maszyn, natomiast sztuka
wyrobu B – 2 minut. Na wyprodukowanie sztuki wyrobu A zużywa się 1 kg surowca specjalnego.
Również sztuka wyrobu B wymaga 1 kg tego surowca. Jednostkowy zysk ze sztuki wyrobu A
wynosi 2 zł/szt., a ze sztuki wyrobu B – 1 zł/szt.
Model decyzyjny prezentuje się następująco:
Zmienne decyzyjne:
x1 – dzienna produkcja wyrobu A [szt.]
x2 – dzienna produkcja wyrobu B [szt.]
1
Przykład pochodzi z: D. Miszczyńska, M. Miszczyński „Wybrane metody badań operacyjnych”, Wyższa
Szkoła Ekonomiczno-Humanistyczna w Skierniewicach, Skierniewice 2002.
3 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Funkcja celu (wartość produkcji w cenach zbytu):
w(x1 , x2 ) = w(x) = 3x1 + 4x2 → max
[zł]
Ograniczenia:
maszyny:
x1 + 2x2 6 500
[minuta]
surowiec:
x1 + x2 6 350
[kg]
min. zysk:
2x1 + x2 > 600
[zł]
Warunki brzegowe:
x1 > 0, x2 > 0
[szt.]
Rysunek 1 prezentuje zbiór rozwiązań dopuszczalnych.
x2
600 zysk
500
400
surowiec
300
200
100
maszyny
100
200
300
400
500
600
x1
Rysunek 1: Zbiór rozwiązań dopuszczalnych dla przykładu
Na rysunku 1 zaznaczamy gradient funkcji, którym jest następujący wektor:
3
∇f (x) =
4
Ponieważ nie byłby on zbyt widoczny przy obecnej skali wykresu, jego składowe zostaną pomnożone przez 50. Na rysunku 2 znajduje się ilustracja poszukiwania optymalnego rozwiązania.
Poszukujemy największej wartości funkcji celu, warstwica przesuwana jest zgodnie ze zwrotem
gradientu. Ostatni punkt, w którym przecina zbiór rozwiązań dopuszczalnych znajduje się w
punkcie (250, 100).
Otrzymujemy więc następujące rozwiązanie: należy wyprodukować 250 sztuk wyrobu A i 100
sztuk wyrobu B, zapewni to zysk maksymalny w wysokości: 3*250+4*100=1050 zł.
Powyższe rozwiązanie stanowi konkretny wierzchołek zbioru X. Dlatego nazywamy je pojedynczym, skończonym rozwiązaniem optymalnym. Oprócz niego mogą istnieć inne rodzaje
rozwiązań, które zilustrują następne rysunki.
4 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
x2
600
500
G(300,400)
400
300
rozwiązanie optymalne
200
100
100
200
300
400
500
600
x1
Rysunek 2: Gradient i rozwiązanie przykładu
Zadanie sprzeczne:
Zadanie jest sprzeczne, kiedy nie uda się wyznaczyć części wspólnej ograniczeń, czyli zbioru
rozwiązań dopuszczalnych.
x2
x1
Rysunek 3: Zadanie sprzeczne
Brak skończonego rozwiązania optymalnego:
W sytuacji zaprezentowanej na powyższym rysunku nie jest możliwe znalezienie wartości
największej funkcji celu2 . Zbiór rozwiązań dopuszczalnych nie jest bowiem w żaden sposób
ograniczony w jego górnej części i nie będzie możliwe znalezienie punktu, w którym warstwica
przechodzi przez tez zbiór po raz ostatni.
Więcej niż jedno skończone rozwiązanie optymalne:
W ostatniej z omawianych sytuacji warstwica (dla przypadku maksymalizacji funkcji celu)
pokrywa się z całym bokiem wieloboku utworzonego z ograniczeń zadania. Wartość funkcji celu
w różnych punktach A i B oraz na odcinku między nimi będzie taka sama.
2
Choć wyznaczenie wartości najmniejszej jest oczywiście możliwe.
5 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
x2
G
x1
Rysunek 4: Brak skończonego rozwiązania optymalnego
x2
G
x1
Rysunek 5: Więcej niż jedno skończone rozwiązanie optymalne
1.3
Algorytm simplex
W sytuacji, kiedy liczba zmiennych decyzyjnych jest większa niż 2 lub duża liczba ograniczeń
utrudnia dokładne wyznaczenie zbioru rozwiązań dopuszczalnych, do poszukiwania optymalnej
wartości funkcji celu używa się algorytmu simplex.
Polega on na przebiegającym w określony sposób przeglądaniu rozwiązań bazowych (wierzchołków zbioru X) w celu znalezienia punktu, w którym funkcja celu osiąga wartość największą
lub najmniejszą. Warto tu zwrócić uwagę na to, że metoda nie potrzebuje sprawdzać wszystkich rozwiązań wierzchołkowych. Algorytm wędruje od bieżącego do sąsiedniego wierzchołka, w
którym wartość funkcji celu jest nie gorsza niż w poprzednim rozwiązaniu. Poniżej znalazł się
schemat postępowania w tej metodzie:
Przykład zastosowania algorytmu simplex
Firma produkuje trzy wyroby: A, B i C, które wymagają obróbki na dwóch maszynach M1
i M2. Limity czasu pracy maszyn wynoszą odpowiednio: M1 – 200 godzin, M2 – 150 godzin.
Czas pracy M1 potrzebny do wytworzenia jednej sztuki wyrobu A wynosi 2 minuty, wyrobu B
– 2 minuty, wyrobu C – 3 minuty. Odpowiednio dla maszyny M2 mamy: A – 2 minuty, B i C po
1 minucie. Ceny zbytu za 1 sztukę wyrobu wynoszą: A – 4 zł, B – 3 zł, C – 5 zł. Należy ustalić
6 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
(1) Wybierz początkową bazę układu równań
(2) Wyznacz rozwiązanie bazowe
(6) Dokonaj wymiany
wektorów w bazie
(5) Wybierz wektor
opuszczający bazę
(3) Czy aktualne rozwiązanie jest optymalne?
Tak
Nie
(4) Wybierz wektor
wchodzący do bazy
Stop
Rysunek 6: Schemat postępowania w algorytmie simplex
plan produkcji, który zapewni maksymalny utarg ze sprzedaży wyrobów, przy założeniu, że cała
produkcja zostanie sprzedana.
Model decyzyjny:
x1 – wielkość produkcji wyrobu A [szt.]
x2 – wielkość produkcji wyrobu B [szt.]
x3 – wielkość produkcji wyrobu C [szt.]
Z = 4x1 + 3x2 + 5x3 → max
M1:
2x1 + 2x2 + 3x3 6 12000
[min.]
M2:
2x1 + x2 + x3 6 9000
[min.]
x1 > 0, x2 > 0, x3 > 0
[szt.]
Choć powyższy model jest poprawny pod względem formalnym, to algorytm simplex wymaga, aby układ nierówności tworzących ograniczenia sprowadzić do postaci równań. Robi się to
wg następujących reguł:
• jeżeli k -te ograniczenie jest typu „6” wówczas wprowadzamy do niego dodatnią zmienną
swobodną sk ;
7 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
• jeżeli k -te ograniczenie jest typu „>” wówczas wprowadzamy do niego ujemną zmienną
swobodną sk oraz dodatnią zmienną sztuczną tk ;
• jeżeli k -te ograniczenie jest typu „=” wówczas wprowadzamy do niego dodatnią zmienną
sztuczną tk .
Zmienne swobodne stoją w funkcji celu z parametrem 0. Zmienne sztuczne w funkcji celu
stoją z parametrem −M (gdy funkcja jest maksymalizowana) lub +M (gdy funkcja celu jest minimalizowana), gdzie M jest pewną, bardzo dużą liczbą dodatnią. Model, w którym ograniczenia
z nierówności zamieniono na równania nazywamy postacią kanoniczną. W naszym przykładzie
wygląda ona następująco:
Z = 4x1 + 3x2 + 5x3 + 0s1 + 0s2 → max
2x1 + 2x2 + 3x3 + s1 = 12000
2x1 + x2 + x3 + s2 = 9000
x1 > 0, x2 > 0, x3 > 0, s1 > 0, s2 > 0
Postępowanie w metodzie simplex przeprowadza się w specjalnych tablicach. Pierwszą z nich
tworzymy na podstawie postaci kanonicznej modelu. Kolejne powstają wskutek stosownych przekształceń. Dokonamy teraz przedstawienia całości obliczeń, które zostaną następnie omówione.
Nr
iteracji
4
x1
3
x2
5
x3
0
s1
0
s2
Wartości
zmiennych
bazowych
Ilorazy
wyjścia
1
0
s1
0
s2
∆j = cj − zj
2
2
4
2
1
3
3
1
5
1
0
0
0
1
0
12000
9000
0
4000*
9000
2/
2
5
x3
0
s2
∆j = cj − zj
1
0
0
1/
3
1
− /
3
3
4000
5000
20000
6000
3750*
−4 /
0
1
0
1
0
0
1/
2
−1 /
−1 /2
3/
4
−1 /2
1500
3750
22500
3
cB
Zmienne
bazowe
xB
5
x3
4
x1
∆j = cj − zj
4/
2/
0
1
0
3
2/
3
2/
3
3
3
1
− /
1/
2
1/
4
3
−1 /2
4
−3 /2
(1) Wybór początkowej bazy
Początkową bazą stają się wektory stojące przy zmiennych swobodnych i/lub sztucznych.
Tworzą one macierz jednostkową, której wymiar równy jest liczbie ograniczeń. Tak więc w naszym przykładzie bazę początkową tworzą wektory parametrów stojących przy zmiennych s1 i
s2 w iteracji 1:
1 0
pocz
B
=
0 1
Taką samą postać ma w tej chwili, kluczowa w późniejszych rozważaniach, macierz B −1 .
(2) Wyznaczenie rozwiązania bazowego
Rozwiązanie w pierwszej tablicy simpleksowej tworzą po prostu przepisane prawe strony
ograniczeń. W kolejnych rozwiązaniach jest ono związane z aktualną bazą. Wartość funkcji
8 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
celu tworzy się w oparciu o aktualny wektor cB oraz wektor wartości rozwiązań bazowych.
Prześledźmy proces jej obliczania na podstawie iteracji nr 2:
4000
= 5 ∗ 4000 + 0 ∗ 5000 = 20000
f (xB ) = (cB )T xB = 5 0
5000
(3) Ocena optymalności aktualnego rozwiązania
Sprawdzenia optymalności rozwiązania dokonuje się w oparciu o tzw. wskaźniki optymalności.
Oblicza się je dla wszystkich zmiennych znajdujących się w tablicy simpleksowej, przy czym dla
zmiennych bazowych zawsze równają się one zero. Formuła ich wyznaczania jest następująca:
∆j = cj − zj = cj −
m
X
cB
i pij
i=1
gdzie:
cj – współczynnik w funkcji celu przy j -tej zmiennej, dla której obliczamy wskaźnik optymalności;
cB
i – współczynnik w funkcji celu przy i-tej zmiennej bazowej; pij – odpowiednia kolumna centralnej części tablicy simpleksowej.
Wskaźnik optymalności dla zmiennej x1 w pierwszej iteracji obliczono więc następująco:
∆1 = 4 − (0 ∗ 2 + 0 ∗ 2) = 4
zaś dla zmiennej x3 w drugiej iteracji (gdzie była zmienną bazową):
∆3 = 5 − (5 ∗ 1 + 0 ∗ 0) = 0
Wartość ∆j dla zmiennej niebazowej można traktować jako różnicę między jednostkowym
efektem a jednostkowym nakładem potrzebnym, aby dana zmienna miała zostać zmienną bazową. Na tej podstawie zbudowano kryterium optymalności bieżącego rozwiązania. Rozwiązanie
uznajemy za optymalne gdy:
(
∀
j=1,2,...,n ∆j 6 0, gdy f (x) → max
∀
∆ > 0, gdy f (x) → min
j=1,2,...,n
j
Innymi słowy, rozwiązanie (dla przypadku maksymalizacji funkcji celu) uznajemy za optymalne kiedy wszystkie wskaźniki optymalności są niedodatnie lub nieujemne (dla przypadku
minimalizacji funkcji celu). Jak nietrudno zauważyć, trzecia iteracja jest ostatnią, ponieważ
wszystkie wskaźniki optymalności przyjęły wartości mniejsze lub równe zero
(4) Wybór wektora wchodzącego do bazy
Jeżeli aktualne rozwiązanie bazowe nie spełnia warunku optymalności, konieczna staje się wymiana wektorów bazowych. Najpierw wybierany jest wektor (towarzyszący odpowiedniej zmiennej), który znajdzie się w przyszłej bazie. Jako kryterium służą ponownie wskaźniki optymalności
i ponownie występuje rozdział spowodowany kierunkiem optymalizacji. Do bazy wprowadzamy
k -ty wektor taki, że:
(
min (∆ ), gdy f (x) → max
∆k = ∆j>0
j
max
∆ =
(∆ ), gdy f (x) → min
k
∆j<0
j
Tak więc, jeśli funkcja celu jest maksymalizowana, wybieramy zmienną, dla której wskaźnik
optymalności okazał się najwyższy spośród tych, które przyjęły wartość dodatnią.
W iteracji 1 najwyższą wartość (czyli 5) posiadał wskaźnik optymalności dla zmiennej x3 .
Tym samym, odpowiadająca mu zmienna stanie się zmienną bazową.
9 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
(5) Wybór wektora opuszczającego bazę
Ponieważ bazę tworzy więcej niż jedna zmienna, należy zdecydować, która z nich nie znajdzie
się w nowej bazie. Dla wektora wybranego w poprzednim kroku obliczamy tzw. ilorazy wyjścia.
Należy tu zwrócić uwagę, że sposób ich wyliczania jest niezależny od kierunku kryterium. Z bazy
usuwamy l -ty wektor taki, że:
B
xB
xl
min
l
=
plk
plk > 0 plk
Zauważmy, że ilorazów wyjścia nie liczymy jeśli przyjdzie nam podzielić przez 0 lub ujemną
składową. W przykładzie, dla iteracji pierwszej ilorazy wyjścia dla s1 i s2 oraz kryterium wyjścia
są następujące:
12000 9000
= min(4000, 9000) = 4000
min
,
3
1
Tak więc usuwamy z bazy zmienną s1 wraz z towarzyszącym jej wektorem.
W przypadku uzyskania kilku identycznych minimalnych ilorazów wyjścia, najlepiej jest wybrać ten o największym dzielniku. Jeśli i to nie wystarczy, można wybrać pozycję o niższym i.
(6) Wymiana wektorów w bazie
Wymiany wektorów w bazie dokonuje się przy pomocy tzw. przekształceń elementarnych,
które nie znajdują się w obszarze zainteresowań niniejszych zajęć, dlatego nie zostaną tutaj
omówione.
Wymiana wektorów kończy jedną, pełną iterację w algorytmie simplex. Po zakończeniu postępowania można przejść do interpretacji wyników. Prezentowany przykład zakończył się po
trzech przebiegach, dając następujący wektor optymalnych wartości zmiennych:
 opt  

x1
3570
xopt  
 2   0 

 

opt
x = xopt
 = 1500
3
 , fmax = 22500
 opt  
0 
 s1 
0
sopt
2
Należy zatem wyprodukować 3750 sztuk wyrobu A i 1500 sztuk wyrobu C (nie należy produkować wyrobu B), co zapewni zysk maksymalny w wysokości 22500 zł. Limity czasu pracy
maszyn zostaną wykorzystane w całości.
W tym miejscu warto zwrócić uwagę na interpretację zmiennych swobodnych. Ich niezerowa
wartość w rozwiązaniu optymalnym świadczy o:
• niewykorzystaniu występującego limitu w przypadku gdy ograniczenie jest typu „6”;
• przekroczeniu zakładanego poziomu w przypadku gdy ograniczenie jest typu „>”.
Jedno, skończone rozwiązanie optymalne jest jednym z grupy potencjalnych wyników jakimi
może się skończyć postępowanie w algorytmie simplex. Wyróżnimy jeszcze następujące:
• zadanie jest sprzeczne, kiedy w rozwiązaniu optymalnym występuje zmienna sztuczna z
niezerową wartością;
• zadanie posiada więcej niż jedno skończone rozwiązanie optymalne, kiedy liczba wskaźników optymalności równych zero jest większa od liczby zmiennych bazowych;
• zadanie nie posiada skończonego rozwiązania optymalnego, kiedy nie jest możliwe wyznaczenie ilorazów wyjścia, gdyż wszystkie składowe wektora wchodzącego do bazy są
niedodatnie.
10 z 37
Ekonometria dla FiR
1.4
Opracował: dr Adam Kucharski
Wyceny dualne
Podanie optymalnych wartości zmiennych decyzyjnych i wartości funkcji celu nie wyczerpuje możliwości analizy wyników. Jedną z nich są tzw. wyceny (zmienne) dualne. Służą one do
określania reakcji optymalnej wartości funkcji celu na zmiany wyrazów wolnych ograniczeń, bez
konieczności ponownego rozwiązywania zadania.
Zadanie dualne jest ściśle powiązane z podstawowym zadaniem, zwanym odtąd prymalnym
(pierwotnym). Mówiąc prościej, powstaje ono z przekształcenia zadania pierwotnego. Do czekających nas analiz nie jest konieczna znajomość zasad budowy zadania dualnego. Wystarczy nam
wiedza, że liczba zmiennych dualnych (oznaczymy je jako yi ) jest równa liczbie ograniczeń, czyli
każdemu z ograniczeń odpowiada jedna zmienna dualna. Interesować nas też będzie konkretne
rozwiązanie zadania dualnego, które otrzymamy na podstawie rozwiązania zadania pierwotnego.
Twierdzenie 1.3 Dla danej pary zadanie prymalne-dualne prawdziwe jest tylko jedno z poniższych twierdzeń:
1. Jeżeli jedno z pary zadań posiada rozwiązanie optymalne, to posiada je również drugie z
nich, przy czym optymalne wartości funkcji celu są sobie równe.
2. Jeżeli jedno z pary zadań nie posiada skończonego rozwiązania optymalnego, to drugie z
nich jest sprzeczne3 .
Twierdzenie 1.4 Jeżeli istnieje skończone rozwiązanie optymalne zadania pierwotnego względem bazy B, to rozwiązanie optymalne zadania dualnego dane jest wzorem:
yopt = (cB )T B−1
Wykorzystując drugie twierdzenie wyznaczymy optymalne wartości zmiennych dualnych w
rozpatrywanym przykładzie. Najpierw jednak potrzebujemy wiedzy o tym jak wyznaczyć B −1 .
W tym celu przypomnijmy, że macierz B pocz , którą znamy z pierwszej tablicy simplex, powstawała jako macierz jednostkowa utworzona ze zmiennych s1 i s2 . W ostatniej tablicy simpleksowej
odszukujemy wektory towarzyszące zmiennym, które tworzyły B pocz . Stąd wiemy, że:
1
/2 −1 /2
−1
B =
3/
−1 /4
4
Obliczamy teraz wyceny dualne (wektor (cB )T = [5 4] również pochodzi z ostatniej tablicy
simpleksowej):
1
opt opt /2 −1 /2
= 1,5 0,5
y1
y2 = 5 4
1
3
− /4
/4
Ogólna interpretacja zmiennej dualnej mówi, że: jeżeli w i-tym ograniczeniu wyraz wolny bi
wzrośnie o jednostkę, to optymalna wartość funkcji celu wzrośnie (spadnie) o yiopt jednostek.
Zinterpretujmy wycenę dualną y1opt dla ograniczenia czasu pracy maszyny M1:
Jeżeli limit czasu pracy maszyny M1 wzrośnie o 1 minutę, to zysk optymalny wzrośnie o 1,5
zł.
Zwróćmy uwagę, że miano powyższej zmiennej dualnej jest następujące: [zł zysku/ minutę].
3
Twierdzenie odwrotne nie jest prawdziwe, ponieważ gdy jedno zadanie jest sprzeczne, drugie może być także
sprzeczne lub może nie posiadać skończonego rozwiązania optymalnego.
11 z 37
Ekonometria dla FiR
1.5
Opracował: dr Adam Kucharski
Zadanie transportowe
Jednym z możliwych typów problemów z jakimi mamy do czynienia w ramach programowania
liniowego jest problem jak najtańszego przewozu dobra pomiędzy punktami nadania (dostawcy)
a punktami odbioru (odbiorcy). Należy podkreślić, że dobro jest jednorodne, a więc nie ma
(znanego np. z metody simplex) podziału na poszczególne produkty. Wprowadźmy następujące
oznaczenia:
xij – ilość dobra przewożonego na trasie między i -tym nadawcą a j -tym odbiorcą;
ai – zasób dobra w i -tym punkcie nadania;
bj – zapotrzebowanie na dobro w j -tym punkcie odbioru;
cij – jednostkowy koszt przewozu na trasie między i -tym nadawcą a j -tym odbiorcą;
i = 1, . . . , m j = 1, . . . , n.
Łączną ilość dobra dostępną we wszystkich punktach nadania przywykło się określać mianem
podaży zaś łączną ilość dobra, na które jest zapotrzebowanie we wszystkich punktach odbioru
nazwiemy popytem. Klasyczne zadanie transportowe podlega następującym założeniom:
1. przewożone dobro jest jednorodne;
2. podaż jest nie mniejsza niż popyt;
3. przepustowości tras są nieograniczone.
Klasyczne zadanie transportowe może wystąpić w jednej z dwóch odmian:
1. zadanie zamknięte (zbilansowane), w których podaż jest równa popytowi;
2. zadania otwarte (niezbilansowane), w których podaż jest większa niż popyt4 .
Każde zadanie otwarte da się przekształcić do zadania zamkniętego poprzez wprowadzenie
dodatkowego, fikcyjnego odbiorcy (zwanego magazynem). Zapotrzebowanie tego odbiorcy jest
równe różnicy między podażą a popytem. Koszt przewiezienia do magazynu traktujemy jako
znikomo mały w porównaniu z kosztami przewozu między nadawcami a odbiorcami i dlatego
przyjmujemy, że jest równy zero.
W klasycznym algorytmie transportowym rozwiązuje się następujący problem optymalizacyjny: należy znaleźć taki plan przewozu dobra, aby łączny koszt transportu ze wszystkich punktów
nadania do wszystkich punktów odbioru był jak najmniejszy. Każdy nadawca wysłać ma całą
posiadaną masę dobra (w zadaniach otwartych część trafi do magazynu), zaś zapotrzebowanie
każdego z odbiorców ma zostać zaspokojone w całości.
Model decyzyjny (dla zadania zamkniętego) można zapisać następująco:
K(x) =
n X
m
X
cij xij → min
i=1 j=1
n
X
j=1
m
X
= ai ,
i = 1, . . . , m
= bj ,
j = 1, . . . , n
i=1
xij > 0
Twierdzenie 1.5 Jeżeli ai oraz bj są liczbami nieujemnymi to zadanie transportowe zawsze ma
rozwiązanie.
4
Zakładamy, że w gospodarce rynkowej podaż jest na tyle elastyczna, że natychmiast dostosowuje się do wzrostu
popytu.
12 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Twierdzenie 1.6 Jeżeli ai oraz bj są liczbami całkowitymi to każde dopuszczalne rozwiązanie
bazowe zadania transportowego również przyjmuje wartości całkowite.
Z głębszych analiz zadania transportowego wypływa bardzo ważny wniosek: optymalny (jednoznaczny) program przewozowy wykorzystuje nie więcej niż m+n-1 spośród m × n tras przewozowych.
Przykładowe zadanie transportowe
Trzy gospodarstwa rolne (oznaczone przez D1, D2 i D3) dostarczają zboże do trzech punktów
skupu (oznaczonych O1, O2, O3) Agencji Rynku Rolnego, ponosząc przy tym koszty transportu.
Ilość zboża jakim dysponują gospodarstwa (w tonach), pojemność spichlerzy Agencji (w tonach)
a także jednostkowe koszty transportu (zł/t) podaje poniższa tabela. Należy opracować taki plan
przewiezienia zboża, aby łączny koszt przewozu był jak najmniejszy.
Gospod. 1
Gospod. 2
Gospod. 3
Zapotrzebowanie
odbiorców
Skup 1
Skup 2
Skup 3
5
3
3
40
8
6
4
60
6
5
3
60
Zasoby
u dostawców
60
10
90
160
W powyższym przykładzie mamy więc 3 punkty nadania i 3 punkty odbioru. Daje to 9
możliwych tras, którymi zboże może zostać przewiezione między poszczególnymi gospodarstwami
a punktami skupu. Tym niemniej do znalezienia rozwiązania wykorzystamy nie więcej niż 3+31=5 tras. Zwróćmy również uwagę, że podaż jest równa popytowi (wynosi 160 t) czyli mamy do
czynienia z zadaniem zamkniętym.
Wektor podaży a, popytu b oraz macierz kosztów jednostkowych C są następujące:
 


60
5
8
6
a = 10 , b = 40 60 60 , C = 3 6 5
90
3 4 3
Model decyzyjny tego zadania zaprezentowano poniżej:
5x11 +8x12 +6x13 +3x21 +6x22 +5x23 +3x31 +4x32 +3x33 → min
x11 +x12 +x13
= 60
x21
+x22 +x23
= 10
x31
+x32 +x33 = 90
x11
+x21
+x31
= 40
x12
+x22
+x32
= 60
x13
+x23
+x33 = 60
x11 > 0, x12 > 0, x13 > 0, x21 > 0, x22 > 0, x23 > 0, x31 > 0, x32 > 0, x33 > 0
Do rozwiązania powyższego zadania można użyć algorytmu simplex. Jednak duże rozmiary
modelu, które wzrosną jeszcze po sprowadzeniu do postaci kanonicznej5 . powodują, że nie jest to
podejście zbyt efektywne. Dlatego właśnie opracowano specjalny algorytm numeryczny służący
rozwiązywaniu takich zadań. Wprowadźmy oznaczenia:
ui – zmienna dualna dla i -tego dostawcy;
vj – zmienna dualna dla j -tego odbiorcy.
5
Z każdym z ograniczeń związana jest bowiem jedna zmienna sztuczna
13 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Wskaźnik optymalności dla algorytmu transportowego jest równy:
∆ij = cij − (ui + vj )
Podobnie jak to miało miejsce w przypadku algorytmu simplex o minimalizowanej funkcji
celu, plan przewozowy uznajemy za optymalny, kiedy wskaźniki optymalności dla wszystkich
tras spełnią warunek: ∆ij > 0.
Aby jednak wyznaczyć wskaźniki optymalności, należy poznać wszystkie wartości ui oraz vj .
Wykorzystuje się w tym celu fakt, że dla zmiennych bazowych ∆ij są równe zero. W metodzie
transportowej zmiennymi bazowym są trasy, na których dokonuje się przewozu, których liczba
wynosi m + n − 1. Konstruuje się na tej podstawie układ równań, w którym ui oraz vj są
niewiadomymi. Ponieważ liczba niewiadomych jest o 1 większa od liczby równań, należy przyjąć
wartość zerową dla jednej z nich. Zazwyczaj przyjmuje się u1 = 0. Postępowanie w algorytmie
transportowym obrazuje następujący schemat: nie gorsza niż w poprzednim rozwiązaniu. Na
rysunku 7 znalazł się schemat postępowania w tej metodzie.
(1) Ustal początkowy
plan przewozu
(6) Skoryguj program
przewozowy
(5) Określ maksymalny
przewóz na trasie ustalonej w (3)
Tak
(2) Czy aktualny plan
przewozu jest optymalny?
Nie
(4) Utwórz cykl korygujący
(3) Wybierz trasę dającą największą obniżkę
kosztów
Stop
Rysunek 7: Schemat postępowania w algorytmie transportowym
Obliczenia przeprowadzać będziemy równolegle w dwóch tabelach. W jednej znajdzie się aktualny plan przewozowy, a w drugiej sprawdzenie jego optymalności.
(1) Ustalenie początkowego planu przewozowego
Każdy plan przewozowy, wliczając w to również plan początkowy, zawierać będzie nie więcej
niż 3+3-1=5 tras. W metodzie transportowej nie ma jednoznacznego (jak w algorytmie simplex)
sposobu określenia pierwszego rozwiązania. Spośród wielu dostępnych, skupimy się ma metodzie
kąta północno-zachodniego.
Jest to najprostsza z metod opierająca się wyłącznie na popycie i podaży u poszczególnych
odbiorców i dostawców. Jej nazwa wzięła się stąd, że pierwszy przewóz ustalany jest zawsze na
14 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
trasie od pierwszego dostawcy do pierwszego odbiorcy. Wprowadzamy tam mniejszą z dwóch
wartości a1 i b1 . W naszym przykładzie pierwszy krok w tej metodzie znalazł się w tabeli 1.
Tabela 1: Początek postępowania w metodzie kąta północno-zachodniego
O1 O2 O3 podaż
D1
40
60
D2
10
D3
90
popyt 40 60 60
160
Dostawca 1 (D1) przewiezie 40 t zboża do odbiorcy 1, przy czym zapotrzebowanie tego
odbiorcy zostaje zaspokojone w całości. Jednakże D1 pozostało do rozdysponowania jeszcze 20
t dobra. Dostanie je odbiorca O2, który potrzebuje 60 t (patrz tabela 2). Brakującą mu do 60 t
ilość dostarczą: D2 (10 t) i D3 (30 t). Postępując w ten sposób otrzymamy następującą tabelę 3.
Jak widać rozwieziona została cała dostępna ilość zboża (40+20+10+30+60=160t), przy czym
Tabela 2: Rozdysponowanie podaży dostawcy D1
O1 O2 O3 podaż
D1
40 20
60
D2
10
D3
90
popyt 40 60 60
160
Tabela 3: Pierwszy plan przewozowy,
O1 O2
D1
40 20
D2
10
D3
30
popyt 40 60
uzyskany metodą kąta płn-zach
O3 podaż
60
10
60
90
60
160
wykorzystano 5 tras. Łączny koszt przewozu wynosi:
40 ∗ 5 + 20 ∗ 8 + 10 ∗ 6 + 30 ∗ 4 + 60 ∗ 3 = 720zł
(2) Sprawdzenie optymalności rozwiązania
Rozwiązanie uznajemy za optymalne jeżeli wszystkie wskaźniki optymalności są nieujemne.
Przypomnijmy, że wskaźniki te dla zmiennych bazowych są równe zero. Budowa tabeli zawierającej owe wskaźniki (tzw. tabeli wskaźników) wygląda następująco:
• pole odpowiadające niezerowemu przewozowi zawiera jednostkowy koszt przewozu;
• pole odpowiadające trasie niebazowej zawiera dwie liczby: sumę ui i vj oraz wskaźnik
optymalności.
Rozpoczynamy od przepisania odpowiednich elementów macierzy C oraz przyjęcia, że u1 = 0:
Wartości ui oraz vj znajdujemy w następujący sposób: suma wartości obu zmiennych dualnych musi dać koszt cij znajdujący się już w tabeli dla tras stanowiących bieżące rozwiązanie.
Stąd v1 obliczymy jak poniżej:
v1 + u1 = 5 ⇒ v1 + 0 = 5 ⇒ v1 = 5
15 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Tabela 4: Pierwszy krok tworzenia tabeli wskaźników
v1 v2 v3 wartości ui
u1
5
8
0
u2
6
u3
4
3
wartości vj
Podobnie wyznaczymy v2 :
v2 + u1 = 8 ⇒ v2 + 0 = 8 ⇒ v2 = 8
Zauważmy, że kolejność obliczania zmiennych dualnych nie jest dowolna, lecz wynika z wcześniej wyznaczonych wartości. Dlatego na przykład dopiero znając v2 możemy poznać u2 . Kompletna tabela wskaźników została zaprezentowana poniżej:
Tabela 5: Końcowa postać tabeli wskaźników
v1
v2
v3
wartości ui
u1
5
8 7
0
-1
u2
3
6 5
-2
0
0
u3
1
4
3
-4
2
wartości vj
5
8
7
Lewa górna część pola zawiera sumę zmiennych dualnych z odpowiedniego wiersza i kolumny,
prawa dolna – wskaźnik optymalności. Bieżącego planu przewozowego nie można uznać za optymalny ponieważ wszystkie wskaźniki nie są nieujemne. Konkretnie, dla trasy (1,3) otrzymaliśmy
wartość równą -1.
(3) Wybór trasy dającej największą obniżkę kosztów
Spośród tras niebazowych, wyłącznie tych posiadających ujemne wskaźniki optymalności,
wybieramy tę, dla której wskaźnik osiągnął najniższą wartość. W naszym przypadku jest tylko
jeden możliwy wybór – trasa (1,3).
(4) Cykl korygujący
W kolejnym kroku postępowania budujemy cykl korygujący. W polu wytypowanym w poprzednim kroku stawiamy znak „+” traktując je odtąd jako bazowe.
Następnie wykreślamy te wiersze i kolumny, które zawierają pojedyncze przewozy. Pamiętajmy, że trasa oznaczona plusem traktowana jest tak jakby przewożono tą trasą część dobra. Może
się poza tym zdarzyć, że po wykreśleniu danego wiersza (kolumny) kolejna kolumna (wiersz)
zawierać będzie pojedynczy przewóz. Wówczas należy ową kolumnę czy też wiersz również wykreślić.
W naszym przykładzie wykreślamy: kolumnę O1 i wiersz D2.
16 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Tabela 6: Wybór trasy w
O1 O2
D1
40 20
D2
10
D3
30
popyt 40 60
cyklu korygującym
O3 podaż
+
60
10
60
90
60
160
Nieskreślonym przewozom przypisujemy znak „+” lub „–” tak, aby wszystkie dopisane w
ten sposób znaki znosiły się nawzajem. Otrzymamy:
Tabela 7: Wybór trasy w cyklu korygującym
O2
O3 podaż
D1
20 –
+
60
D3
popyt
30 +
60
60 –
60
90
160
(5) Określenie maksymalnego przewozu na trasie wybranej w kroku (3)
Wybrany przewóz ma być z jednej strony jak największy, z drugiej zaś nie można dopuścić
do pojawienia się w tabeli wartości ujemnych, gdyż naruszałoby to nałożone wcześniej warunki
brzegowe. Dlatego ograniczymy się tylko do tras oznaczonych minusem i wybierzemy najniższy
z dostępnych tam przewozów. W naszym przykładzie: k = min(20, 30) = 20. Łączny koszt
przewozu zmniejszy się o wartość:
k ∗ ∆13 = 20 ∗ (−1) = −20
i wyniesie: 720-20=700 zł
(6) Korekta planu przewozowego
Cykl korygujący przebiega wyłącznie przez pola oznaczone wcześniej plusem lub minusem.
Te pierwsze zostają powiększone o wartość k, zaś te drugie zmniejsza się o tę wielkość. Oto nowy
plan przewozowy o niższej wartości kosztu całkowitego oraz towarzysząca mu tabela wskaźników:
Tabela 8: Drugi plan przewozowy wraz z cyklem korygującym
O1
O2
O3
podaż
D1
40 –
20 +
60
D1
+
10 –
10
K =700
D3
50 + 40 –
90
popyt
40
60
60
160
Jak widać, powyższy plan przewozowy nie okazał się jeszcze optymalny (ujemna wartość
wskaźnika optymalności równa -1). Dlatego należy poprawić rozwiązanie, wprowadzając przewóz
na trasie (2,1). Zwróćmy uwagę, że w tabeli 8 nie można dokonać skreśleń wierszy i kolumn z
pojedynczymi przewozami. Nowy koszt przewozu zmniejszy się o 10*(-1)= -10.
Kolejna iteracja dała optymalny plan przewozowy, który można zapisać:


30 0 30
Xopt = 10 0 0 
0 60 30
17 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Tabela 9: Tabela wskaźników dla 2 iteracji
v1
v2
v3
wartości ui
u1
5
7
6
0
1
u2
4
6
5
-1
-1
0
u3
2
4
3
-3
1
wartości vj
5
7
6
Tabela 10:
O1
D1
30
D1
10
D3
popyt 40
Optymalny plan przewozowy
O2 O3 podaż
30
60
10
Kmin = 690
60 30
90
60 60
160
Tabela 11: Tabela wskaźników dla ostatniej iteracji
v1
v2
v3
wartości ui
u1
5
7
6
0
1
u2
3
5
4
-2
1
1
u3
2
4
3
-3
1
wartości vj
5
7
6
UWAGA!
Jeżeli w tabeli wskaźników dla rozwiązania optymalnego, wystąpią wskaźniki optymalności równe zero dla zmiennych niebazowych, oznacza to, że istnieją jeszcze inne, alternatywne plany
przewozu o tej samej, minimalnej wartości łącznego kosztu.
1.6
Wybrane modyfikacje klasycznego zadania transportowego
Założenia występujące w klasycznym wariancie zadania transportowego mogą być uchylane.
Przedstawimy tutaj dwa przypadki:
1. Całkowitą blokadę trasy (tras);
2. Częściową blokadę trasy (tras).
Całkowita blokada trasy
Załóżmy, że na trasie z pierwszego gospodarstwa do pierwszego punktu skupu pojawiła się
blokada rolników niezadowolonych z cen skupu. Nie jest możliwe przewiezienie zboża na tej
trasie, ale zapotrzebowanie punktu skupu musi zostać spełnione, zaś gospodarstwo musi wysłać
swoje zboże.
Całkowita blokada na jednej lub większej ilości tras oznacza, że przewóz tam realizowany jest
całkowicie nieopłacalny. Należy o tym „poinformować” algorytm. Robi się to w ten sposób, że
18 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
na zablokowanej trasie wprowadza się bardzo wysoką (w porównaniu z pozostałymi, niezablokowanymi trasami) wartość jednostkowego kosztu przewozu6 . Wprowadzamy więc na interesującej
nas trasie koszt równy przykładowo 50 zł/t.


50 8 6
C =  3 6 5
3 4 3
Od tego miejsca zadanie rozwiązuje się tak jak klasyczne zadanie transportowe.
Częściowa blokada trasy
Załóżmy, że na trasie z trzeciego gospodarstwa do drugiego punktu skupu odbywa się remont
drogi. Z tego powodu można nią przewieźć co najwyżej 20 t zboża.
Powyższy warunek różni się od poprzedniego przypadku, ponieważ część dobra może zostać
daną trasą przewieziona po normalnie obowiązujących kosztach. Reszta musi zostać rozwieziona
innymi trasami.
Problem ten można rozwiązać dwojako:
1. rozszerzyć na czas rozwiązywania liczbę dostawców;
2. rozszerzyć na czas rozwiązywania liczbę odbiorców.
W pierwszym przypadku zmieniamy macierz kosztów C oraz wektor podaży a:


 
5 8 6
60


10
 , C = 3 6 5
a=
3 4 3
20
3 50 3
70
W drugim zmieniamy macierz C i wektor popytu b:


5
8
8
6
b = 40 20 40 60 , C = 3 6 6 5
3 4 50 3
Dla tej części dobra, która nie zmieści się na częściowo zablokowanej trasie, wprowadzana
jest blokada całkowita. Należy jednak pamiętać, że wiersze 3 i 4 w pierwszym podejściu dotyczą
jednego dostawcy, zaś kolumny 2 i 3 w drugim podejściu dotyczą jednego odbiorcy. Zadanie
rozwiązuje się tak, jak wariant klasyczny. Dopiero podając odpowiedź scalamy uprzednio rozdzielone wiersze i kolumny, wracając do poprzednich rozmiarów zadania.
2
Modele opisowe
2.1
Pojęcia podstawowe
Model opisowy stanowi uproszczony sposób opisywania skomplikowanych zjawisk. Odwzorowuje
te elementy, które są ważne z punktu widzenia prowadzonej analizy. Pomija się te, które wydają
się nieistotne. Ma to swoje zalety, ale również wady. Oznacza bowiem konieczność przyjmowania
odnośnie badanych zjawisk silnych założeń, których spełnienie bywa utrudnione.
Punktem wyjścia ekonomicznych modeli opisowych są istniejące teorie ekonomiczne, często
skomplikowane lub wręcz abstrakcyjne. Należy pamiętać, że same teorie podlegają zmianom w
6
W literaturze można spotkać zalecenie, aby był on przynajmniej trzykrotnie wyższy niż najwyższy koszt
występujący w macierzy.
19 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
czasie (np. z powodu politycznego i społecznego zaangażowania samych ekonomistów) co rzutuje
na samą budowę modeli. „Techniczną” stroną tego procesu zajmuje się zaś ekonometria.
Korzenie tej dziedziny tkwią w ekonomii matematycznej oraz statystyce matematycznej –
przede wszystkim w zjawisku korelacji zmiennych. Model ekonometryczny to równanie lub układ
równań (wraz z towarzyszącymi założeniami) opisujące związki między wybranymi zmiennymi.
Cele, dla których sięga się po tego typu modele dadzą się streścić następująco:
1. poznanie zachowań i zależności łączących podmioty ekonomiczne oraz poznanie funkcjonowania układów gospodarczych;
2. porządkowanie informacji statystycznych pozwalające wyodrębnić trendy, wahania sezonowe i losowe;
3. testowanie hipotez ekonomicznych;
4. prognozowanie zjawisk ekonomicznych i przeprowadzanie analiz polityk gospodarczych;
Modele opisowe zazwyczaj bazują na danych statystycznych, często zagregowanych, zniekształconych przez błędy obserwacji. Dane te nie pochodzą z kontrolowanych eksperymentów.7
Ewentualne ich poprawienie nie jest możliwe, a stanowią jedyną dostępną rejestrację statystyczną
zachowania się zjawisk lub podmiotów ekonomicznych. Dlatego musimy przyjmować założenia, z
których części nie da się nawet zweryfikować. Dane statystyczne mają zazwyczaj postać szeregów
należących do jednej z poniższych kategorii (najczęściej spotyka się pierwsze z nich):
1. szeregi czasowe;
2. szeregi przekrojowe;
3. szeregi przekrojowo-czasowe;
2.2
Równanie stochastyczne a deterministyczne
Wykorzystanie danych statystycznych, zebranych jako obserwacje dokonane na konkretnych
obiektach powoduje, że przykładowa zależność między dochodem (Y) a konsumpcją (C) dla
kolejnych obserwacji może wyglądać jak na rysunku 8.
Na podstawie wykresu widać, że do jego opisu nie da się użyć żadnej elementarnej i deterministycznej funkcji matematycznej, choć chmura punktów wskazuje na istnienie zależności o
charakterze liniowym. Zachowanie się obu przedstawionych wielkości ekonomicznych względem
siebie wymaga wprowadzenia pewnej dodatkowej zmiennej, wyjaśniającej odchylenia punktów
odpowiadających obserwacjom od funkcji liniowej. Dlatego równanie opisujące zależność między
konsumpcją a dochodem zapiszemy następująco:
Ci = α0 + α1 Yi + εi
(1)
Indeks i oznacza, że konsumpcja i dochód mają postać szeregów statystycznych. Symbol
εi nazywamy składnikiem losowym równania. Wprowadzenie go dało możliwość sięgnięcia po
prostą funkcję liniową, jako sposób opisania zależności między badanymi zmiennymi. Równanie,
w którym wprowadzono składnik losowy nazywamy stochastycznym. Przyczyny uwzględniania
składnika losowego w modelach ekonometrycznych są następujące:
1. indeterminizm zachowania się zjawisk (lub podmiotów) ekonomicznych;
2. niedoskonałości pomiaru, które zawierają się w εi ;
3. wady w konstrukcji modelu np błędy w specyfikacji czy niepoprawna postać funkcyjna;
7
Jak to jest możliwe w naukach eksperymentalnych takich jak fizyka czy chemia.
20 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
C 6
•
•
•
•
•
•
•
•
••
•
•
•
•
•
- Y
Rysunek 8: Przykładowa zależność między konsumpcją a dochodem
(1)
C 6
•
•
(2)
•
(3)
•
• • •
••
• •
•
•
•
•
- Y
Rysunek 9: Możliwe funkcje liniowe dla modelu konsumpcji
2.3
Metoda Najmniejszych Kwadratów
Choć postać równania (1) jest poprawna, nie znamy jego parametrów (to sytuacja odwrotna
w porównaniu do modeli optymalizacyjnych). Każda z trzech zaprezentowanych na kolejnym
wykresie funkcji jest liniowa i teoretycznie nadaje się do opisu zależności między konsumpcją
a dochodem. Należy znaleźć te parametry, które dadzą najbardziej satysfakcjonującą postać
funkcji z punktu widzenia pewnego przyjętego kryterium.
Analizując rysunek 9 nasuwa się stwierdzenie, że najlepszą będzie funkcja przebiegająca jednocześnie „najbliżej” wszystkich punktów. Wydaje się, że jest to funkcja numer 2, ale powstaje
pytanie: jak zyskać pewność co do dokonanego wyboru? Należy zbadać odległości dzielące rzeczywiste punkty od naszej hipotetycznej prostej i wybrać wariant o najmniejszych zmierzonych
w ten sposób błędach. Minimalizuje się więc pewną funkcję kary, która przyjmuje wartości tym
większe im wspomniana odległość jest większa. Ponieważ jednak punkty leżą tak nad jak i pod
prostą, więc nie można użyć prostej sumy popełnianych błędów gdyż wartości dodatnie będą
znosić się z ujemnymi.
Spośród różnych dostępnych wariantów, niewątpliwie najpopularniejszą jest minimalizacja
sumy kwadratów odległości punktów od prostej. Stąd też wzięła się jej nazwa – Metoda Naj-
21 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
mniejszych Kwadratów (MNK). Używając tej metody możliwa jest estymacja parametrów modelu stochastycznego. Nie wchodząc w matematyczne szczegóły dotyczące wyprowadzenia, wzór
pozwalający otrzymać oszacowania parametrów równania przy pomocy MNK jest następujący:
α̂ = (XT X)−1 XT y
(2)
gdzie:
α̂ – wektor oszacowań parametrów równania;
X – macierz obserwacji na zmiennych objaśniających;
y – wektor obserwacji na zmiennej objaśnianej;
Wektor α̂ zawiera liczbowe wartości oszacowanych parametrów, które wskażą najkorzystniejszą dla danych obserwacji postać funkcji.
Estymacja to jednak tylko jeden (i to wcale nie pierwszy) z etapów analizy ekonometrycznej.
Badanie tego typu da się podzielić na następujące fazy:
1. Specyfikacja zmiennych i relacji modelu:
• określenie celu badania;
• wybór zmiennych
• wybór postaci analitycznej modelu na podstawie:
– teorii ekonomii;
– zebranych danych i posiadanego doświadczenia;
– związków korelacyjnych między zmiennymi;
2. Gromadzenie danych statystycznych;
3. Estymacja parametrów;
4. Weryfikacja modelu:
• statystyczna;
• merytoryczna;
5. Praktyczne wykorzystanie modelu:
• analiza zależności;
• wnioskowanie o przyszłości;
2.4
Model regresji liniowej
Naturalną tendencją podczas budowy modeli jest dążenie do możliwie najprostszego sposobu
opisu zjawiska. Stąd wzięło się częste sięganie po liniową postać regresji jako najlepiej odpowiadającą temu założeniu. Okazuje się, że w sporej liczbie przypadków takie podejście zdaje
egzamin. Aby jednak można było użyć MNK do estymacji parametrów modelu liniowego, konieczne jest spełnienie określonych założeń zwanych założeniami schematu Gaussa-Markowa:
1. model jest niezmienniczy ze względu na obserwacje (parametry i postać funkcji nie ulegają
zmianie);
2. model jest liniowy względem parametrów8 ;
8
Należy zauważyć, że model musi być liniowy względem parametrów, ale nie względem zmiennych. Dzięki temu
używa się modeli nieliniowych sprowadzanych przy pomocy stosownych przekształceń do postaci liniowej.
22 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
3. zmienne objaśniające są nielosowe, a ich wartości są ustalonymi liczbami rzeczywistymi;
4. składnik losowy ma rozkład normalny;
5. wartość oczekiwana składnika losowego jest równa 0 (zakłócenia mają tendencję do wzajemnego znoszenia się);
6. składnik losowy jest sferyczny – macierz wariancji-kowariancji D2 (εi ) jest diagonalna, o
takich samych elementach na przekątnej głównej9 ;
7. informacje zawarte w próbie są jedynymi, na podstawie których estymuje się parametry
modelu;
8. liczba obserwacji powinna być wyższa niż liczba szacowanych parametrów.
Część powyższych założeń dotyczy (wprowadzonego wcześniej) składnika losowego, który
stanowi abstrakcyjny sposób wyjaśniania takiego a nie innego zachowania się obserwacji. W
konsekwencji nie jesteśmy w stanie poznać składnika wprost, znamy za to jego przybliżenie –
resztę z modelu.
Równanie po oszacowaniu (dla przypadku jednej zmiennej objaśniającej) ma postać:
Ŷi = α̂0 + α̂1 Xi
(3)
Daszek nad parametrami oznacza, że są to już konkretne wartości, dlatego w równaniu (3)
nie występuje składnik losowy. Podstawiając do równania obserwacje jakimi dysponujemy dla
zmiennej X otrzymamy wartości Y wynikające z równania (czyli Ŷi ) zwane wartościami teoretycznymi zmiennej objaśnianej. Oczywiście nie będą one dokładnie odpowiadać rzeczywistym
realizacjom tej zmiennej, ponieważ większość punktów leży powyżej lub poniżej linii regresji.
Występującą w tej sytuacji różnicę:
ei = Yi − Ŷi
(4)
nazywamy resztą z modelu. Można więc (choć praktykuje się to rzadko) zapisać równanie (3)
jako:
Ŷi = α̂0 + α̂1 Xi + ei
(5)
Zapis podany w (5) pokazuje, że reszty z modelu (a jest ich tyle ile obserwacji) mogą być traktowane jako przybliżona realizacja składnika losowego. Tak więc nie znamy składnika losowego
jako takiego, znamy natomiast reszty, które mają podobne własności.
Same modele mogą być klasyfikowane według różnych kryteriów. Wymieńmy te najpowszechniej spotykane:
1. Ze względu na formę związku między zmiennymi:
(a) liniowe;
(b) nieliniowe;
2. Ze względu na ilość zależności:
(a) jednorównaniowe;
(b) wielorównaniowe;
3. Ze względu na dynamikę:
(a) statyczne;
9
Mówimy, że składnik losowy jest homoskedastyczny i nieskorelowany
23 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
(b) dynamiczne (w tym autoregresyjne);
4. Ze względu na wartości poznawcze:
(a) przyczynowo-skutkowe;
(b) tendencji rozwojowej;
5. Ze względu na zakres badania:
(a) mikroekonomiczne;
(b) makroekonomiczne;
Nas najbardziej interesować będzie pierwsze kryterium. Przypomnijmy, że jedno z założeń
schematu Gaussa-Markowa wymaga, aby równanie było liniowe względem parametrów. Dlatego
do poniższego modelu:
Yi = eα0 Xiα1 eεi
(6)
nie można zastosować metody najmniejszych kwadratów. Zlogarytmujmy jednak (6) stronami:
ln Yi = α0 + α1 ln Xi + εi
(7)
Otrzymaliśmy równanie nieliniowe nadal względem zmiennych, ale za to liniowe względem
parametrów co było naszym celem. Sprowadzanie równań nieliniowych do postaci liniowej jest
często spotykaną praktyką ponieważ pozwala skorzystać z dobrodziejstw MNK. Oczywiście sama
sposób sprowadzania różni się w zależności od postaci funkcyjnej modelu.
2.5
Statystyczna weryfikacja jakości modelu
Fakt, że po użyciu MNK otrzymaliśmy estymatory parametrów modelu nie oznacza jeszcze,
że można spocząć na laurach. Otrzymane wyniki muszą zostać sprawdzone pod kątem jakości.
Dokonuje się tego na dwóch poziomach: statystycznym i merytorycznym. Na początek zajmijmy
się weryfikacją statystyczną.
Znając reszty z modelu można spróbować sobie odpowiedzieć czy zachowanie się zmiennych
objaśniających dobrze odwzorowuje zachowanie zmiennej objaśnianej. Oczywiście można to zrobić, analizując każdą resztę z osobna10 . Jednak jakiekolwiek wnioski jesteśmy w stanie wyciągnąć
tylko dla szeregów o niewielkiej liczbie obserwacji, kiedy nie przytłacza nas duża ilość danych.
W pozostałych przypadkach konieczne staje się sięgnięcie po miary uśrednione.
Da się wykazać, że między wartościami empirycznymi, teoretycznymi a resztami zachodzi
związek:
X
X
X
(Yi − Ȳ )2 =
(Ŷi − Ȳ )2 +
e2i
(8)
i
i
i
co można zapisać:
SST = SSR + SSE
(9)
gdzie:
SST – zmienność całkowita (suma kwadratów odchyleń wartości empirycznych od średniej arytmetycznej Y);
SSR – zmienność objaśniona (suma kwadratów odchyleń wartości teoretycznych od średniej
arytmetycznej Y);
SSE – zmienność nieobjaśniona.
10
Pamiętając, że różnice między wartościami: rzeczywistą i teoretyczną powinny być jak najmniejsze.
24 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Dzieląc (9) stronami przez SST otrzymamy:
1=
SSR SSE
+
SST
SST
(10)
SSR
występujący w (10) nosi nazwę współczynnika determinacji i oznaczamy go
SST
2
symbolem: R . Jest to syntetyczna miara opisująca dopasowanie wartości teoretycznych do rzeczywistych. Przyjmuje wartości z przedziału h0, 1i11 . Im bliżej 1 (100%) tym lepsze dopasowanie
modelu do danych, a więc oszacowania są lepszej jakości. Dla R2 = 1 wszystkie punkty empiryczne należą do linii regresji (zaś wszystkie reszty są równe 0).
Tylko na pierwszy rzut oka wiadomo co to jest wysokie R2 , choć dążenie do jak najwyższych
jego wartości jest zupełnie zrozumiałe. Interpretacja współczynnika determinacji jest możliwa,
kiedy zachodzą następujące warunki:
Element
1. relacja między zmiennymi musi być liniowa;
2. parametry muszą być szacowane przy pomocy MNK, gdyż inaczej współczynnik może
przyjmować dowolne wartości;
3. model musi zawierać wyraz wolny, w przeciwnym razie zachodzi: R2 ∈ (−∞, 1i
W modelach o więcej niż jednej zmiennej objaśniającej R2 rośnie ze wzrostem liczby szacowanych parametrów. Aby uniknąć tej wady oblicza się skorygowany współczynnik determinacji:
R̄2 = 1 − (1 − R2 )
n−1
n−k
(11)
Różnica między R2 a R̄2 rośnie ze wzrostem liczby zmiennych objaśniających. Skorygowany
współczynnik determinacji ma następujące własności:
1. Jeżeli R2 = 1 wówczas R̄2 = 1.
2. R̄2 może przyjmować wartości ujemne.
Poniższe rysunki prezentują wartości współczynnika determinacji w zależności od zachowania
się relacji między zmienną objaśniającą a objaśnianą przy założeniu, że użyto liniowej funkcji
regresji.
Y 6
Y 6
Y 6
•
•
•
•
• •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
-X
Rysunek 10: R2 ≈ 1
-X
Rysunek 11: R2 ≈ 0
-X
Rysunek 12: R2 ≈ 0
Przypadki zaprezentowane na rysunkach (11) oraz (12) mimo podobnej wartości współczynnika determinacji różnią się dość znacznie. W pierwszej sytuacji nie ma praktycznie żadnej
11
Często praktykuje się podawanie wartości R2 w procentach.
25 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
zależności między zmiennymi, w drugiej zaś występuje ona, lecz ma charakter nieliniowy (w tym
wypadku opisany parabolą).
Współczynnik determinacji jest komfortową w zastosowaniu miarą ponieważ odnosi się do
całego równania i ma wygodną interpretację. Z uwagi jednak na obarczenie pewnymi wadami,
weryfikację statystyczną należy wzbogacić o inne elementy. Wiemy, że parametry modelu pokazują wpływ jaki wywiera jedna zmienna na inną. Można więc sprawdzić, czy związki zachodzące
w równaniu są rzeczywiście istotne.
Jeżeli zmienne: objaśniania i objaśniająca nie są ze sobą powiązane wówczas, biorąc pod
uwagę założenia schematu Gaussa-Markowa, odpowiedni parametr powinien być równy zero12 .
Skonstruujmy w tej sytuacji następujący zespół hipotez statystycznych dotyczących dowolnego
z parametrów:
H0 : αi = 0
H1 : αi 6= 0
Tworzą one podstawę tzw. testu istotności t-Studenta należącego do grupy metod weryfikacji
statystycznej. Sprawdzaniem powyższego zespołu hipotez jest statystyka:
t αi =
α̂i
σα̂i
(12)
gdzie:
σα̂i – średni błąd estymatora.
Statystyka dana wzorem (12) ma rozkład t-Studenta o n-k stopniach swobody. Z uwagi
na konstrukcję hipotezy alternatywnej, w teście tym występuje obustronny obszar odrzucenia
rozpatrywany względem odczytanej z tablic wartości krytycznej. Interpretacja wyników jest
następująca:
1. Jeżeli |tαi | > tkryt wówczas (przy przyjętym z góry poziomie istotności) odrzucamy H0 na
korzyść H1 . Zmienna objaśniająca w istotny sposób wpływa na zmienną objaśnianą.
2. Jeżeli |tαi | < tkryt wówczas (przy przyjętym z góry poziomie istotności) nie mamy podstaw
do odrzucenia hipotezy zerowej, a więc uznajemy dany parametr za nieistotny statystycznie.
Konsekwencje braku istotności są bardzo poważne. Oznaczają bowiem, że umieszczona w
równaniu zmienna objaśniająca znalazła się tam niepotrzebnie. W takiej sytuacji należy ją usunąć i dokonać reestymacji równania.
2.6
Autokorelacja składnika losowego
Z autokorelacją mamy do czynienia, kiedy składniki losowe dotyczące różnych obserwacji są ze
sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych.
Przyczyny występowania autokorelacji są różne:
1. natura procesów gospodarczych np serie klęsk trwające przez wiele okresów;
2. wpływ zdarzeń najbliższej przeszłości na podejmowane decyzje;
3. niepoprawna postać funkcyjna modelu np nie uwzględnienie cyklu gospodarczego;
12
Z uwagi na obecność składnika losowego, praktycznie nie zdarza się sytuacja, w której parametr jest równy
zero.
26 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
4. wadliwa struktura dynamiczna modelu: brak opóźnionych zmiennych w charakterze zmiennych objaśniających;
5. pominięcie ważnej zmiennej objaśniającej.
Najpoważniejszą konsekwencją występowania autokorelacji jest obciążenie estymatora wariancji składnika losowego. Kierunek obciążenia bywa różny. Dla autokorelacji dodatniej wariancja ta jest niedoszacowana co prowadzi do pozornie większej dokładności ocen parametrów. W
konsekwencji otrzymujemy zawyżone statystyki t-Studenta.
Najczęściej zakłada się występowanie schematu autoregresyjnego pierwszego rzędu (tzw schemat AR(1)), w którym występuje powiązanie między składnikami losowymi z sąsiednich okresów:
εt = ρεt−1 + ηt
(13)
gdzie:
ρ – współczynnik autokorelacji;
ηt ∼ N (0, ση )
Szczególną własnością zjawisk ekonomicznych jest to, że pozostają one ze sobą zawsze w
jakimś związku. Z tego powodu autokorelacja, choć niepożądana, jest właściwie nie do uniknięcia.
Nasze działania zmierzają więc po pierwsze do określenia siły autokorelacji, a następnie do
podjęcia decyzji odnośnie przeciwdziałania jej skutkom.
Najprościej byłoby policzyć współczynnik autokorelacji, lecz należy pamiętać, iż nie znamy
wprost składnika losowego. Z tego powodu po raz kolejny wykorzystamy jego przybliżenie czyli
reszty z modelu. Niestety oznacza to, że możemy poznać jedynie estymator wartości ρ. Istnieje
kilka sposobów na obliczenie ρ̂:
n
X
et et−1
ρ̂1 =
t=2
n
X
(14)
e2t
t=1
Ponieważ w (14) tracimy w liczniku jeden stopień swobody, można estymator ρ̂ policzyć
inaczej:
n−k
ρ̂2 =
ρ̂1
(15)
n−1
Najczęściej jednak dla schematu AR(1) wykonuje się test Durbina-Watsona. Zakłada się w
nim następujący zespół hipotez:
H0 : ρ = 0
H1 : ρ > 0
lub ρ < 0
Sprawdzianem testu jest statystyka:
n
X
d=
(et − et−1 )2
t=2
n
X
(16)
e2t
t=1
Jej wartości należą do przedziału h0, 4i. Z tablic odczytujemy dwie wartości krytyczne: dolną
dL i górną dU . Interpretacja wyników testu znalazła się w tabeli:
Aby dało się zastosować test Durbina-Watsona muszą zachodzić następujące warunki:
27 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Tabela 12: Weryfikacja testu Durbina-Watsona
Kierunek autokorelacji
ρ̂ > 0
ρ̂ < 0
d ∈ hdU , 2i
d ∈ h2, 4 − dU i
d ∈ hdL , dU i
d ∈ h4 − dU , 4 − dL i
d ∈ h0, dL i
d ∈ h4 − dL , 4i
Decyzja
przyjąć H0
brak rozstrzygnięcia
odrzucić H0
1. w równaniu powinien występować wyraz wolny;
2. należy dysponować co najmniej 15 obserwacjami;
3. w modelu nie powinna występować opóźniona zmienna objaśniana w charakterze zmiennej
objaśniającej.
W wypadku kiedy ostatnie z założeń nie jest spełnione można sięgnąć po statystykę:
r
d
n
h= 1−
2
1 − nσ̂Y2
(17)
gdzie:
σ̂Y2 – estymator wariancji parametru przy opóźnionej zmiennej objaśnianej.
Statystyka h ma rozkład asymptotycznie normalny o wartości oczekiwanej równej 0 i odchyleniu standardowym równym 1.
Jeżeli test potwierdzi występowanie statystycznie istotnej autokorelacji w modelu należy
podjąć działania zmierzające do wyeliminowania jej skutków. Stosuje się jedno z poniższych
rozwiązań:
1. respecyfikacja modelu;
2. użycie innych niż klasyczna MNK metod estymacji np uogólnionej metody najmniejszych
kwadratów (UMNK);
3. wprowadzenie opóźnionych zmiennych.
2.7
Weryfikacja merytoryczna
Jeżeli współczynnik R2 oraz statystyki t-Studenta mają zadowalające wartości, wówczas można
przejść od weryfikacji statystycznej do merytorycznej. Ma ona na celu sprawdzenie zgodności
otrzymanych wyników z poczynionymi wcześniej założeniami. Podczas weryfikacji merytorycznej
wyodrębnimy dwa etapy:
1. określenie poprawności znaków przy parametrach;
2. interpretacja wartości oszacowanych parametrów.
W obu przypadkach pomoc może stanowić teoria ekonomii. Często (choć nie zawsze) z góry znamy znak stojący przy relacjach między konkretnymi wartościami ekonomicznymi. Jako
przykład może posłużyć uzależnienie popytu na dobra podstawowe od dochodu czy ceny.
Nieco bardziej skomplikowana jest interpretacja oszacowanych parametrów. Nie zawsze bowiem znamy rząd wielkości odpowiadający sile wpływu zmiennej objaśniającej na objaśnianą.
Spotyka się tu raczej wskazówki (np elastyczność względem zmiennej powinna być mniejsza od
28 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
1) niż konkretne, sztywne zasady. Dodatkowo sprawę komplikuje fakt, że inaczej interpretuje się
parametry w równaniu liniowym niż w którymkolwiek z nieliniowych.
Osobnego zwrócenia uwagi wymaga wyraz wolny. Z jednej strony jego obecność jest wymagana np ze względu na własności współczynnika determinacji. Z drugiej nie zawsze ma on sens
merytoryczny, jak dzieje się na przykład w przypadku zlinearyzowanych modeli nieliniowych.
2.8
Zmienne zero-jedynkowe
Jeśli chodzi zarówno o weryfikację merytoryczną jak i statystyczną problem może stanowić niekiedy samo zachowanie się danych. Przyjrzyjmy się sytuacji przedstawionej na rysunku 13.
Y 6
•
•
•
•
•
•
•
-X
Rysunek 13: Nietypowe zachowanie danych
Jedna z obserwacji przyjęła wartość nietypowo wysoką w porównaniu do pozostałych danych.
Zastosowanie MNK w tej sytuacji doprowadzi do modelu o bardzo niskim R2 a nawet do przyjęcia
hipotezy o braku istotności oszacowań. Z uwagi na skromną liczbę obserwacji nie jest możliwa
rezygnacja z części spośród nich, aby uniknąć wymienionych wad.
Jeżeli spojrzeć na to szerzej, nie powinniśmy sprawiać wrażenia zaskoczonych. Zjawiska ekonomiczne podlegają w niektórych okresach (takich jak wojny czy gwałtowne recesje lub boom
gospodarczy) raptownym wahaniom. Przyjmują wtedy wartości skrajnie odbiegające od okresów, które w tej sytuacji można nazwać „normalnymi” lub typowymi. Wyróżnimy 3 grupy takich
nietypowych zachowań:
1. obserwacje nietypowe występujące w pojedynczych, nieregularnych okresach;
2. obserwacje nietypowe trwające przez kilka okresów z rzędu;
3. obserwacje nietypowe regularnie się powtarzające.
Zazwyczaj nie jesteśmy w stanie zrezygnować z danych dotyczących nietypowych okresów.
Ewentualne skrócenie próby ma daleko idące konsekwencje podczas estymacji. Z drugiej strony brak kroków zaradczych oznacza modele o słabych własnościach statystycznych i merytorycznych. Jako wyjście proponuje się stosowanie zmiennych zero-jedynkowych. Zmienną taką
definiuje się następująco:
(
0, dla obserwacji typowych;
Ui =
(18)
1, dla obserwacji nietypowych.
Zmienne zero-jedynkowe tworzone są więc sztucznie, zgodnie z naszymi potrzebami13 . Wprowadza się je następnie do równania i szacuje parametry w tradycyjny sposób. W zależności od
13
Należy jednak zachowywać umiar przy wprowadzaniu zmiennych zero-jedynkowych. Ich użycie musi być
odpowiednio umotywowane.
29 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
użycia mogą one wywoływać zmianę któregoś z pozostałych parametrów w wybranych okresach.
Równanie (19) prezentuje korektę wyrazu wolnego:
Yi = α0 + αo∗ Ui + αi Xi + εi
(19)
Y 6
•
•
•
•
• •
•
-X
Rysunek 14: Zmienna zero-jedynkowa dla wyrazu wolnego
Niekiedy należy zmienić współczynnik kierunkowy równania:
Yi = α0 + (α1 + α1∗ Ui )Xi + εi
(20)
Sytuację z równania (20) ilustruje rysunek 15.
Y 6
•
•
•
•
• •
•
-X
Rysunek 15: Zmienna zero-jedynkowa dla współczynnika kierunkowego
Możliwe jest również połączenie rozwiązań zaproponowanych w (19) oraz (20) dla jednego
modelu.
Oddzielnego omówienia wymaga wykorzystanie sezonowych zmiennych zero-jedynkowych. Ze
zjawiskiem sezonowości spotykamy się często korzystając z danych kwartalnych. Jest to sytuacja
regularnego powtarzania się obserwacji nietypowych14 . Zakładając, że mamy do czynienia właśnie z sezonowością kwartalną proponuje się następujący sposób użycia zmiennych sztucznych:
Yt = α0 + α1 Xt + α2 U1t + α3 U2t + α4 U3t + εt
(21)
Równanie (21) stanowi rozszerzenie modelu z korektą wyrazu wolnego. Różnica polega na
tym, że w tym przypadku wyraz wolny jest korygowany w każdym kwartale przez inny parametr (przykładowo za sezonowość w pierwszym z nich odpowiada parametr przy U1t ). Powyższe
14
Jako przykład może posłużyć wzrost spożycia napojów gazowanych w okresie letnim.
30 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
zmienne mierzą odchylenie sezonowe względem wybranego (w naszym przykładzie czwartego)
kwartału. Zachowanie się zmiennej Yt w czwartym kwartale oddaje wyraz wolny. Należy pamiętać, że w szeregach zmiennych tego typu wartość 1 regularnie się powtarza do końca okresu, z
którego pochodzą dane. Przykładowo dla równania (21) macierz X wyglądałaby następująco:


1 X1 1 0 0


1 X2 0 1 0




1 X3 0 0 1


1 X 0 0 0
4




1 X5 1 0 0


X=

1 X6 0 1 0


1 X7 0 0 1




1 X8 0 0 0


..
.. .. .. 
 ..
.
.
. . .


. . .
1 Xn .. .. ..
2.9
Modele ekonometryczne a prognozowanie
Aby wykonać prognozę na podstawie jednorównaniowego modelu opisowego, musi on charakteryzować się dobrymi własnościami. Jego jakość ocenia się przy pomocy miar takich jak współczynnik determinacji czy istotność oszacowań. Równie ważna jest weryfikacja merytoryczna, czyli znaki a w przypadku modeli nieliniowych wartości elastyczności. Same prognozy mogą mieć
charakter punktowy (wynikiem jest konkretna wartość liczbowa) lub przedziałowy (otrzymujemy przedział, który z określonym prawdopodobieństwem zawiera przyszłą realizację zmiennej
prognozowanej).
Dodatkowo zakładamy, że relacje między zmiennymi pozostaną stałe w czasie. Oznacza to,
że postać funkcyjna modelu oraz wzajemne oddziaływanie zmiennych są stałe z okresem prognozy włącznie. To założenie (szczególnie w realiach ekonomicznych) jest bardzo silne. Podobne
założenia czynimy w przypadku omawianych poniżej modeli trendu.
Składnik losowy również pozostaje stały w czasie co oznacza, że nie powinny pojawić się nowe
zmienne wpływające na prognozowane zjawisko przy okazji zmieniając już ustalone relacje.
W okresie prognozowanym musimy znać wartości zmiennych objaśniających. Kiedy nie jest
możliwe, w sukurs przychodzą metody prognozowania szeregów czasowych. Można również konstruować dodatkowe równania, służące otrzymaniu przyszłych wartości pożądanych zmiennych.
Zazwyczaj takie postępowanie prowadzi do otrzymania układu powiązanych ze sobą równań.
Niekiedy zaś (w analizach określonych scenariuszy) zakłada się z góry wartości zmiennych egzogenicznych co upodabnia postępowanie do analizy mnożnikowej.
Prognozy na podstawie modeli ekonometrycznych, w których uwzględnia się fakt sezonowości zmiennych, zakładają istnienie sezonowości również w okresie prognozy. Sezonowość ta ma
zachowany dotychczasowy okres wahań.
2.10
Modele trendu
Niektóre zmienne mają skłonność do systematycznych zmian w czasie np. stale rosną lub maleją.
Mówimy, że zawierają trend i staramy się skonstruować możliwie najprostszą sztuczną zmienną
reprezentującą czas. Przy addytywnym wprowadzeniu składnika losowego otrzymujemy szczególny przypadek równania linii regresji. Potrzebujemy jedynie informacji o zmiennej objaśnianej,
nie zaś objaśniających co stanowi wielce korzystną okoliczność.
31 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Postać modelu może być różna, a jej wybór zależy od przesłanek dotyczących mechanizmu
rozwojowego zmiennej. Przykłady postaci funkcji trendu:
• liniowa
yt = α + βt
Stały kierunek rozwoju zjawiska wyznacza współczynnik kierunkowy prostej. Wyraża on
stały przyrost wartości zmiennej prognozowanej.
• wykładnicza
yt = eα+βt ,
t
yt = αβ ,
β>0
β>1
W równaniu pierwszym β a w drugim ln β jest stopą wzrostu.
• wielomianowa
yt = α0 + α1 t + α2 t2
Kolejne trzy funkcje stosuje się w sytuacji, kiedy stwierdzamy występowanie zmniejszających się przyrostów np. dla względnego nasycenia rynku z powodu pojawiających się
produktów konkurencyjnych.
• logarytmiczna
yt = α + β ln t, β > 0
• potęgowa
yt = αtβ ,
• ilorazowa
yt =
αt
,
β+t
0<β<1
α, β > 0
W przypadku malejącego przyrostu ryzyko prognozowania jest mniejsze bo zmienne zachowują się dość stabilnie.
• logistyczna
yt =
α
,
1 + β exp−δt
α, δ > 0, β > 1
Funkcji logistycznej używamy kiedy zjawisko jest ograniczone do pewnej przestrzeni (np.
rozwój nowych gałęzi przemysłu). Najpierw następuje szybki wzrost, potem tempo maleje
do asymptoty wyznaczonej przez parametr alfa.
Określenie rodzaju trendu wymaga sporej ilości obserwacji. Postać funkcji dobiera się empirycznie, na podstawie analizy wykresu. Kiedy obserwacji nie ma zbyt wiele, do szeregu da
się dopasować więcej niż jedną funkcję. W takiej sytuacji wybieramy tę o najprostszej postaci
analitycznej.
Używając KMNK do szacowania parametrów trzeba pamiętać o sprowadzeniu równania do
postaci liniowej względem parametrów. Modele trendu mogą być (jak każde modele ekonometryczne) rozszerzane o zmienne zero-jedynkowe. Poniższy prosty przykład stanowi ilustrację
sposobu, w jaki wykonuje się prognozy w oparciu o model trendu.
Przykład prognoz dla funkcji ŷt = 2 + 3t w kilku wybranych okresach:
32 z 37
Ekonometria dla FiR
2.11
Opracował: dr Adam Kucharski
Okres (t)
Prognoza
1
2+3*1=5
3
2+3*3=11
10
2+3*10=32
12
2+3*12=38
Przykład estymacji modelu jednorównaniowego
Należy oszacować parametry liniowego modelu jednorównaniowego opisującego popyt na pewne
dobro (Y) w zależności od dochodów (X). Równanie to ma postać:
Yt = α0 + α1 Xt + εt
(22)
Zbadać jego jakość przy pomocy współczynnika determinacji oraz testu istotności. Zebrane dane
na temat zmiennych: objaśnianej (Y) i objaśniającej (X) w kolejnych okresach (t) są następujące:
Yt
5
6
7
7
8
9
Xt
3
3
5
4
6
7
Dane do zadania można zapisać w postaci macierzowej. Ponieważ w modelu występuje wyraz
wolny (α0 ) więc pierwsza kolumna macierzy obserwacji na zmiennych objaśniających składać
się będzie z samych jedynek.
 


5
1 3
 


 6 
 1 3 
 


 7 
 1 5 
 


Y =  X = 

 7 
 1 4 
 


 


 8 
 1 6 
9
1 7
Powyższe dane zostaną wykorzystane do estymacji parametrów modelu przy pomocy metody
najmniejszych kwadratów. Wzór na estymator parametrów jest następujący:
α = (XT X)−1 XT y
(23)
Na początek wyznaczymy macierz XT X:



"
#
1 1 1 1 1 1 

T
X X=

3 3 5 4 6 7 



1 3


1 3 
 "
#
1 5 
6 28

=
1 4 
28 144


1 6 
1 7
W następnym kroku należy macierz odwrócić. Skorzystamy w tym celu ze wzoru na odwracanie
macierzy dwa na dwa. Wyznacznik macierzy XT X jest równy 80 (6 ∗ 144 − 28 ∗ 28). Stąd macierz
odwrotna jest następująca:
"
# "
#
144
−28
1,8
−0,35
1
=
(XT X)−1 =
80 −28
6
−0,35 0,075
33 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Jako kolejny wyznaczymy wektor XT y:



"
#
1 1 1 1 1 1 

XT y =

3 3 5 4 6 7 



5


6 
 "
#
7 
42

=
7 
207


8 
9
Możemy teraz przystąpić do ostatniego kroku czyli szacowania parametrów. Podstawiamy do
wzoru (23):
"
#"
# "
#
1,8 −0,35
42
3,15
α=
=
−0,35 0,075
207
0,825
Otrzymaliśmy następujące równanie:
Ŷt = 3,15 + 0,825Xt
(24)
Parametr α0 = 3,15 oznacza, że w przypadku braku dochodu popyt wynosi 3,15 jednostki. Jest
to tzw. popyt autonomiczny. Parametr α1 = 0,825 oznacza, że wzrost dochodów o jednostkę pieniężną spowoduje wzrost popytu o 0,825 jednostki przy pozostałych warunkach niezmienionych.
W tym miejscu warto przyjrzeć się znakowi parametru przy zmiennej objaśniającej. Jest on
dodatni. Jako, że objaśniamy popyt przy pomocy wydatków, wydaje się logiczne oraz ekonomicznie uzasadnione, że ze wzrostem wydatków rośnie popyt na dane dobro. Taki właśnie znak
stoi przy Xt .
Mając oszacowane parametry można wyznaczyć teoretyczne wartości zmiennej objaśnianej.
Podstawiamy dochód z kolejnych okresów do (24). W efekcie obliczone zostaną wartości wynikające z równania linii regresji. Poniżej znajdują się przykładowe obliczenia dla pierwszych trzech
okresów.
ŷ1 = 3,15 + 0,825 ∗ 3 = 5,625
ŷ2 = 3,15 + 0,825 ∗ 3 = 5,625
ŷ3 = 3,15 + 0,825 ∗ 5 = 7,275
Jak widać wartości popytu wynikające z równania linii regresji różnią się od wartości rzeczywistych. Różnica:
et = yt − ŷt
(25)
nosi nazwę reszty z modelu. Poniżej znalazły się wszystkie wartości teoretyczne zmiennej objaśnianej oraz wszystkie reszty.
Yt
Ŷt
et
5
5,625
-0,625
6
5,625
0,375
7
7,275
-0,275
7
6,450
0,550
8
8,100
-0,100
9
8,925
0,075
34 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Współczynnik determinacji (oznaczany jako R2 ) służy do oceny dopasowania całego modelu
do danych rzeczywistych. Może więc być wyliczany bezpośrednio z reszt modelu lub na podstawie cząstkowych wyliczeń poczynionych jeszcze na etapie szacowania parametrów. W tym
drugim wypadku wykorzystuje się następujący wzór (z niego właśnie skorzystamy w niniejszym
przykładzie):
αT XT y − nȳ 2
(26)
R2 =
yT y − nȳ 2
Wyznaczymy kolejne składowe wzoru (26).
h
αT XT y = 3,15 0,825
i
"
42
207
#
= 303,075
 
5
 
6
 
h
i7
X
 
yt2 = 5 6 7 7 8 9   = 304
yT y =
7
t
 
 
8
9
Średnia arytmetyczna ze zmiennej objaśnianej (ȳ) wynosi 7, zaś liczba obserwacji (czyli n) równa
się 6. Podstawiamy do wzoru (26):
R2 =
303,075 − 6 ∗ 72
= 0,9075
304 − 6 ∗ 72
Interpretacja 1: Model objaśnia zachowanie się zmiennej objaśnianej w 90,75%.
Interpretacja 2: Zmienność zmiennej objaśnianej została wyjaśniona zmiennością zmiennych
objaśniających w 90,75%.
Wartość współczynnika determinacji rośnie ze wzrostem liczby zmiennych objaśniających, nie
można opierać się tylko i wyłącznie na nim. Z tego powodu analizę jakości oszacowań rozszerza
się o zbadanie własności pojedynczych estymatorów. Wykorzystamy do tego celu test istotności
t-Studenta. W teście tym występuje następujący zestaw hipotez:
H0 : αi = 0
H1 : αi 6= 0
Stawiamy więc hipotezę, że dany parametr jest równy zero (statystycznie nieistotny) wobec
hipotezy alternatywnej, która zakłada iż istotnie różni się on od zera. Sprawdzianem tego testu
jest statystyka:
α̂i
tαi =
(27)
σαi
σαi to odchylenie standardowe danego parametru.
Aby jednak skorzystać ze wzoru (27) należy najpierw wyznaczyć wariancję reszt. Wykorzystany zostanie następujący wzór (k – liczba szacowanych parametrów):
σe2 =
1
(yT y − αT XT y)
n−k
Po podstawieniu otrzymamy:
σe2 =
1
(304 − 303,075) = 0,23
6−2
35 z 37
(28)
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Odchylenie standardowe parametru oblicza się mnożąc wariancję reszt przez odpowiedni element
przekątnej główne macierzy (XT X)−1 , po czym wyciąga się pierwiastek. Jako, że oszacowano
dwa parametry, potrzebne będą dwa odchylenia standardowe.
p
σα0 = 0,23 ∗ 1,8 = 0,643
p
σα1 = 0,23 ∗ 0,075 = 0,131
Na ich podstawie obliczamy wartości statystyk t-Studenta:
3,15
= 4,9
0,643
0,825
=
= 6,3
0,131
tα0 =
tα1
Aby zweryfikować hipotezy o istotności każdego z parametrów, z tablic rozkładu t-Studenta
odczytujemy wartość krytyczną. Potrzebne do tego są dwa parametry: poziom istotności i liczba
stopni swobody. Poziom istotności przyjmiemy na poziomie 0,05 a liczba swobody to różnica
między liczbą obserwacji a liczbą szacowanych parametrów. W naszym przypadku wynosi ona
6 − 2 = 4. Wartość krytyczna odczytana z tablic wynosi 2,78. Porównujemy moduły statystyk
t-Studenta z wartością krytyczną:
|4,9| > 2,78
|6,3| > 2,78
W obu przypadkach moduły statystyk dla parametrów okazały się większe od wartości krytycznej. Oznacza to iż obie statystyki znalazły się w obszarze odrzucenia. Powiemy, że odrzucamy
hipotezę zerową na korzyść hipotezy alternatywnej, która mówi, że dany parametr istotnie różni
się od zera. Oznacza to na przykład, że Xt ma istotny wpływ na zachowanie się Yt .
1. Znaki przy parametrach są poprawne.
2. Wartość współczynnika determinacji wskazuje na wysoki poziom objaśnienia modelu.
3. Obydwa parametry okazały się istotne statystycznie.
Otrzymano więc wiarygodny model o dobrych własnościach statystycznych.
Badanie występowania autokorelacji zostanie przeprowadzone przy pomocy testu DurbinaWatsona. Sprawdza się w nim następujący zestaw hipotez:
H0 : ρ = 0
H1 : ρ 6= 0
Hipoteza zerowa zakłada brak autokorelacji i jest to sytuacja dla nas pożądana. W odróżnieniu,
przyjęcie hipotezy alternatywnej oznacza, że współczynnik korelacji jest istotnie różny od zera
i występuje autokorelacja składnika losowego.
36 z 37
Ekonometria dla FiR
Opracował: dr Adam Kucharski
Test Durbina-Watsona opiera się o wektor reszt z modelu. Na ich podstawie dokonuje się
najpierw obliczeń cząstkowych, które znalazły się w tabeli poniżej:
e2t
et
(et − et−1 ) (et − et−1 )2
−0,625
0,391
−
−
0,375
0,141
1,000
1,000
−0,275
0,076
−0,650
0,423
0,550
0,303
0,825
0,681
−0,100
0,010
−0.650
0,423
0,075
P
0,006
0,175
0,031
0,927
−
2,558
Teraz wystarczy tylko podstawić do wzoru i obliczyć wartość statystyki DW.
P
(et − et−1 )2
2,558
P 2
= 2,76
DW =
=
0,927
et
Wartość DW jest większa od dwóch więc sprowadzimy ją poniżej tej wartości:
DW ∗ = 4 − DW = 4 − 2,76 = 1,24
Przed dokonaniem interpretacji należy wyznaczyć, na podstawie tablic statystycznych, wartości
krytyczne rozkładu Durbina-Watsona. Potrzebne do tego parametry to:
1. liczba obserwacji (u nas n=6)
2. liczba szacowanych parametrów (u nas k=2)
UWAGA! Tablice konstruowane są od 15 obserwacji więc, z formalnego punktu widzenia, nie
możemy wykorzystać tego testu. Zrobimy to jednak, lecz wyłącznie w celu zapoznania się z
weryfikacją tego typu hipotez.
Przyjmijmy zatem, że dL = 0,98 a dU = 1,57. W takiej sytuacji wartość statystyki równa 1,24
znalazła się w obszarze niekonkluzywności testu (bo 0,98 < 1,24 < 1,57). Nie możemy stwierdzić, czy w modelu występuje autokorelacja czy nie. Gdyby statystyka obliczona na podstawie
reszt okazała się wyższa od dU wtedy stwierdzilibyśmy brak autokorelacji składnika losowego.
Statystyka DW mniejsza od dL oznacza występowanie autokorelacji składnika losowego.
Załóżmy teraz, że chcemy wykonać prognozę punktową na kolejne dwa okresy, czyli siódmy
i ósmy. Potrzebujemy do tego celu wartości dochodów w tych okresach. Niech będą dane15 :
X7∗ = 9 a X8∗ = 12. Prognozy popytu we wspomnianych okresach wyglądają następująco:
Y7∗ = 3,15 + 0,825 × 9 = 10,575
Y8∗ = 3,15 + 0,825 × 12 = 13,05
Zwróćmy uwagę na to, że parametry i postać równania w okresach prognozowanych nie uległy
zmianie. Nie rozstrzygaliśmy również, skąd pochodzą wartości zmiennej objaśniającej w okresach
siódmym i ósmym, gdyż nie stanowi to przedmiotu zainteresowania naszego przykładu.
15
„Gwiazdka” oznacza, że mamy do czynienia z prognozą.
37 z 37