wykładu
Transkrypt
wykładu
Ekonometria dla Finansów i Rachunkowości Dr Adam Kucharski Spis treści 1 Optymalizacja liniowa 1.1 Programowanie liniowe . . . . . . . . . . . 1.2 Metoda graficzna . . . . . . . . . . . . . . 1.3 Algorytm simplex . . . . . . . . . . . . . . 1.4 Wyceny dualne . . . . . . . . . . . . . . . 1.5 Zadanie transportowe . . . . . . . . . . . 1.6 Wybrane modyfikacje klasycznego zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . transportowego 2 Modele opisowe 2.1 Pojęcia podstawowe . . . . . . . . . . . . . . . 2.2 Równanie stochastyczne a deterministyczne . . 2.3 Metoda Najmniejszych Kwadratów . . . . . . . 2.4 Model regresji liniowej . . . . . . . . . . . . . . 2.5 Statystyczna weryfikacja jakości modelu . . . . 2.6 Autokorelacja składnika losowego . . . . . . . . 2.7 Weryfikacja merytoryczna . . . . . . . . . . . . 2.8 Zmienne zero-jedynkowe . . . . . . . . . . . . . 2.9 Modele ekonometryczne a prognozowanie . . . 2.10 Modele trendu . . . . . . . . . . . . . . . . . . 2.11 Przykład estymacji modelu jednorównaniowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 6 11 12 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 19 20 21 22 24 26 28 29 31 31 33 Ekonometria dla FiR 1 Opracował: dr Adam Kucharski Optymalizacja liniowa 1.1 Programowanie liniowe Problem decyzyjny istnieje wtedy kiedy zachodzą następujące okoliczności: 1. Pojawia się decydent (osoba lub grupa osób), który musi rozwiązać problem; 2. Decydent chce osiągnąć pewien cel; 3. Istnieją co najmniej dwa sposoby na osiągnięcie zakładanego celu; 4. Istnieje otoczenie, które wpływa na sposób rozwiązania problemu lub jego wynik. Proces podejmowania decyzji może zostać wsparty przez odpowiednio skonstruowane modele matematyczne zwane też modelami decyzyjnymi. Normalna jest tutaj sytuacja, w której należy dokonać wyboru pomiędzy wieloma możliwymi decyzjami, zwanymi decyzjami dopuszczalnymi. Dają one decydentowi szansę na spełnienie ograniczeń jakie często narzuca na przykład otoczenie. Przydatny staje się zestaw narzędzi pozwalający podjąć najlepszą z decyzji. Ostatnie zdanie oznacza, że decydent posługuje się pewnym kryterium, które pozwala mu odróżnić lepsze decyzje od gorszych. Na zbiorze decyzji dopuszczalnych określana jest tzw. funkcja kryterium (funkcja celu), dla której poszukuje się wartości największej lub najmniejszej. Zmienne zawierające w sobie konkretne decyzje nazywać będziemy zmiennymi decyzyjnymi. Programowanie liniowe (PL) zalicza się do znacznie szerszej grupy metod programowania matematycznego. Metody na nim bazujące są bardzo popularne ze względu na swoją prostotę oraz dlatego, że spora część innych modeli decyzyjnych da się przekształcić do postaci zadania PL. Charakteryzuje się ono tym, że zarówno funkcja celu oraz zbiór decyzji dopuszczalnych opisany przy pomocy równań i nierówności mają postać liniową. Ogólna postać takiego zadania jest następująca: f (x) = c1 x1 + c2 x2 + . . . + cn xn → max / min a11 x1 .. . ak1 x1 .. . am1 x1 + + + a12 x2 .. . ak2 x2 .. . + ... + + ... + + ... + a1n xn .. . 6 .. . b1 .. . akn xn .. . = .. . bk .. . funkcja celu ograniczenia + + ... + + am2 x2 + . . . + amn xn > bm x1 > 0, x2 > 0, . . . , xn > 0 warunki brzegowe Zmienne xj (j = 1, 2, . . . , n) są to właśnie zmienne decyzyjne. Dla uproszczenia zakładać będziemy, że wszystkie prawe strony ograniczeń są nieujemne (czyli bj > 0 dla j = 1, 2, . . . , m). Wypadkowa ograniczeń i warunków brzegowych tworzy zbiór rozwiązań dopuszczalnych. Poszukiwanie rozwiązania wiąże się z następującymi twierdzeniami: Twierdzenie 1.1 Zbiór rozwiązań dopuszczalnych zadania PL zbiorem domkniętym, wypukłym, o skończonej liczbie wierzchołków. Twierdzenie 1.2 Funkcja liniowa f (x) określona na domkniętym zbiorze wypukłym X, o skończonej liczbie wierzchołków osiąga swoją wartość największą (najmniejszą) w wierzchołku tego zbioru. Jeżeli wartość taką osiąga w więcej niż jednym wierzchołku, to osiąga ją również w każdym punkcie będącym wypukłą kombinacją takich wierzchołków. 2 z 37 Ekonometria dla FiR 1.2 Opracował: dr Adam Kucharski Metoda graficzna Jeżeli problem da się opisać przy pomocy tylko dwóch zmiennych decyzyjnych (x1 , x2 ) wówczas da się go rozwiązać graficznie. Metoda graficzna ma właściwie walory wyłącznie dydaktyczne, ponieważ dobrze ilustruje sposób poszukiwania rozwiązania optymalnego na zbiorze rozwiązań dopuszczalnych. Zbiór ten wyznacza się w prostokątnym układzie współrzędnych (ograniczonym do pierwszej ćwiartki ze względu na warunki brzegowe) wyznaczając część wspólną nierówności i równań tworzących ograniczenia zadania. W przypadku kiedy ograniczenia podane są wyłącznie jako nierówności, zbiór rozwiązań dopuszczalnych jest wielobokiem wypukłym. Poszukiwanie optymalnego rozwiązania można przeprowadzić na dwa sposoby: 1. Wyznaczyć współrzędne wszystkich wierzchołków zbioru i podstawić je do funkcji celu; 2. Wyznaczyć rozwiązanie w oparciu o gradient funkcji celu. Pierwsze z podejść przestaje być wygodne gdy liczba wierzchołków zbioru rozwiązań dopuszczalnych jest duża. Dlatego omówiony zostanie drugi sposób. Gradientem funkcji celu jest wektor zawierający pochodne f (x) względem zmiennych decyzyjnych. Tworzą go więc współczynniki funkcji celu. Gradient pokazuje kierunek najszybszego wzrostu wartości f (x) niezależny od wartości zmiennych decyzyjnych. Jeżeli współrzędne gradientu są zbyt małe lub zbyt duże, aby wygodnie umieścić go na rysunku, można pomnożyć gradient przez odpowiednio dobraną stałą. Gradient nanosi się na wykres, zaczepiając go w początku układu współrzędnych. Następnie wykreśla się prostą prostopadłą do gradientu (tzw. warstwicę) tak, aby przechodziła przez zbiór X. Poszukując wartości największej f (x) przesuwamy warstwicę równolegle w kierunku jaki pokazuje gradient (czyli oddalając się od początku układu współrzędnych) tak długo dopóki nie dotrzemy do ostatniego punktu (wierzchołka) przed opuszczenie zbioru X. Jest to właśnie punkt optymalny. Poszukując wartości najmniejszej postępuje się podobnie, z tą różnicą, że warstwicę przesuwamy w kierunku przeciwnym. Przykład zastosowania metody graficznej1 Mały zakład wytwarza dwa produkty A i B, których ceny zbytu wynoszą odpowiednio 3 zł/szt. oraz 4 zł/szt. Należy opracować dzienny plan produkcji zakładu tak, aby wartość produkcji liczona w cenach zbytu była możliwie największa. Produkcja jest limitowana głównie przez dwa czynniki: dostępny czas pracy maszyn i surowiec podstawowy. Dzienny limit czasu pracy maszyn wynosi 500 minut. Umowy z producentem surowca podstawowego wskazują, że każdego dnia zakład będzie miał do dyspozycji 350 kg tego surowca (bezpieczny poziom). Zakład jest zainteresowany takim programem dziennej produkcji, przy którym osiągał będzie zysk minimum 600 zł. Sztuka wyrobu A wymaga 1 minuty czasu pracy maszyn, natomiast sztuka wyrobu B – 2 minut. Na wyprodukowanie sztuki wyrobu A zużywa się 1 kg surowca specjalnego. Również sztuka wyrobu B wymaga 1 kg tego surowca. Jednostkowy zysk ze sztuki wyrobu A wynosi 2 zł/szt., a ze sztuki wyrobu B – 1 zł/szt. Model decyzyjny prezentuje się następująco: Zmienne decyzyjne: x1 – dzienna produkcja wyrobu A [szt.] x2 – dzienna produkcja wyrobu B [szt.] 1 Przykład pochodzi z: D. Miszczyńska, M. Miszczyński „Wybrane metody badań operacyjnych”, Wyższa Szkoła Ekonomiczno-Humanistyczna w Skierniewicach, Skierniewice 2002. 3 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Funkcja celu (wartość produkcji w cenach zbytu): w(x1 , x2 ) = w(x) = 3x1 + 4x2 → max [zł] Ograniczenia: maszyny: x1 + 2x2 6 500 [minuta] surowiec: x1 + x2 6 350 [kg] min. zysk: 2x1 + x2 > 600 [zł] Warunki brzegowe: x1 > 0, x2 > 0 [szt.] Rysunek 1 prezentuje zbiór rozwiązań dopuszczalnych. x2 600 zysk 500 400 surowiec 300 200 100 maszyny 100 200 300 400 500 600 x1 Rysunek 1: Zbiór rozwiązań dopuszczalnych dla przykładu Na rysunku 1 zaznaczamy gradient funkcji, którym jest następujący wektor: 3 ∇f (x) = 4 Ponieważ nie byłby on zbyt widoczny przy obecnej skali wykresu, jego składowe zostaną pomnożone przez 50. Na rysunku 2 znajduje się ilustracja poszukiwania optymalnego rozwiązania. Poszukujemy największej wartości funkcji celu, warstwica przesuwana jest zgodnie ze zwrotem gradientu. Ostatni punkt, w którym przecina zbiór rozwiązań dopuszczalnych znajduje się w punkcie (250, 100). Otrzymujemy więc następujące rozwiązanie: należy wyprodukować 250 sztuk wyrobu A i 100 sztuk wyrobu B, zapewni to zysk maksymalny w wysokości: 3*250+4*100=1050 zł. Powyższe rozwiązanie stanowi konkretny wierzchołek zbioru X. Dlatego nazywamy je pojedynczym, skończonym rozwiązaniem optymalnym. Oprócz niego mogą istnieć inne rodzaje rozwiązań, które zilustrują następne rysunki. 4 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski x2 600 500 G(300,400) 400 300 rozwiązanie optymalne 200 100 100 200 300 400 500 600 x1 Rysunek 2: Gradient i rozwiązanie przykładu Zadanie sprzeczne: Zadanie jest sprzeczne, kiedy nie uda się wyznaczyć części wspólnej ograniczeń, czyli zbioru rozwiązań dopuszczalnych. x2 x1 Rysunek 3: Zadanie sprzeczne Brak skończonego rozwiązania optymalnego: W sytuacji zaprezentowanej na powyższym rysunku nie jest możliwe znalezienie wartości największej funkcji celu2 . Zbiór rozwiązań dopuszczalnych nie jest bowiem w żaden sposób ograniczony w jego górnej części i nie będzie możliwe znalezienie punktu, w którym warstwica przechodzi przez tez zbiór po raz ostatni. Więcej niż jedno skończone rozwiązanie optymalne: W ostatniej z omawianych sytuacji warstwica (dla przypadku maksymalizacji funkcji celu) pokrywa się z całym bokiem wieloboku utworzonego z ograniczeń zadania. Wartość funkcji celu w różnych punktach A i B oraz na odcinku między nimi będzie taka sama. 2 Choć wyznaczenie wartości najmniejszej jest oczywiście możliwe. 5 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski x2 G x1 Rysunek 4: Brak skończonego rozwiązania optymalnego x2 G x1 Rysunek 5: Więcej niż jedno skończone rozwiązanie optymalne 1.3 Algorytm simplex W sytuacji, kiedy liczba zmiennych decyzyjnych jest większa niż 2 lub duża liczba ograniczeń utrudnia dokładne wyznaczenie zbioru rozwiązań dopuszczalnych, do poszukiwania optymalnej wartości funkcji celu używa się algorytmu simplex. Polega on na przebiegającym w określony sposób przeglądaniu rozwiązań bazowych (wierzchołków zbioru X) w celu znalezienia punktu, w którym funkcja celu osiąga wartość największą lub najmniejszą. Warto tu zwrócić uwagę na to, że metoda nie potrzebuje sprawdzać wszystkich rozwiązań wierzchołkowych. Algorytm wędruje od bieżącego do sąsiedniego wierzchołka, w którym wartość funkcji celu jest nie gorsza niż w poprzednim rozwiązaniu. Poniżej znalazł się schemat postępowania w tej metodzie: Przykład zastosowania algorytmu simplex Firma produkuje trzy wyroby: A, B i C, które wymagają obróbki na dwóch maszynach M1 i M2. Limity czasu pracy maszyn wynoszą odpowiednio: M1 – 200 godzin, M2 – 150 godzin. Czas pracy M1 potrzebny do wytworzenia jednej sztuki wyrobu A wynosi 2 minuty, wyrobu B – 2 minuty, wyrobu C – 3 minuty. Odpowiednio dla maszyny M2 mamy: A – 2 minuty, B i C po 1 minucie. Ceny zbytu za 1 sztukę wyrobu wynoszą: A – 4 zł, B – 3 zł, C – 5 zł. Należy ustalić 6 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski (1) Wybierz początkową bazę układu równań (2) Wyznacz rozwiązanie bazowe (6) Dokonaj wymiany wektorów w bazie (5) Wybierz wektor opuszczający bazę (3) Czy aktualne rozwiązanie jest optymalne? Tak Nie (4) Wybierz wektor wchodzący do bazy Stop Rysunek 6: Schemat postępowania w algorytmie simplex plan produkcji, który zapewni maksymalny utarg ze sprzedaży wyrobów, przy założeniu, że cała produkcja zostanie sprzedana. Model decyzyjny: x1 – wielkość produkcji wyrobu A [szt.] x2 – wielkość produkcji wyrobu B [szt.] x3 – wielkość produkcji wyrobu C [szt.] Z = 4x1 + 3x2 + 5x3 → max M1: 2x1 + 2x2 + 3x3 6 12000 [min.] M2: 2x1 + x2 + x3 6 9000 [min.] x1 > 0, x2 > 0, x3 > 0 [szt.] Choć powyższy model jest poprawny pod względem formalnym, to algorytm simplex wymaga, aby układ nierówności tworzących ograniczenia sprowadzić do postaci równań. Robi się to wg następujących reguł: • jeżeli k -te ograniczenie jest typu „6” wówczas wprowadzamy do niego dodatnią zmienną swobodną sk ; 7 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski • jeżeli k -te ograniczenie jest typu „>” wówczas wprowadzamy do niego ujemną zmienną swobodną sk oraz dodatnią zmienną sztuczną tk ; • jeżeli k -te ograniczenie jest typu „=” wówczas wprowadzamy do niego dodatnią zmienną sztuczną tk . Zmienne swobodne stoją w funkcji celu z parametrem 0. Zmienne sztuczne w funkcji celu stoją z parametrem −M (gdy funkcja jest maksymalizowana) lub +M (gdy funkcja celu jest minimalizowana), gdzie M jest pewną, bardzo dużą liczbą dodatnią. Model, w którym ograniczenia z nierówności zamieniono na równania nazywamy postacią kanoniczną. W naszym przykładzie wygląda ona następująco: Z = 4x1 + 3x2 + 5x3 + 0s1 + 0s2 → max 2x1 + 2x2 + 3x3 + s1 = 12000 2x1 + x2 + x3 + s2 = 9000 x1 > 0, x2 > 0, x3 > 0, s1 > 0, s2 > 0 Postępowanie w metodzie simplex przeprowadza się w specjalnych tablicach. Pierwszą z nich tworzymy na podstawie postaci kanonicznej modelu. Kolejne powstają wskutek stosownych przekształceń. Dokonamy teraz przedstawienia całości obliczeń, które zostaną następnie omówione. Nr iteracji 4 x1 3 x2 5 x3 0 s1 0 s2 Wartości zmiennych bazowych Ilorazy wyjścia 1 0 s1 0 s2 ∆j = cj − zj 2 2 4 2 1 3 3 1 5 1 0 0 0 1 0 12000 9000 0 4000* 9000 2/ 2 5 x3 0 s2 ∆j = cj − zj 1 0 0 1/ 3 1 − / 3 3 4000 5000 20000 6000 3750* −4 / 0 1 0 1 0 0 1/ 2 −1 / −1 /2 3/ 4 −1 /2 1500 3750 22500 3 cB Zmienne bazowe xB 5 x3 4 x1 ∆j = cj − zj 4/ 2/ 0 1 0 3 2/ 3 2/ 3 3 3 1 − / 1/ 2 1/ 4 3 −1 /2 4 −3 /2 (1) Wybór początkowej bazy Początkową bazą stają się wektory stojące przy zmiennych swobodnych i/lub sztucznych. Tworzą one macierz jednostkową, której wymiar równy jest liczbie ograniczeń. Tak więc w naszym przykładzie bazę początkową tworzą wektory parametrów stojących przy zmiennych s1 i s2 w iteracji 1: 1 0 pocz B = 0 1 Taką samą postać ma w tej chwili, kluczowa w późniejszych rozważaniach, macierz B −1 . (2) Wyznaczenie rozwiązania bazowego Rozwiązanie w pierwszej tablicy simpleksowej tworzą po prostu przepisane prawe strony ograniczeń. W kolejnych rozwiązaniach jest ono związane z aktualną bazą. Wartość funkcji 8 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski celu tworzy się w oparciu o aktualny wektor cB oraz wektor wartości rozwiązań bazowych. Prześledźmy proces jej obliczania na podstawie iteracji nr 2: 4000 = 5 ∗ 4000 + 0 ∗ 5000 = 20000 f (xB ) = (cB )T xB = 5 0 5000 (3) Ocena optymalności aktualnego rozwiązania Sprawdzenia optymalności rozwiązania dokonuje się w oparciu o tzw. wskaźniki optymalności. Oblicza się je dla wszystkich zmiennych znajdujących się w tablicy simpleksowej, przy czym dla zmiennych bazowych zawsze równają się one zero. Formuła ich wyznaczania jest następująca: ∆j = cj − zj = cj − m X cB i pij i=1 gdzie: cj – współczynnik w funkcji celu przy j -tej zmiennej, dla której obliczamy wskaźnik optymalności; cB i – współczynnik w funkcji celu przy i-tej zmiennej bazowej; pij – odpowiednia kolumna centralnej części tablicy simpleksowej. Wskaźnik optymalności dla zmiennej x1 w pierwszej iteracji obliczono więc następująco: ∆1 = 4 − (0 ∗ 2 + 0 ∗ 2) = 4 zaś dla zmiennej x3 w drugiej iteracji (gdzie była zmienną bazową): ∆3 = 5 − (5 ∗ 1 + 0 ∗ 0) = 0 Wartość ∆j dla zmiennej niebazowej można traktować jako różnicę między jednostkowym efektem a jednostkowym nakładem potrzebnym, aby dana zmienna miała zostać zmienną bazową. Na tej podstawie zbudowano kryterium optymalności bieżącego rozwiązania. Rozwiązanie uznajemy za optymalne gdy: ( ∀ j=1,2,...,n ∆j 6 0, gdy f (x) → max ∀ ∆ > 0, gdy f (x) → min j=1,2,...,n j Innymi słowy, rozwiązanie (dla przypadku maksymalizacji funkcji celu) uznajemy za optymalne kiedy wszystkie wskaźniki optymalności są niedodatnie lub nieujemne (dla przypadku minimalizacji funkcji celu). Jak nietrudno zauważyć, trzecia iteracja jest ostatnią, ponieważ wszystkie wskaźniki optymalności przyjęły wartości mniejsze lub równe zero (4) Wybór wektora wchodzącego do bazy Jeżeli aktualne rozwiązanie bazowe nie spełnia warunku optymalności, konieczna staje się wymiana wektorów bazowych. Najpierw wybierany jest wektor (towarzyszący odpowiedniej zmiennej), który znajdzie się w przyszłej bazie. Jako kryterium służą ponownie wskaźniki optymalności i ponownie występuje rozdział spowodowany kierunkiem optymalizacji. Do bazy wprowadzamy k -ty wektor taki, że: ( min (∆ ), gdy f (x) → max ∆k = ∆j>0 j max ∆ = (∆ ), gdy f (x) → min k ∆j<0 j Tak więc, jeśli funkcja celu jest maksymalizowana, wybieramy zmienną, dla której wskaźnik optymalności okazał się najwyższy spośród tych, które przyjęły wartość dodatnią. W iteracji 1 najwyższą wartość (czyli 5) posiadał wskaźnik optymalności dla zmiennej x3 . Tym samym, odpowiadająca mu zmienna stanie się zmienną bazową. 9 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski (5) Wybór wektora opuszczającego bazę Ponieważ bazę tworzy więcej niż jedna zmienna, należy zdecydować, która z nich nie znajdzie się w nowej bazie. Dla wektora wybranego w poprzednim kroku obliczamy tzw. ilorazy wyjścia. Należy tu zwrócić uwagę, że sposób ich wyliczania jest niezależny od kierunku kryterium. Z bazy usuwamy l -ty wektor taki, że: B xB xl min l = plk plk > 0 plk Zauważmy, że ilorazów wyjścia nie liczymy jeśli przyjdzie nam podzielić przez 0 lub ujemną składową. W przykładzie, dla iteracji pierwszej ilorazy wyjścia dla s1 i s2 oraz kryterium wyjścia są następujące: 12000 9000 = min(4000, 9000) = 4000 min , 3 1 Tak więc usuwamy z bazy zmienną s1 wraz z towarzyszącym jej wektorem. W przypadku uzyskania kilku identycznych minimalnych ilorazów wyjścia, najlepiej jest wybrać ten o największym dzielniku. Jeśli i to nie wystarczy, można wybrać pozycję o niższym i. (6) Wymiana wektorów w bazie Wymiany wektorów w bazie dokonuje się przy pomocy tzw. przekształceń elementarnych, które nie znajdują się w obszarze zainteresowań niniejszych zajęć, dlatego nie zostaną tutaj omówione. Wymiana wektorów kończy jedną, pełną iterację w algorytmie simplex. Po zakończeniu postępowania można przejść do interpretacji wyników. Prezentowany przykład zakończył się po trzech przebiegach, dając następujący wektor optymalnych wartości zmiennych: opt x1 3570 xopt 2 0 opt x = xopt = 1500 3 , fmax = 22500 opt 0 s1 0 sopt 2 Należy zatem wyprodukować 3750 sztuk wyrobu A i 1500 sztuk wyrobu C (nie należy produkować wyrobu B), co zapewni zysk maksymalny w wysokości 22500 zł. Limity czasu pracy maszyn zostaną wykorzystane w całości. W tym miejscu warto zwrócić uwagę na interpretację zmiennych swobodnych. Ich niezerowa wartość w rozwiązaniu optymalnym świadczy o: • niewykorzystaniu występującego limitu w przypadku gdy ograniczenie jest typu „6”; • przekroczeniu zakładanego poziomu w przypadku gdy ograniczenie jest typu „>”. Jedno, skończone rozwiązanie optymalne jest jednym z grupy potencjalnych wyników jakimi może się skończyć postępowanie w algorytmie simplex. Wyróżnimy jeszcze następujące: • zadanie jest sprzeczne, kiedy w rozwiązaniu optymalnym występuje zmienna sztuczna z niezerową wartością; • zadanie posiada więcej niż jedno skończone rozwiązanie optymalne, kiedy liczba wskaźników optymalności równych zero jest większa od liczby zmiennych bazowych; • zadanie nie posiada skończonego rozwiązania optymalnego, kiedy nie jest możliwe wyznaczenie ilorazów wyjścia, gdyż wszystkie składowe wektora wchodzącego do bazy są niedodatnie. 10 z 37 Ekonometria dla FiR 1.4 Opracował: dr Adam Kucharski Wyceny dualne Podanie optymalnych wartości zmiennych decyzyjnych i wartości funkcji celu nie wyczerpuje możliwości analizy wyników. Jedną z nich są tzw. wyceny (zmienne) dualne. Służą one do określania reakcji optymalnej wartości funkcji celu na zmiany wyrazów wolnych ograniczeń, bez konieczności ponownego rozwiązywania zadania. Zadanie dualne jest ściśle powiązane z podstawowym zadaniem, zwanym odtąd prymalnym (pierwotnym). Mówiąc prościej, powstaje ono z przekształcenia zadania pierwotnego. Do czekających nas analiz nie jest konieczna znajomość zasad budowy zadania dualnego. Wystarczy nam wiedza, że liczba zmiennych dualnych (oznaczymy je jako yi ) jest równa liczbie ograniczeń, czyli każdemu z ograniczeń odpowiada jedna zmienna dualna. Interesować nas też będzie konkretne rozwiązanie zadania dualnego, które otrzymamy na podstawie rozwiązania zadania pierwotnego. Twierdzenie 1.3 Dla danej pary zadanie prymalne-dualne prawdziwe jest tylko jedno z poniższych twierdzeń: 1. Jeżeli jedno z pary zadań posiada rozwiązanie optymalne, to posiada je również drugie z nich, przy czym optymalne wartości funkcji celu są sobie równe. 2. Jeżeli jedno z pary zadań nie posiada skończonego rozwiązania optymalnego, to drugie z nich jest sprzeczne3 . Twierdzenie 1.4 Jeżeli istnieje skończone rozwiązanie optymalne zadania pierwotnego względem bazy B, to rozwiązanie optymalne zadania dualnego dane jest wzorem: yopt = (cB )T B−1 Wykorzystując drugie twierdzenie wyznaczymy optymalne wartości zmiennych dualnych w rozpatrywanym przykładzie. Najpierw jednak potrzebujemy wiedzy o tym jak wyznaczyć B −1 . W tym celu przypomnijmy, że macierz B pocz , którą znamy z pierwszej tablicy simplex, powstawała jako macierz jednostkowa utworzona ze zmiennych s1 i s2 . W ostatniej tablicy simpleksowej odszukujemy wektory towarzyszące zmiennym, które tworzyły B pocz . Stąd wiemy, że: 1 /2 −1 /2 −1 B = 3/ −1 /4 4 Obliczamy teraz wyceny dualne (wektor (cB )T = [5 4] również pochodzi z ostatniej tablicy simpleksowej): 1 opt opt /2 −1 /2 = 1,5 0,5 y1 y2 = 5 4 1 3 − /4 /4 Ogólna interpretacja zmiennej dualnej mówi, że: jeżeli w i-tym ograniczeniu wyraz wolny bi wzrośnie o jednostkę, to optymalna wartość funkcji celu wzrośnie (spadnie) o yiopt jednostek. Zinterpretujmy wycenę dualną y1opt dla ograniczenia czasu pracy maszyny M1: Jeżeli limit czasu pracy maszyny M1 wzrośnie o 1 minutę, to zysk optymalny wzrośnie o 1,5 zł. Zwróćmy uwagę, że miano powyższej zmiennej dualnej jest następujące: [zł zysku/ minutę]. 3 Twierdzenie odwrotne nie jest prawdziwe, ponieważ gdy jedno zadanie jest sprzeczne, drugie może być także sprzeczne lub może nie posiadać skończonego rozwiązania optymalnego. 11 z 37 Ekonometria dla FiR 1.5 Opracował: dr Adam Kucharski Zadanie transportowe Jednym z możliwych typów problemów z jakimi mamy do czynienia w ramach programowania liniowego jest problem jak najtańszego przewozu dobra pomiędzy punktami nadania (dostawcy) a punktami odbioru (odbiorcy). Należy podkreślić, że dobro jest jednorodne, a więc nie ma (znanego np. z metody simplex) podziału na poszczególne produkty. Wprowadźmy następujące oznaczenia: xij – ilość dobra przewożonego na trasie między i -tym nadawcą a j -tym odbiorcą; ai – zasób dobra w i -tym punkcie nadania; bj – zapotrzebowanie na dobro w j -tym punkcie odbioru; cij – jednostkowy koszt przewozu na trasie między i -tym nadawcą a j -tym odbiorcą; i = 1, . . . , m j = 1, . . . , n. Łączną ilość dobra dostępną we wszystkich punktach nadania przywykło się określać mianem podaży zaś łączną ilość dobra, na które jest zapotrzebowanie we wszystkich punktach odbioru nazwiemy popytem. Klasyczne zadanie transportowe podlega następującym założeniom: 1. przewożone dobro jest jednorodne; 2. podaż jest nie mniejsza niż popyt; 3. przepustowości tras są nieograniczone. Klasyczne zadanie transportowe może wystąpić w jednej z dwóch odmian: 1. zadanie zamknięte (zbilansowane), w których podaż jest równa popytowi; 2. zadania otwarte (niezbilansowane), w których podaż jest większa niż popyt4 . Każde zadanie otwarte da się przekształcić do zadania zamkniętego poprzez wprowadzenie dodatkowego, fikcyjnego odbiorcy (zwanego magazynem). Zapotrzebowanie tego odbiorcy jest równe różnicy między podażą a popytem. Koszt przewiezienia do magazynu traktujemy jako znikomo mały w porównaniu z kosztami przewozu między nadawcami a odbiorcami i dlatego przyjmujemy, że jest równy zero. W klasycznym algorytmie transportowym rozwiązuje się następujący problem optymalizacyjny: należy znaleźć taki plan przewozu dobra, aby łączny koszt transportu ze wszystkich punktów nadania do wszystkich punktów odbioru był jak najmniejszy. Każdy nadawca wysłać ma całą posiadaną masę dobra (w zadaniach otwartych część trafi do magazynu), zaś zapotrzebowanie każdego z odbiorców ma zostać zaspokojone w całości. Model decyzyjny (dla zadania zamkniętego) można zapisać następująco: K(x) = n X m X cij xij → min i=1 j=1 n X j=1 m X = ai , i = 1, . . . , m = bj , j = 1, . . . , n i=1 xij > 0 Twierdzenie 1.5 Jeżeli ai oraz bj są liczbami nieujemnymi to zadanie transportowe zawsze ma rozwiązanie. 4 Zakładamy, że w gospodarce rynkowej podaż jest na tyle elastyczna, że natychmiast dostosowuje się do wzrostu popytu. 12 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Twierdzenie 1.6 Jeżeli ai oraz bj są liczbami całkowitymi to każde dopuszczalne rozwiązanie bazowe zadania transportowego również przyjmuje wartości całkowite. Z głębszych analiz zadania transportowego wypływa bardzo ważny wniosek: optymalny (jednoznaczny) program przewozowy wykorzystuje nie więcej niż m+n-1 spośród m × n tras przewozowych. Przykładowe zadanie transportowe Trzy gospodarstwa rolne (oznaczone przez D1, D2 i D3) dostarczają zboże do trzech punktów skupu (oznaczonych O1, O2, O3) Agencji Rynku Rolnego, ponosząc przy tym koszty transportu. Ilość zboża jakim dysponują gospodarstwa (w tonach), pojemność spichlerzy Agencji (w tonach) a także jednostkowe koszty transportu (zł/t) podaje poniższa tabela. Należy opracować taki plan przewiezienia zboża, aby łączny koszt przewozu był jak najmniejszy. Gospod. 1 Gospod. 2 Gospod. 3 Zapotrzebowanie odbiorców Skup 1 Skup 2 Skup 3 5 3 3 40 8 6 4 60 6 5 3 60 Zasoby u dostawców 60 10 90 160 W powyższym przykładzie mamy więc 3 punkty nadania i 3 punkty odbioru. Daje to 9 możliwych tras, którymi zboże może zostać przewiezione między poszczególnymi gospodarstwami a punktami skupu. Tym niemniej do znalezienia rozwiązania wykorzystamy nie więcej niż 3+31=5 tras. Zwróćmy również uwagę, że podaż jest równa popytowi (wynosi 160 t) czyli mamy do czynienia z zadaniem zamkniętym. Wektor podaży a, popytu b oraz macierz kosztów jednostkowych C są następujące: 60 5 8 6 a = 10 , b = 40 60 60 , C = 3 6 5 90 3 4 3 Model decyzyjny tego zadania zaprezentowano poniżej: 5x11 +8x12 +6x13 +3x21 +6x22 +5x23 +3x31 +4x32 +3x33 → min x11 +x12 +x13 = 60 x21 +x22 +x23 = 10 x31 +x32 +x33 = 90 x11 +x21 +x31 = 40 x12 +x22 +x32 = 60 x13 +x23 +x33 = 60 x11 > 0, x12 > 0, x13 > 0, x21 > 0, x22 > 0, x23 > 0, x31 > 0, x32 > 0, x33 > 0 Do rozwiązania powyższego zadania można użyć algorytmu simplex. Jednak duże rozmiary modelu, które wzrosną jeszcze po sprowadzeniu do postaci kanonicznej5 . powodują, że nie jest to podejście zbyt efektywne. Dlatego właśnie opracowano specjalny algorytm numeryczny służący rozwiązywaniu takich zadań. Wprowadźmy oznaczenia: ui – zmienna dualna dla i -tego dostawcy; vj – zmienna dualna dla j -tego odbiorcy. 5 Z każdym z ograniczeń związana jest bowiem jedna zmienna sztuczna 13 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Wskaźnik optymalności dla algorytmu transportowego jest równy: ∆ij = cij − (ui + vj ) Podobnie jak to miało miejsce w przypadku algorytmu simplex o minimalizowanej funkcji celu, plan przewozowy uznajemy za optymalny, kiedy wskaźniki optymalności dla wszystkich tras spełnią warunek: ∆ij > 0. Aby jednak wyznaczyć wskaźniki optymalności, należy poznać wszystkie wartości ui oraz vj . Wykorzystuje się w tym celu fakt, że dla zmiennych bazowych ∆ij są równe zero. W metodzie transportowej zmiennymi bazowym są trasy, na których dokonuje się przewozu, których liczba wynosi m + n − 1. Konstruuje się na tej podstawie układ równań, w którym ui oraz vj są niewiadomymi. Ponieważ liczba niewiadomych jest o 1 większa od liczby równań, należy przyjąć wartość zerową dla jednej z nich. Zazwyczaj przyjmuje się u1 = 0. Postępowanie w algorytmie transportowym obrazuje następujący schemat: nie gorsza niż w poprzednim rozwiązaniu. Na rysunku 7 znalazł się schemat postępowania w tej metodzie. (1) Ustal początkowy plan przewozu (6) Skoryguj program przewozowy (5) Określ maksymalny przewóz na trasie ustalonej w (3) Tak (2) Czy aktualny plan przewozu jest optymalny? Nie (4) Utwórz cykl korygujący (3) Wybierz trasę dającą największą obniżkę kosztów Stop Rysunek 7: Schemat postępowania w algorytmie transportowym Obliczenia przeprowadzać będziemy równolegle w dwóch tabelach. W jednej znajdzie się aktualny plan przewozowy, a w drugiej sprawdzenie jego optymalności. (1) Ustalenie początkowego planu przewozowego Każdy plan przewozowy, wliczając w to również plan początkowy, zawierać będzie nie więcej niż 3+3-1=5 tras. W metodzie transportowej nie ma jednoznacznego (jak w algorytmie simplex) sposobu określenia pierwszego rozwiązania. Spośród wielu dostępnych, skupimy się ma metodzie kąta północno-zachodniego. Jest to najprostsza z metod opierająca się wyłącznie na popycie i podaży u poszczególnych odbiorców i dostawców. Jej nazwa wzięła się stąd, że pierwszy przewóz ustalany jest zawsze na 14 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski trasie od pierwszego dostawcy do pierwszego odbiorcy. Wprowadzamy tam mniejszą z dwóch wartości a1 i b1 . W naszym przykładzie pierwszy krok w tej metodzie znalazł się w tabeli 1. Tabela 1: Początek postępowania w metodzie kąta północno-zachodniego O1 O2 O3 podaż D1 40 60 D2 10 D3 90 popyt 40 60 60 160 Dostawca 1 (D1) przewiezie 40 t zboża do odbiorcy 1, przy czym zapotrzebowanie tego odbiorcy zostaje zaspokojone w całości. Jednakże D1 pozostało do rozdysponowania jeszcze 20 t dobra. Dostanie je odbiorca O2, który potrzebuje 60 t (patrz tabela 2). Brakującą mu do 60 t ilość dostarczą: D2 (10 t) i D3 (30 t). Postępując w ten sposób otrzymamy następującą tabelę 3. Jak widać rozwieziona została cała dostępna ilość zboża (40+20+10+30+60=160t), przy czym Tabela 2: Rozdysponowanie podaży dostawcy D1 O1 O2 O3 podaż D1 40 20 60 D2 10 D3 90 popyt 40 60 60 160 Tabela 3: Pierwszy plan przewozowy, O1 O2 D1 40 20 D2 10 D3 30 popyt 40 60 uzyskany metodą kąta płn-zach O3 podaż 60 10 60 90 60 160 wykorzystano 5 tras. Łączny koszt przewozu wynosi: 40 ∗ 5 + 20 ∗ 8 + 10 ∗ 6 + 30 ∗ 4 + 60 ∗ 3 = 720zł (2) Sprawdzenie optymalności rozwiązania Rozwiązanie uznajemy za optymalne jeżeli wszystkie wskaźniki optymalności są nieujemne. Przypomnijmy, że wskaźniki te dla zmiennych bazowych są równe zero. Budowa tabeli zawierającej owe wskaźniki (tzw. tabeli wskaźników) wygląda następująco: • pole odpowiadające niezerowemu przewozowi zawiera jednostkowy koszt przewozu; • pole odpowiadające trasie niebazowej zawiera dwie liczby: sumę ui i vj oraz wskaźnik optymalności. Rozpoczynamy od przepisania odpowiednich elementów macierzy C oraz przyjęcia, że u1 = 0: Wartości ui oraz vj znajdujemy w następujący sposób: suma wartości obu zmiennych dualnych musi dać koszt cij znajdujący się już w tabeli dla tras stanowiących bieżące rozwiązanie. Stąd v1 obliczymy jak poniżej: v1 + u1 = 5 ⇒ v1 + 0 = 5 ⇒ v1 = 5 15 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Tabela 4: Pierwszy krok tworzenia tabeli wskaźników v1 v2 v3 wartości ui u1 5 8 0 u2 6 u3 4 3 wartości vj Podobnie wyznaczymy v2 : v2 + u1 = 8 ⇒ v2 + 0 = 8 ⇒ v2 = 8 Zauważmy, że kolejność obliczania zmiennych dualnych nie jest dowolna, lecz wynika z wcześniej wyznaczonych wartości. Dlatego na przykład dopiero znając v2 możemy poznać u2 . Kompletna tabela wskaźników została zaprezentowana poniżej: Tabela 5: Końcowa postać tabeli wskaźników v1 v2 v3 wartości ui u1 5 8 7 0 -1 u2 3 6 5 -2 0 0 u3 1 4 3 -4 2 wartości vj 5 8 7 Lewa górna część pola zawiera sumę zmiennych dualnych z odpowiedniego wiersza i kolumny, prawa dolna – wskaźnik optymalności. Bieżącego planu przewozowego nie można uznać za optymalny ponieważ wszystkie wskaźniki nie są nieujemne. Konkretnie, dla trasy (1,3) otrzymaliśmy wartość równą -1. (3) Wybór trasy dającej największą obniżkę kosztów Spośród tras niebazowych, wyłącznie tych posiadających ujemne wskaźniki optymalności, wybieramy tę, dla której wskaźnik osiągnął najniższą wartość. W naszym przypadku jest tylko jeden możliwy wybór – trasa (1,3). (4) Cykl korygujący W kolejnym kroku postępowania budujemy cykl korygujący. W polu wytypowanym w poprzednim kroku stawiamy znak „+” traktując je odtąd jako bazowe. Następnie wykreślamy te wiersze i kolumny, które zawierają pojedyncze przewozy. Pamiętajmy, że trasa oznaczona plusem traktowana jest tak jakby przewożono tą trasą część dobra. Może się poza tym zdarzyć, że po wykreśleniu danego wiersza (kolumny) kolejna kolumna (wiersz) zawierać będzie pojedynczy przewóz. Wówczas należy ową kolumnę czy też wiersz również wykreślić. W naszym przykładzie wykreślamy: kolumnę O1 i wiersz D2. 16 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Tabela 6: Wybór trasy w O1 O2 D1 40 20 D2 10 D3 30 popyt 40 60 cyklu korygującym O3 podaż + 60 10 60 90 60 160 Nieskreślonym przewozom przypisujemy znak „+” lub „–” tak, aby wszystkie dopisane w ten sposób znaki znosiły się nawzajem. Otrzymamy: Tabela 7: Wybór trasy w cyklu korygującym O2 O3 podaż D1 20 – + 60 D3 popyt 30 + 60 60 – 60 90 160 (5) Określenie maksymalnego przewozu na trasie wybranej w kroku (3) Wybrany przewóz ma być z jednej strony jak największy, z drugiej zaś nie można dopuścić do pojawienia się w tabeli wartości ujemnych, gdyż naruszałoby to nałożone wcześniej warunki brzegowe. Dlatego ograniczymy się tylko do tras oznaczonych minusem i wybierzemy najniższy z dostępnych tam przewozów. W naszym przykładzie: k = min(20, 30) = 20. Łączny koszt przewozu zmniejszy się o wartość: k ∗ ∆13 = 20 ∗ (−1) = −20 i wyniesie: 720-20=700 zł (6) Korekta planu przewozowego Cykl korygujący przebiega wyłącznie przez pola oznaczone wcześniej plusem lub minusem. Te pierwsze zostają powiększone o wartość k, zaś te drugie zmniejsza się o tę wielkość. Oto nowy plan przewozowy o niższej wartości kosztu całkowitego oraz towarzysząca mu tabela wskaźników: Tabela 8: Drugi plan przewozowy wraz z cyklem korygującym O1 O2 O3 podaż D1 40 – 20 + 60 D1 + 10 – 10 K =700 D3 50 + 40 – 90 popyt 40 60 60 160 Jak widać, powyższy plan przewozowy nie okazał się jeszcze optymalny (ujemna wartość wskaźnika optymalności równa -1). Dlatego należy poprawić rozwiązanie, wprowadzając przewóz na trasie (2,1). Zwróćmy uwagę, że w tabeli 8 nie można dokonać skreśleń wierszy i kolumn z pojedynczymi przewozami. Nowy koszt przewozu zmniejszy się o 10*(-1)= -10. Kolejna iteracja dała optymalny plan przewozowy, który można zapisać: 30 0 30 Xopt = 10 0 0 0 60 30 17 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Tabela 9: Tabela wskaźników dla 2 iteracji v1 v2 v3 wartości ui u1 5 7 6 0 1 u2 4 6 5 -1 -1 0 u3 2 4 3 -3 1 wartości vj 5 7 6 Tabela 10: O1 D1 30 D1 10 D3 popyt 40 Optymalny plan przewozowy O2 O3 podaż 30 60 10 Kmin = 690 60 30 90 60 60 160 Tabela 11: Tabela wskaźników dla ostatniej iteracji v1 v2 v3 wartości ui u1 5 7 6 0 1 u2 3 5 4 -2 1 1 u3 2 4 3 -3 1 wartości vj 5 7 6 UWAGA! Jeżeli w tabeli wskaźników dla rozwiązania optymalnego, wystąpią wskaźniki optymalności równe zero dla zmiennych niebazowych, oznacza to, że istnieją jeszcze inne, alternatywne plany przewozu o tej samej, minimalnej wartości łącznego kosztu. 1.6 Wybrane modyfikacje klasycznego zadania transportowego Założenia występujące w klasycznym wariancie zadania transportowego mogą być uchylane. Przedstawimy tutaj dwa przypadki: 1. Całkowitą blokadę trasy (tras); 2. Częściową blokadę trasy (tras). Całkowita blokada trasy Załóżmy, że na trasie z pierwszego gospodarstwa do pierwszego punktu skupu pojawiła się blokada rolników niezadowolonych z cen skupu. Nie jest możliwe przewiezienie zboża na tej trasie, ale zapotrzebowanie punktu skupu musi zostać spełnione, zaś gospodarstwo musi wysłać swoje zboże. Całkowita blokada na jednej lub większej ilości tras oznacza, że przewóz tam realizowany jest całkowicie nieopłacalny. Należy o tym „poinformować” algorytm. Robi się to w ten sposób, że 18 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski na zablokowanej trasie wprowadza się bardzo wysoką (w porównaniu z pozostałymi, niezablokowanymi trasami) wartość jednostkowego kosztu przewozu6 . Wprowadzamy więc na interesującej nas trasie koszt równy przykładowo 50 zł/t. 50 8 6 C = 3 6 5 3 4 3 Od tego miejsca zadanie rozwiązuje się tak jak klasyczne zadanie transportowe. Częściowa blokada trasy Załóżmy, że na trasie z trzeciego gospodarstwa do drugiego punktu skupu odbywa się remont drogi. Z tego powodu można nią przewieźć co najwyżej 20 t zboża. Powyższy warunek różni się od poprzedniego przypadku, ponieważ część dobra może zostać daną trasą przewieziona po normalnie obowiązujących kosztach. Reszta musi zostać rozwieziona innymi trasami. Problem ten można rozwiązać dwojako: 1. rozszerzyć na czas rozwiązywania liczbę dostawców; 2. rozszerzyć na czas rozwiązywania liczbę odbiorców. W pierwszym przypadku zmieniamy macierz kosztów C oraz wektor podaży a: 5 8 6 60 10 , C = 3 6 5 a= 3 4 3 20 3 50 3 70 W drugim zmieniamy macierz C i wektor popytu b: 5 8 8 6 b = 40 20 40 60 , C = 3 6 6 5 3 4 50 3 Dla tej części dobra, która nie zmieści się na częściowo zablokowanej trasie, wprowadzana jest blokada całkowita. Należy jednak pamiętać, że wiersze 3 i 4 w pierwszym podejściu dotyczą jednego dostawcy, zaś kolumny 2 i 3 w drugim podejściu dotyczą jednego odbiorcy. Zadanie rozwiązuje się tak, jak wariant klasyczny. Dopiero podając odpowiedź scalamy uprzednio rozdzielone wiersze i kolumny, wracając do poprzednich rozmiarów zadania. 2 Modele opisowe 2.1 Pojęcia podstawowe Model opisowy stanowi uproszczony sposób opisywania skomplikowanych zjawisk. Odwzorowuje te elementy, które są ważne z punktu widzenia prowadzonej analizy. Pomija się te, które wydają się nieistotne. Ma to swoje zalety, ale również wady. Oznacza bowiem konieczność przyjmowania odnośnie badanych zjawisk silnych założeń, których spełnienie bywa utrudnione. Punktem wyjścia ekonomicznych modeli opisowych są istniejące teorie ekonomiczne, często skomplikowane lub wręcz abstrakcyjne. Należy pamiętać, że same teorie podlegają zmianom w 6 W literaturze można spotkać zalecenie, aby był on przynajmniej trzykrotnie wyższy niż najwyższy koszt występujący w macierzy. 19 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski czasie (np. z powodu politycznego i społecznego zaangażowania samych ekonomistów) co rzutuje na samą budowę modeli. „Techniczną” stroną tego procesu zajmuje się zaś ekonometria. Korzenie tej dziedziny tkwią w ekonomii matematycznej oraz statystyce matematycznej – przede wszystkim w zjawisku korelacji zmiennych. Model ekonometryczny to równanie lub układ równań (wraz z towarzyszącymi założeniami) opisujące związki między wybranymi zmiennymi. Cele, dla których sięga się po tego typu modele dadzą się streścić następująco: 1. poznanie zachowań i zależności łączących podmioty ekonomiczne oraz poznanie funkcjonowania układów gospodarczych; 2. porządkowanie informacji statystycznych pozwalające wyodrębnić trendy, wahania sezonowe i losowe; 3. testowanie hipotez ekonomicznych; 4. prognozowanie zjawisk ekonomicznych i przeprowadzanie analiz polityk gospodarczych; Modele opisowe zazwyczaj bazują na danych statystycznych, często zagregowanych, zniekształconych przez błędy obserwacji. Dane te nie pochodzą z kontrolowanych eksperymentów.7 Ewentualne ich poprawienie nie jest możliwe, a stanowią jedyną dostępną rejestrację statystyczną zachowania się zjawisk lub podmiotów ekonomicznych. Dlatego musimy przyjmować założenia, z których części nie da się nawet zweryfikować. Dane statystyczne mają zazwyczaj postać szeregów należących do jednej z poniższych kategorii (najczęściej spotyka się pierwsze z nich): 1. szeregi czasowe; 2. szeregi przekrojowe; 3. szeregi przekrojowo-czasowe; 2.2 Równanie stochastyczne a deterministyczne Wykorzystanie danych statystycznych, zebranych jako obserwacje dokonane na konkretnych obiektach powoduje, że przykładowa zależność między dochodem (Y) a konsumpcją (C) dla kolejnych obserwacji może wyglądać jak na rysunku 8. Na podstawie wykresu widać, że do jego opisu nie da się użyć żadnej elementarnej i deterministycznej funkcji matematycznej, choć chmura punktów wskazuje na istnienie zależności o charakterze liniowym. Zachowanie się obu przedstawionych wielkości ekonomicznych względem siebie wymaga wprowadzenia pewnej dodatkowej zmiennej, wyjaśniającej odchylenia punktów odpowiadających obserwacjom od funkcji liniowej. Dlatego równanie opisujące zależność między konsumpcją a dochodem zapiszemy następująco: Ci = α0 + α1 Yi + εi (1) Indeks i oznacza, że konsumpcja i dochód mają postać szeregów statystycznych. Symbol εi nazywamy składnikiem losowym równania. Wprowadzenie go dało możliwość sięgnięcia po prostą funkcję liniową, jako sposób opisania zależności między badanymi zmiennymi. Równanie, w którym wprowadzono składnik losowy nazywamy stochastycznym. Przyczyny uwzględniania składnika losowego w modelach ekonometrycznych są następujące: 1. indeterminizm zachowania się zjawisk (lub podmiotów) ekonomicznych; 2. niedoskonałości pomiaru, które zawierają się w εi ; 3. wady w konstrukcji modelu np błędy w specyfikacji czy niepoprawna postać funkcyjna; 7 Jak to jest możliwe w naukach eksperymentalnych takich jak fizyka czy chemia. 20 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski C 6 • • • • • • • • •• • • • • • - Y Rysunek 8: Przykładowa zależność między konsumpcją a dochodem (1) C 6 • • (2) • (3) • • • • •• • • • • • • - Y Rysunek 9: Możliwe funkcje liniowe dla modelu konsumpcji 2.3 Metoda Najmniejszych Kwadratów Choć postać równania (1) jest poprawna, nie znamy jego parametrów (to sytuacja odwrotna w porównaniu do modeli optymalizacyjnych). Każda z trzech zaprezentowanych na kolejnym wykresie funkcji jest liniowa i teoretycznie nadaje się do opisu zależności między konsumpcją a dochodem. Należy znaleźć te parametry, które dadzą najbardziej satysfakcjonującą postać funkcji z punktu widzenia pewnego przyjętego kryterium. Analizując rysunek 9 nasuwa się stwierdzenie, że najlepszą będzie funkcja przebiegająca jednocześnie „najbliżej” wszystkich punktów. Wydaje się, że jest to funkcja numer 2, ale powstaje pytanie: jak zyskać pewność co do dokonanego wyboru? Należy zbadać odległości dzielące rzeczywiste punkty od naszej hipotetycznej prostej i wybrać wariant o najmniejszych zmierzonych w ten sposób błędach. Minimalizuje się więc pewną funkcję kary, która przyjmuje wartości tym większe im wspomniana odległość jest większa. Ponieważ jednak punkty leżą tak nad jak i pod prostą, więc nie można użyć prostej sumy popełnianych błędów gdyż wartości dodatnie będą znosić się z ujemnymi. Spośród różnych dostępnych wariantów, niewątpliwie najpopularniejszą jest minimalizacja sumy kwadratów odległości punktów od prostej. Stąd też wzięła się jej nazwa – Metoda Naj- 21 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski mniejszych Kwadratów (MNK). Używając tej metody możliwa jest estymacja parametrów modelu stochastycznego. Nie wchodząc w matematyczne szczegóły dotyczące wyprowadzenia, wzór pozwalający otrzymać oszacowania parametrów równania przy pomocy MNK jest następujący: α̂ = (XT X)−1 XT y (2) gdzie: α̂ – wektor oszacowań parametrów równania; X – macierz obserwacji na zmiennych objaśniających; y – wektor obserwacji na zmiennej objaśnianej; Wektor α̂ zawiera liczbowe wartości oszacowanych parametrów, które wskażą najkorzystniejszą dla danych obserwacji postać funkcji. Estymacja to jednak tylko jeden (i to wcale nie pierwszy) z etapów analizy ekonometrycznej. Badanie tego typu da się podzielić na następujące fazy: 1. Specyfikacja zmiennych i relacji modelu: • określenie celu badania; • wybór zmiennych • wybór postaci analitycznej modelu na podstawie: – teorii ekonomii; – zebranych danych i posiadanego doświadczenia; – związków korelacyjnych między zmiennymi; 2. Gromadzenie danych statystycznych; 3. Estymacja parametrów; 4. Weryfikacja modelu: • statystyczna; • merytoryczna; 5. Praktyczne wykorzystanie modelu: • analiza zależności; • wnioskowanie o przyszłości; 2.4 Model regresji liniowej Naturalną tendencją podczas budowy modeli jest dążenie do możliwie najprostszego sposobu opisu zjawiska. Stąd wzięło się częste sięganie po liniową postać regresji jako najlepiej odpowiadającą temu założeniu. Okazuje się, że w sporej liczbie przypadków takie podejście zdaje egzamin. Aby jednak można było użyć MNK do estymacji parametrów modelu liniowego, konieczne jest spełnienie określonych założeń zwanych założeniami schematu Gaussa-Markowa: 1. model jest niezmienniczy ze względu na obserwacje (parametry i postać funkcji nie ulegają zmianie); 2. model jest liniowy względem parametrów8 ; 8 Należy zauważyć, że model musi być liniowy względem parametrów, ale nie względem zmiennych. Dzięki temu używa się modeli nieliniowych sprowadzanych przy pomocy stosownych przekształceń do postaci liniowej. 22 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski 3. zmienne objaśniające są nielosowe, a ich wartości są ustalonymi liczbami rzeczywistymi; 4. składnik losowy ma rozkład normalny; 5. wartość oczekiwana składnika losowego jest równa 0 (zakłócenia mają tendencję do wzajemnego znoszenia się); 6. składnik losowy jest sferyczny – macierz wariancji-kowariancji D2 (εi ) jest diagonalna, o takich samych elementach na przekątnej głównej9 ; 7. informacje zawarte w próbie są jedynymi, na podstawie których estymuje się parametry modelu; 8. liczba obserwacji powinna być wyższa niż liczba szacowanych parametrów. Część powyższych założeń dotyczy (wprowadzonego wcześniej) składnika losowego, który stanowi abstrakcyjny sposób wyjaśniania takiego a nie innego zachowania się obserwacji. W konsekwencji nie jesteśmy w stanie poznać składnika wprost, znamy za to jego przybliżenie – resztę z modelu. Równanie po oszacowaniu (dla przypadku jednej zmiennej objaśniającej) ma postać: Ŷi = α̂0 + α̂1 Xi (3) Daszek nad parametrami oznacza, że są to już konkretne wartości, dlatego w równaniu (3) nie występuje składnik losowy. Podstawiając do równania obserwacje jakimi dysponujemy dla zmiennej X otrzymamy wartości Y wynikające z równania (czyli Ŷi ) zwane wartościami teoretycznymi zmiennej objaśnianej. Oczywiście nie będą one dokładnie odpowiadać rzeczywistym realizacjom tej zmiennej, ponieważ większość punktów leży powyżej lub poniżej linii regresji. Występującą w tej sytuacji różnicę: ei = Yi − Ŷi (4) nazywamy resztą z modelu. Można więc (choć praktykuje się to rzadko) zapisać równanie (3) jako: Ŷi = α̂0 + α̂1 Xi + ei (5) Zapis podany w (5) pokazuje, że reszty z modelu (a jest ich tyle ile obserwacji) mogą być traktowane jako przybliżona realizacja składnika losowego. Tak więc nie znamy składnika losowego jako takiego, znamy natomiast reszty, które mają podobne własności. Same modele mogą być klasyfikowane według różnych kryteriów. Wymieńmy te najpowszechniej spotykane: 1. Ze względu na formę związku między zmiennymi: (a) liniowe; (b) nieliniowe; 2. Ze względu na ilość zależności: (a) jednorównaniowe; (b) wielorównaniowe; 3. Ze względu na dynamikę: (a) statyczne; 9 Mówimy, że składnik losowy jest homoskedastyczny i nieskorelowany 23 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski (b) dynamiczne (w tym autoregresyjne); 4. Ze względu na wartości poznawcze: (a) przyczynowo-skutkowe; (b) tendencji rozwojowej; 5. Ze względu na zakres badania: (a) mikroekonomiczne; (b) makroekonomiczne; Nas najbardziej interesować będzie pierwsze kryterium. Przypomnijmy, że jedno z założeń schematu Gaussa-Markowa wymaga, aby równanie było liniowe względem parametrów. Dlatego do poniższego modelu: Yi = eα0 Xiα1 eεi (6) nie można zastosować metody najmniejszych kwadratów. Zlogarytmujmy jednak (6) stronami: ln Yi = α0 + α1 ln Xi + εi (7) Otrzymaliśmy równanie nieliniowe nadal względem zmiennych, ale za to liniowe względem parametrów co było naszym celem. Sprowadzanie równań nieliniowych do postaci liniowej jest często spotykaną praktyką ponieważ pozwala skorzystać z dobrodziejstw MNK. Oczywiście sama sposób sprowadzania różni się w zależności od postaci funkcyjnej modelu. 2.5 Statystyczna weryfikacja jakości modelu Fakt, że po użyciu MNK otrzymaliśmy estymatory parametrów modelu nie oznacza jeszcze, że można spocząć na laurach. Otrzymane wyniki muszą zostać sprawdzone pod kątem jakości. Dokonuje się tego na dwóch poziomach: statystycznym i merytorycznym. Na początek zajmijmy się weryfikacją statystyczną. Znając reszty z modelu można spróbować sobie odpowiedzieć czy zachowanie się zmiennych objaśniających dobrze odwzorowuje zachowanie zmiennej objaśnianej. Oczywiście można to zrobić, analizując każdą resztę z osobna10 . Jednak jakiekolwiek wnioski jesteśmy w stanie wyciągnąć tylko dla szeregów o niewielkiej liczbie obserwacji, kiedy nie przytłacza nas duża ilość danych. W pozostałych przypadkach konieczne staje się sięgnięcie po miary uśrednione. Da się wykazać, że między wartościami empirycznymi, teoretycznymi a resztami zachodzi związek: X X X (Yi − Ȳ )2 = (Ŷi − Ȳ )2 + e2i (8) i i i co można zapisać: SST = SSR + SSE (9) gdzie: SST – zmienność całkowita (suma kwadratów odchyleń wartości empirycznych od średniej arytmetycznej Y); SSR – zmienność objaśniona (suma kwadratów odchyleń wartości teoretycznych od średniej arytmetycznej Y); SSE – zmienność nieobjaśniona. 10 Pamiętając, że różnice między wartościami: rzeczywistą i teoretyczną powinny być jak najmniejsze. 24 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Dzieląc (9) stronami przez SST otrzymamy: 1= SSR SSE + SST SST (10) SSR występujący w (10) nosi nazwę współczynnika determinacji i oznaczamy go SST 2 symbolem: R . Jest to syntetyczna miara opisująca dopasowanie wartości teoretycznych do rzeczywistych. Przyjmuje wartości z przedziału h0, 1i11 . Im bliżej 1 (100%) tym lepsze dopasowanie modelu do danych, a więc oszacowania są lepszej jakości. Dla R2 = 1 wszystkie punkty empiryczne należą do linii regresji (zaś wszystkie reszty są równe 0). Tylko na pierwszy rzut oka wiadomo co to jest wysokie R2 , choć dążenie do jak najwyższych jego wartości jest zupełnie zrozumiałe. Interpretacja współczynnika determinacji jest możliwa, kiedy zachodzą następujące warunki: Element 1. relacja między zmiennymi musi być liniowa; 2. parametry muszą być szacowane przy pomocy MNK, gdyż inaczej współczynnik może przyjmować dowolne wartości; 3. model musi zawierać wyraz wolny, w przeciwnym razie zachodzi: R2 ∈ (−∞, 1i W modelach o więcej niż jednej zmiennej objaśniającej R2 rośnie ze wzrostem liczby szacowanych parametrów. Aby uniknąć tej wady oblicza się skorygowany współczynnik determinacji: R̄2 = 1 − (1 − R2 ) n−1 n−k (11) Różnica między R2 a R̄2 rośnie ze wzrostem liczby zmiennych objaśniających. Skorygowany współczynnik determinacji ma następujące własności: 1. Jeżeli R2 = 1 wówczas R̄2 = 1. 2. R̄2 może przyjmować wartości ujemne. Poniższe rysunki prezentują wartości współczynnika determinacji w zależności od zachowania się relacji między zmienną objaśniającą a objaśnianą przy założeniu, że użyto liniowej funkcji regresji. Y 6 Y 6 Y 6 • • • • • • • • • • • • • • • • • • • • • • -X Rysunek 10: R2 ≈ 1 -X Rysunek 11: R2 ≈ 0 -X Rysunek 12: R2 ≈ 0 Przypadki zaprezentowane na rysunkach (11) oraz (12) mimo podobnej wartości współczynnika determinacji różnią się dość znacznie. W pierwszej sytuacji nie ma praktycznie żadnej 11 Często praktykuje się podawanie wartości R2 w procentach. 25 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski zależności między zmiennymi, w drugiej zaś występuje ona, lecz ma charakter nieliniowy (w tym wypadku opisany parabolą). Współczynnik determinacji jest komfortową w zastosowaniu miarą ponieważ odnosi się do całego równania i ma wygodną interpretację. Z uwagi jednak na obarczenie pewnymi wadami, weryfikację statystyczną należy wzbogacić o inne elementy. Wiemy, że parametry modelu pokazują wpływ jaki wywiera jedna zmienna na inną. Można więc sprawdzić, czy związki zachodzące w równaniu są rzeczywiście istotne. Jeżeli zmienne: objaśniania i objaśniająca nie są ze sobą powiązane wówczas, biorąc pod uwagę założenia schematu Gaussa-Markowa, odpowiedni parametr powinien być równy zero12 . Skonstruujmy w tej sytuacji następujący zespół hipotez statystycznych dotyczących dowolnego z parametrów: H0 : αi = 0 H1 : αi 6= 0 Tworzą one podstawę tzw. testu istotności t-Studenta należącego do grupy metod weryfikacji statystycznej. Sprawdzaniem powyższego zespołu hipotez jest statystyka: t αi = α̂i σα̂i (12) gdzie: σα̂i – średni błąd estymatora. Statystyka dana wzorem (12) ma rozkład t-Studenta o n-k stopniach swobody. Z uwagi na konstrukcję hipotezy alternatywnej, w teście tym występuje obustronny obszar odrzucenia rozpatrywany względem odczytanej z tablic wartości krytycznej. Interpretacja wyników jest następująca: 1. Jeżeli |tαi | > tkryt wówczas (przy przyjętym z góry poziomie istotności) odrzucamy H0 na korzyść H1 . Zmienna objaśniająca w istotny sposób wpływa na zmienną objaśnianą. 2. Jeżeli |tαi | < tkryt wówczas (przy przyjętym z góry poziomie istotności) nie mamy podstaw do odrzucenia hipotezy zerowej, a więc uznajemy dany parametr za nieistotny statystycznie. Konsekwencje braku istotności są bardzo poważne. Oznaczają bowiem, że umieszczona w równaniu zmienna objaśniająca znalazła się tam niepotrzebnie. W takiej sytuacji należy ją usunąć i dokonać reestymacji równania. 2.6 Autokorelacja składnika losowego Z autokorelacją mamy do czynienia, kiedy składniki losowe dotyczące różnych obserwacji są ze sobą skorelowane. Z taką sytuacją spotykamy się najczęściej w przypadku szeregów czasowych. Przyczyny występowania autokorelacji są różne: 1. natura procesów gospodarczych np serie klęsk trwające przez wiele okresów; 2. wpływ zdarzeń najbliższej przeszłości na podejmowane decyzje; 3. niepoprawna postać funkcyjna modelu np nie uwzględnienie cyklu gospodarczego; 12 Z uwagi na obecność składnika losowego, praktycznie nie zdarza się sytuacja, w której parametr jest równy zero. 26 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski 4. wadliwa struktura dynamiczna modelu: brak opóźnionych zmiennych w charakterze zmiennych objaśniających; 5. pominięcie ważnej zmiennej objaśniającej. Najpoważniejszą konsekwencją występowania autokorelacji jest obciążenie estymatora wariancji składnika losowego. Kierunek obciążenia bywa różny. Dla autokorelacji dodatniej wariancja ta jest niedoszacowana co prowadzi do pozornie większej dokładności ocen parametrów. W konsekwencji otrzymujemy zawyżone statystyki t-Studenta. Najczęściej zakłada się występowanie schematu autoregresyjnego pierwszego rzędu (tzw schemat AR(1)), w którym występuje powiązanie między składnikami losowymi z sąsiednich okresów: εt = ρεt−1 + ηt (13) gdzie: ρ – współczynnik autokorelacji; ηt ∼ N (0, ση ) Szczególną własnością zjawisk ekonomicznych jest to, że pozostają one ze sobą zawsze w jakimś związku. Z tego powodu autokorelacja, choć niepożądana, jest właściwie nie do uniknięcia. Nasze działania zmierzają więc po pierwsze do określenia siły autokorelacji, a następnie do podjęcia decyzji odnośnie przeciwdziałania jej skutkom. Najprościej byłoby policzyć współczynnik autokorelacji, lecz należy pamiętać, iż nie znamy wprost składnika losowego. Z tego powodu po raz kolejny wykorzystamy jego przybliżenie czyli reszty z modelu. Niestety oznacza to, że możemy poznać jedynie estymator wartości ρ. Istnieje kilka sposobów na obliczenie ρ̂: n X et et−1 ρ̂1 = t=2 n X (14) e2t t=1 Ponieważ w (14) tracimy w liczniku jeden stopień swobody, można estymator ρ̂ policzyć inaczej: n−k ρ̂2 = ρ̂1 (15) n−1 Najczęściej jednak dla schematu AR(1) wykonuje się test Durbina-Watsona. Zakłada się w nim następujący zespół hipotez: H0 : ρ = 0 H1 : ρ > 0 lub ρ < 0 Sprawdzianem testu jest statystyka: n X d= (et − et−1 )2 t=2 n X (16) e2t t=1 Jej wartości należą do przedziału h0, 4i. Z tablic odczytujemy dwie wartości krytyczne: dolną dL i górną dU . Interpretacja wyników testu znalazła się w tabeli: Aby dało się zastosować test Durbina-Watsona muszą zachodzić następujące warunki: 27 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Tabela 12: Weryfikacja testu Durbina-Watsona Kierunek autokorelacji ρ̂ > 0 ρ̂ < 0 d ∈ hdU , 2i d ∈ h2, 4 − dU i d ∈ hdL , dU i d ∈ h4 − dU , 4 − dL i d ∈ h0, dL i d ∈ h4 − dL , 4i Decyzja przyjąć H0 brak rozstrzygnięcia odrzucić H0 1. w równaniu powinien występować wyraz wolny; 2. należy dysponować co najmniej 15 obserwacjami; 3. w modelu nie powinna występować opóźniona zmienna objaśniana w charakterze zmiennej objaśniającej. W wypadku kiedy ostatnie z założeń nie jest spełnione można sięgnąć po statystykę: r d n h= 1− 2 1 − nσ̂Y2 (17) gdzie: σ̂Y2 – estymator wariancji parametru przy opóźnionej zmiennej objaśnianej. Statystyka h ma rozkład asymptotycznie normalny o wartości oczekiwanej równej 0 i odchyleniu standardowym równym 1. Jeżeli test potwierdzi występowanie statystycznie istotnej autokorelacji w modelu należy podjąć działania zmierzające do wyeliminowania jej skutków. Stosuje się jedno z poniższych rozwiązań: 1. respecyfikacja modelu; 2. użycie innych niż klasyczna MNK metod estymacji np uogólnionej metody najmniejszych kwadratów (UMNK); 3. wprowadzenie opóźnionych zmiennych. 2.7 Weryfikacja merytoryczna Jeżeli współczynnik R2 oraz statystyki t-Studenta mają zadowalające wartości, wówczas można przejść od weryfikacji statystycznej do merytorycznej. Ma ona na celu sprawdzenie zgodności otrzymanych wyników z poczynionymi wcześniej założeniami. Podczas weryfikacji merytorycznej wyodrębnimy dwa etapy: 1. określenie poprawności znaków przy parametrach; 2. interpretacja wartości oszacowanych parametrów. W obu przypadkach pomoc może stanowić teoria ekonomii. Często (choć nie zawsze) z góry znamy znak stojący przy relacjach między konkretnymi wartościami ekonomicznymi. Jako przykład może posłużyć uzależnienie popytu na dobra podstawowe od dochodu czy ceny. Nieco bardziej skomplikowana jest interpretacja oszacowanych parametrów. Nie zawsze bowiem znamy rząd wielkości odpowiadający sile wpływu zmiennej objaśniającej na objaśnianą. Spotyka się tu raczej wskazówki (np elastyczność względem zmiennej powinna być mniejsza od 28 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski 1) niż konkretne, sztywne zasady. Dodatkowo sprawę komplikuje fakt, że inaczej interpretuje się parametry w równaniu liniowym niż w którymkolwiek z nieliniowych. Osobnego zwrócenia uwagi wymaga wyraz wolny. Z jednej strony jego obecność jest wymagana np ze względu na własności współczynnika determinacji. Z drugiej nie zawsze ma on sens merytoryczny, jak dzieje się na przykład w przypadku zlinearyzowanych modeli nieliniowych. 2.8 Zmienne zero-jedynkowe Jeśli chodzi zarówno o weryfikację merytoryczną jak i statystyczną problem może stanowić niekiedy samo zachowanie się danych. Przyjrzyjmy się sytuacji przedstawionej na rysunku 13. Y 6 • • • • • • • -X Rysunek 13: Nietypowe zachowanie danych Jedna z obserwacji przyjęła wartość nietypowo wysoką w porównaniu do pozostałych danych. Zastosowanie MNK w tej sytuacji doprowadzi do modelu o bardzo niskim R2 a nawet do przyjęcia hipotezy o braku istotności oszacowań. Z uwagi na skromną liczbę obserwacji nie jest możliwa rezygnacja z części spośród nich, aby uniknąć wymienionych wad. Jeżeli spojrzeć na to szerzej, nie powinniśmy sprawiać wrażenia zaskoczonych. Zjawiska ekonomiczne podlegają w niektórych okresach (takich jak wojny czy gwałtowne recesje lub boom gospodarczy) raptownym wahaniom. Przyjmują wtedy wartości skrajnie odbiegające od okresów, które w tej sytuacji można nazwać „normalnymi” lub typowymi. Wyróżnimy 3 grupy takich nietypowych zachowań: 1. obserwacje nietypowe występujące w pojedynczych, nieregularnych okresach; 2. obserwacje nietypowe trwające przez kilka okresów z rzędu; 3. obserwacje nietypowe regularnie się powtarzające. Zazwyczaj nie jesteśmy w stanie zrezygnować z danych dotyczących nietypowych okresów. Ewentualne skrócenie próby ma daleko idące konsekwencje podczas estymacji. Z drugiej strony brak kroków zaradczych oznacza modele o słabych własnościach statystycznych i merytorycznych. Jako wyjście proponuje się stosowanie zmiennych zero-jedynkowych. Zmienną taką definiuje się następująco: ( 0, dla obserwacji typowych; Ui = (18) 1, dla obserwacji nietypowych. Zmienne zero-jedynkowe tworzone są więc sztucznie, zgodnie z naszymi potrzebami13 . Wprowadza się je następnie do równania i szacuje parametry w tradycyjny sposób. W zależności od 13 Należy jednak zachowywać umiar przy wprowadzaniu zmiennych zero-jedynkowych. Ich użycie musi być odpowiednio umotywowane. 29 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski użycia mogą one wywoływać zmianę któregoś z pozostałych parametrów w wybranych okresach. Równanie (19) prezentuje korektę wyrazu wolnego: Yi = α0 + αo∗ Ui + αi Xi + εi (19) Y 6 • • • • • • • -X Rysunek 14: Zmienna zero-jedynkowa dla wyrazu wolnego Niekiedy należy zmienić współczynnik kierunkowy równania: Yi = α0 + (α1 + α1∗ Ui )Xi + εi (20) Sytuację z równania (20) ilustruje rysunek 15. Y 6 • • • • • • • -X Rysunek 15: Zmienna zero-jedynkowa dla współczynnika kierunkowego Możliwe jest również połączenie rozwiązań zaproponowanych w (19) oraz (20) dla jednego modelu. Oddzielnego omówienia wymaga wykorzystanie sezonowych zmiennych zero-jedynkowych. Ze zjawiskiem sezonowości spotykamy się często korzystając z danych kwartalnych. Jest to sytuacja regularnego powtarzania się obserwacji nietypowych14 . Zakładając, że mamy do czynienia właśnie z sezonowością kwartalną proponuje się następujący sposób użycia zmiennych sztucznych: Yt = α0 + α1 Xt + α2 U1t + α3 U2t + α4 U3t + εt (21) Równanie (21) stanowi rozszerzenie modelu z korektą wyrazu wolnego. Różnica polega na tym, że w tym przypadku wyraz wolny jest korygowany w każdym kwartale przez inny parametr (przykładowo za sezonowość w pierwszym z nich odpowiada parametr przy U1t ). Powyższe 14 Jako przykład może posłużyć wzrost spożycia napojów gazowanych w okresie letnim. 30 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski zmienne mierzą odchylenie sezonowe względem wybranego (w naszym przykładzie czwartego) kwartału. Zachowanie się zmiennej Yt w czwartym kwartale oddaje wyraz wolny. Należy pamiętać, że w szeregach zmiennych tego typu wartość 1 regularnie się powtarza do końca okresu, z którego pochodzą dane. Przykładowo dla równania (21) macierz X wyglądałaby następująco: 1 X1 1 0 0 1 X2 0 1 0 1 X3 0 0 1 1 X 0 0 0 4 1 X5 1 0 0 X= 1 X6 0 1 0 1 X7 0 0 1 1 X8 0 0 0 .. .. .. .. .. . . . . . . . . 1 Xn .. .. .. 2.9 Modele ekonometryczne a prognozowanie Aby wykonać prognozę na podstawie jednorównaniowego modelu opisowego, musi on charakteryzować się dobrymi własnościami. Jego jakość ocenia się przy pomocy miar takich jak współczynnik determinacji czy istotność oszacowań. Równie ważna jest weryfikacja merytoryczna, czyli znaki a w przypadku modeli nieliniowych wartości elastyczności. Same prognozy mogą mieć charakter punktowy (wynikiem jest konkretna wartość liczbowa) lub przedziałowy (otrzymujemy przedział, który z określonym prawdopodobieństwem zawiera przyszłą realizację zmiennej prognozowanej). Dodatkowo zakładamy, że relacje między zmiennymi pozostaną stałe w czasie. Oznacza to, że postać funkcyjna modelu oraz wzajemne oddziaływanie zmiennych są stałe z okresem prognozy włącznie. To założenie (szczególnie w realiach ekonomicznych) jest bardzo silne. Podobne założenia czynimy w przypadku omawianych poniżej modeli trendu. Składnik losowy również pozostaje stały w czasie co oznacza, że nie powinny pojawić się nowe zmienne wpływające na prognozowane zjawisko przy okazji zmieniając już ustalone relacje. W okresie prognozowanym musimy znać wartości zmiennych objaśniających. Kiedy nie jest możliwe, w sukurs przychodzą metody prognozowania szeregów czasowych. Można również konstruować dodatkowe równania, służące otrzymaniu przyszłych wartości pożądanych zmiennych. Zazwyczaj takie postępowanie prowadzi do otrzymania układu powiązanych ze sobą równań. Niekiedy zaś (w analizach określonych scenariuszy) zakłada się z góry wartości zmiennych egzogenicznych co upodabnia postępowanie do analizy mnożnikowej. Prognozy na podstawie modeli ekonometrycznych, w których uwzględnia się fakt sezonowości zmiennych, zakładają istnienie sezonowości również w okresie prognozy. Sezonowość ta ma zachowany dotychczasowy okres wahań. 2.10 Modele trendu Niektóre zmienne mają skłonność do systematycznych zmian w czasie np. stale rosną lub maleją. Mówimy, że zawierają trend i staramy się skonstruować możliwie najprostszą sztuczną zmienną reprezentującą czas. Przy addytywnym wprowadzeniu składnika losowego otrzymujemy szczególny przypadek równania linii regresji. Potrzebujemy jedynie informacji o zmiennej objaśnianej, nie zaś objaśniających co stanowi wielce korzystną okoliczność. 31 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Postać modelu może być różna, a jej wybór zależy od przesłanek dotyczących mechanizmu rozwojowego zmiennej. Przykłady postaci funkcji trendu: • liniowa yt = α + βt Stały kierunek rozwoju zjawiska wyznacza współczynnik kierunkowy prostej. Wyraża on stały przyrost wartości zmiennej prognozowanej. • wykładnicza yt = eα+βt , t yt = αβ , β>0 β>1 W równaniu pierwszym β a w drugim ln β jest stopą wzrostu. • wielomianowa yt = α0 + α1 t + α2 t2 Kolejne trzy funkcje stosuje się w sytuacji, kiedy stwierdzamy występowanie zmniejszających się przyrostów np. dla względnego nasycenia rynku z powodu pojawiających się produktów konkurencyjnych. • logarytmiczna yt = α + β ln t, β > 0 • potęgowa yt = αtβ , • ilorazowa yt = αt , β+t 0<β<1 α, β > 0 W przypadku malejącego przyrostu ryzyko prognozowania jest mniejsze bo zmienne zachowują się dość stabilnie. • logistyczna yt = α , 1 + β exp−δt α, δ > 0, β > 1 Funkcji logistycznej używamy kiedy zjawisko jest ograniczone do pewnej przestrzeni (np. rozwój nowych gałęzi przemysłu). Najpierw następuje szybki wzrost, potem tempo maleje do asymptoty wyznaczonej przez parametr alfa. Określenie rodzaju trendu wymaga sporej ilości obserwacji. Postać funkcji dobiera się empirycznie, na podstawie analizy wykresu. Kiedy obserwacji nie ma zbyt wiele, do szeregu da się dopasować więcej niż jedną funkcję. W takiej sytuacji wybieramy tę o najprostszej postaci analitycznej. Używając KMNK do szacowania parametrów trzeba pamiętać o sprowadzeniu równania do postaci liniowej względem parametrów. Modele trendu mogą być (jak każde modele ekonometryczne) rozszerzane o zmienne zero-jedynkowe. Poniższy prosty przykład stanowi ilustrację sposobu, w jaki wykonuje się prognozy w oparciu o model trendu. Przykład prognoz dla funkcji ŷt = 2 + 3t w kilku wybranych okresach: 32 z 37 Ekonometria dla FiR 2.11 Opracował: dr Adam Kucharski Okres (t) Prognoza 1 2+3*1=5 3 2+3*3=11 10 2+3*10=32 12 2+3*12=38 Przykład estymacji modelu jednorównaniowego Należy oszacować parametry liniowego modelu jednorównaniowego opisującego popyt na pewne dobro (Y) w zależności od dochodów (X). Równanie to ma postać: Yt = α0 + α1 Xt + εt (22) Zbadać jego jakość przy pomocy współczynnika determinacji oraz testu istotności. Zebrane dane na temat zmiennych: objaśnianej (Y) i objaśniającej (X) w kolejnych okresach (t) są następujące: Yt 5 6 7 7 8 9 Xt 3 3 5 4 6 7 Dane do zadania można zapisać w postaci macierzowej. Ponieważ w modelu występuje wyraz wolny (α0 ) więc pierwsza kolumna macierzy obserwacji na zmiennych objaśniających składać się będzie z samych jedynek. 5 1 3 6 1 3 7 1 5 Y = X = 7 1 4 8 1 6 9 1 7 Powyższe dane zostaną wykorzystane do estymacji parametrów modelu przy pomocy metody najmniejszych kwadratów. Wzór na estymator parametrów jest następujący: α = (XT X)−1 XT y (23) Na początek wyznaczymy macierz XT X: " # 1 1 1 1 1 1 T X X= 3 3 5 4 6 7 1 3 1 3 " # 1 5 6 28 = 1 4 28 144 1 6 1 7 W następnym kroku należy macierz odwrócić. Skorzystamy w tym celu ze wzoru na odwracanie macierzy dwa na dwa. Wyznacznik macierzy XT X jest równy 80 (6 ∗ 144 − 28 ∗ 28). Stąd macierz odwrotna jest następująca: " # " # 144 −28 1,8 −0,35 1 = (XT X)−1 = 80 −28 6 −0,35 0,075 33 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Jako kolejny wyznaczymy wektor XT y: " # 1 1 1 1 1 1 XT y = 3 3 5 4 6 7 5 6 " # 7 42 = 7 207 8 9 Możemy teraz przystąpić do ostatniego kroku czyli szacowania parametrów. Podstawiamy do wzoru (23): " #" # " # 1,8 −0,35 42 3,15 α= = −0,35 0,075 207 0,825 Otrzymaliśmy następujące równanie: Ŷt = 3,15 + 0,825Xt (24) Parametr α0 = 3,15 oznacza, że w przypadku braku dochodu popyt wynosi 3,15 jednostki. Jest to tzw. popyt autonomiczny. Parametr α1 = 0,825 oznacza, że wzrost dochodów o jednostkę pieniężną spowoduje wzrost popytu o 0,825 jednostki przy pozostałych warunkach niezmienionych. W tym miejscu warto przyjrzeć się znakowi parametru przy zmiennej objaśniającej. Jest on dodatni. Jako, że objaśniamy popyt przy pomocy wydatków, wydaje się logiczne oraz ekonomicznie uzasadnione, że ze wzrostem wydatków rośnie popyt na dane dobro. Taki właśnie znak stoi przy Xt . Mając oszacowane parametry można wyznaczyć teoretyczne wartości zmiennej objaśnianej. Podstawiamy dochód z kolejnych okresów do (24). W efekcie obliczone zostaną wartości wynikające z równania linii regresji. Poniżej znajdują się przykładowe obliczenia dla pierwszych trzech okresów. ŷ1 = 3,15 + 0,825 ∗ 3 = 5,625 ŷ2 = 3,15 + 0,825 ∗ 3 = 5,625 ŷ3 = 3,15 + 0,825 ∗ 5 = 7,275 Jak widać wartości popytu wynikające z równania linii regresji różnią się od wartości rzeczywistych. Różnica: et = yt − ŷt (25) nosi nazwę reszty z modelu. Poniżej znalazły się wszystkie wartości teoretyczne zmiennej objaśnianej oraz wszystkie reszty. Yt Ŷt et 5 5,625 -0,625 6 5,625 0,375 7 7,275 -0,275 7 6,450 0,550 8 8,100 -0,100 9 8,925 0,075 34 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Współczynnik determinacji (oznaczany jako R2 ) służy do oceny dopasowania całego modelu do danych rzeczywistych. Może więc być wyliczany bezpośrednio z reszt modelu lub na podstawie cząstkowych wyliczeń poczynionych jeszcze na etapie szacowania parametrów. W tym drugim wypadku wykorzystuje się następujący wzór (z niego właśnie skorzystamy w niniejszym przykładzie): αT XT y − nȳ 2 (26) R2 = yT y − nȳ 2 Wyznaczymy kolejne składowe wzoru (26). h αT XT y = 3,15 0,825 i " 42 207 # = 303,075 5 6 h i7 X yt2 = 5 6 7 7 8 9 = 304 yT y = 7 t 8 9 Średnia arytmetyczna ze zmiennej objaśnianej (ȳ) wynosi 7, zaś liczba obserwacji (czyli n) równa się 6. Podstawiamy do wzoru (26): R2 = 303,075 − 6 ∗ 72 = 0,9075 304 − 6 ∗ 72 Interpretacja 1: Model objaśnia zachowanie się zmiennej objaśnianej w 90,75%. Interpretacja 2: Zmienność zmiennej objaśnianej została wyjaśniona zmiennością zmiennych objaśniających w 90,75%. Wartość współczynnika determinacji rośnie ze wzrostem liczby zmiennych objaśniających, nie można opierać się tylko i wyłącznie na nim. Z tego powodu analizę jakości oszacowań rozszerza się o zbadanie własności pojedynczych estymatorów. Wykorzystamy do tego celu test istotności t-Studenta. W teście tym występuje następujący zestaw hipotez: H0 : αi = 0 H1 : αi 6= 0 Stawiamy więc hipotezę, że dany parametr jest równy zero (statystycznie nieistotny) wobec hipotezy alternatywnej, która zakłada iż istotnie różni się on od zera. Sprawdzianem tego testu jest statystyka: α̂i tαi = (27) σαi σαi to odchylenie standardowe danego parametru. Aby jednak skorzystać ze wzoru (27) należy najpierw wyznaczyć wariancję reszt. Wykorzystany zostanie następujący wzór (k – liczba szacowanych parametrów): σe2 = 1 (yT y − αT XT y) n−k Po podstawieniu otrzymamy: σe2 = 1 (304 − 303,075) = 0,23 6−2 35 z 37 (28) Ekonometria dla FiR Opracował: dr Adam Kucharski Odchylenie standardowe parametru oblicza się mnożąc wariancję reszt przez odpowiedni element przekątnej główne macierzy (XT X)−1 , po czym wyciąga się pierwiastek. Jako, że oszacowano dwa parametry, potrzebne będą dwa odchylenia standardowe. p σα0 = 0,23 ∗ 1,8 = 0,643 p σα1 = 0,23 ∗ 0,075 = 0,131 Na ich podstawie obliczamy wartości statystyk t-Studenta: 3,15 = 4,9 0,643 0,825 = = 6,3 0,131 tα0 = tα1 Aby zweryfikować hipotezy o istotności każdego z parametrów, z tablic rozkładu t-Studenta odczytujemy wartość krytyczną. Potrzebne do tego są dwa parametry: poziom istotności i liczba stopni swobody. Poziom istotności przyjmiemy na poziomie 0,05 a liczba swobody to różnica między liczbą obserwacji a liczbą szacowanych parametrów. W naszym przypadku wynosi ona 6 − 2 = 4. Wartość krytyczna odczytana z tablic wynosi 2,78. Porównujemy moduły statystyk t-Studenta z wartością krytyczną: |4,9| > 2,78 |6,3| > 2,78 W obu przypadkach moduły statystyk dla parametrów okazały się większe od wartości krytycznej. Oznacza to iż obie statystyki znalazły się w obszarze odrzucenia. Powiemy, że odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej, która mówi, że dany parametr istotnie różni się od zera. Oznacza to na przykład, że Xt ma istotny wpływ na zachowanie się Yt . 1. Znaki przy parametrach są poprawne. 2. Wartość współczynnika determinacji wskazuje na wysoki poziom objaśnienia modelu. 3. Obydwa parametry okazały się istotne statystycznie. Otrzymano więc wiarygodny model o dobrych własnościach statystycznych. Badanie występowania autokorelacji zostanie przeprowadzone przy pomocy testu DurbinaWatsona. Sprawdza się w nim następujący zestaw hipotez: H0 : ρ = 0 H1 : ρ 6= 0 Hipoteza zerowa zakłada brak autokorelacji i jest to sytuacja dla nas pożądana. W odróżnieniu, przyjęcie hipotezy alternatywnej oznacza, że współczynnik korelacji jest istotnie różny od zera i występuje autokorelacja składnika losowego. 36 z 37 Ekonometria dla FiR Opracował: dr Adam Kucharski Test Durbina-Watsona opiera się o wektor reszt z modelu. Na ich podstawie dokonuje się najpierw obliczeń cząstkowych, które znalazły się w tabeli poniżej: e2t et (et − et−1 ) (et − et−1 )2 −0,625 0,391 − − 0,375 0,141 1,000 1,000 −0,275 0,076 −0,650 0,423 0,550 0,303 0,825 0,681 −0,100 0,010 −0.650 0,423 0,075 P 0,006 0,175 0,031 0,927 − 2,558 Teraz wystarczy tylko podstawić do wzoru i obliczyć wartość statystyki DW. P (et − et−1 )2 2,558 P 2 = 2,76 DW = = 0,927 et Wartość DW jest większa od dwóch więc sprowadzimy ją poniżej tej wartości: DW ∗ = 4 − DW = 4 − 2,76 = 1,24 Przed dokonaniem interpretacji należy wyznaczyć, na podstawie tablic statystycznych, wartości krytyczne rozkładu Durbina-Watsona. Potrzebne do tego parametry to: 1. liczba obserwacji (u nas n=6) 2. liczba szacowanych parametrów (u nas k=2) UWAGA! Tablice konstruowane są od 15 obserwacji więc, z formalnego punktu widzenia, nie możemy wykorzystać tego testu. Zrobimy to jednak, lecz wyłącznie w celu zapoznania się z weryfikacją tego typu hipotez. Przyjmijmy zatem, że dL = 0,98 a dU = 1,57. W takiej sytuacji wartość statystyki równa 1,24 znalazła się w obszarze niekonkluzywności testu (bo 0,98 < 1,24 < 1,57). Nie możemy stwierdzić, czy w modelu występuje autokorelacja czy nie. Gdyby statystyka obliczona na podstawie reszt okazała się wyższa od dU wtedy stwierdzilibyśmy brak autokorelacji składnika losowego. Statystyka DW mniejsza od dL oznacza występowanie autokorelacji składnika losowego. Załóżmy teraz, że chcemy wykonać prognozę punktową na kolejne dwa okresy, czyli siódmy i ósmy. Potrzebujemy do tego celu wartości dochodów w tych okresach. Niech będą dane15 : X7∗ = 9 a X8∗ = 12. Prognozy popytu we wspomnianych okresach wyglądają następująco: Y7∗ = 3,15 + 0,825 × 9 = 10,575 Y8∗ = 3,15 + 0,825 × 12 = 13,05 Zwróćmy uwagę na to, że parametry i postać równania w okresach prognozowanych nie uległy zmianie. Nie rozstrzygaliśmy również, skąd pochodzą wartości zmiennej objaśniającej w okresach siódmym i ósmym, gdyż nie stanowi to przedmiotu zainteresowania naszego przykładu. 15 „Gwiazdka” oznacza, że mamy do czynienia z prognozą. 37 z 37