t - WSEHSK
Transkrypt
t - WSEHSK
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 1 MODEL EKONOMETRYCZNY „Model jest to schematyczne uproszczenie, pomijające nieistotne aspekty w celu wyjaśnienia wewnętrznego działania, formy lub konstrukcji bardziej skomplikowanego mechanizmu.” (Lawrence R. Klein) ZALETY MODELU- możliwość względnie taniego eksperymentowania, możliwość analizy, realizacji prognozy, symulacji. Model ekonometryczny- formalny matematyczny zapis istniejących prawidłowości ekonomicznych. Celem takiego modelu może być opis zależności, przewidywanie przyszłego kształtowania się zależności, symulacja. KLASYFIKACJA MODELI EKONOMETRYCZNYCH Ze względu na wyróżnione cechy: występowanie lub brak w modelu zmiennej losowej; modele deterministyczne lub stochastyczne. ze względu na formę związku między zmiennymi występującymi w modelu; modele liniowe i nieliniowe ze względu na ilość rozpatrywanych zależności modele jednorównaniowe i wielorównaniowe ze względu na czynnik czasu; modele statyczne [związki zachodzą w tej samej jednostce czasowej] i modele dynamiczne [uwzględniają czynnik czasu w formie opóźnień lub zmiennej czasowej] ze względu na charakter analizowanych związków; modele przyczynowo-skutkowe i modele symptomatyczne. Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 2 KLASYFIKACJA ZMIENNYCH I PARAMETRÓW WYSTĘPUJĄCYCH W EKONOMETRYCZNYCH MODELACH. Zmienne endogeniczne i egzogeniczne w modelu ekonometrycznym. Zmienne egzogeniczne (zmienne objaśniające w modelu, wśród nich zmienne sterujące będące przedmiotem polityki gospodarczej). Zmienne objaśniane i objaśniające (dot. danego równania ) Zmienne z góry ustalone (zm. egzogeniczne, zmienne endogeniczne z opóźnieniami i z wyprzedzeniami, zmienna czasowa-wyrażająca systematyczne zmiany w czasie zmiennej endogenicznej). Zmienne zerojedynkowe (dla określenia czynników niemierzalnych). Składnik losowy ( zmienna wyrażająca łączny efekt tych czynników, które nie zostały wyspecyfikowane w modelu, a także z błędów wynikających z przyjęcia niewłaściwej postaci funkcyjnej modelu, błędów pomiaru wartości zmiennych. Parametry struktury stochastycznej modelu (parametry rozkładu składnika losowego) Parametry strukturalne modelu (parametry występujące przy kolejnych zmiennych, określające kształtowanie zmiennej objaśnianej). Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 3 ETAPY ANALIZY EKONOMETRYCZNEJ SPECYFIKACJA ZMIENNYCH I DOBÓR POSTACI MODELU USTALENIE PRZEDMIOTU BADANIA, LISTA ZMIENNYCH OBJAŚNIAJĄCYCH I OBJAŚNIANYCH, POSTAĆ FUNKCYJNA MODELU. W OPARCIU O TEORIĘ EKONOMII, ZEBRANE DANE STATYSTYCZNE, KORELACJE. ZEBRANIE DANYCH STATYSTYCZNYCH ZEBRANIE DANYCH, UPORZĄDKOWANIE (SZEREGI CZASOWE, PRZEKROJOWE, PRZEKROJOWO-CZASOWE) I ANALIZA PRZYDATNOŚCI DANYCH. OKREŚLENIE MIERNIKA, PORÓWNYWALNOŚĆ DANYCH. ESTYMACJA PARAMETRÓW WYZNACZENIE OCEN PARAMETRÓW STRUKTURALNYCH ORAZ PARAMETRÓW STRUKTURY STOCHASTYCZNEJ MODELU. NARZĘDZIE - METODA NAJMNIEJSZYCH KWADRATÓW (MNK). WERYFIKACJA MODELU ANALIZA OTRZYMANYCH OCEN PARAMETRÓW STRUKTURALNYCH I STRUKTURY STOCHASTYCZNEJ MODELU. WERYFIKACJA MERYTORYCZNA I STATYSTYCZNA. PRAKTYCZNE WYKORZYSTANIE MODELU ANALIZA PRAWIDŁOWOŚCI ( HISTORYCZNA ). PROGNOZOWANIE Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński ESTYMACJA PARAMETRÓW MODELU EKONOMETRYCZNEGO (ESTYMACJA PUNKTOWA) METODA NAJMNIEJSZYCH KWADRATÓW (MNK) Model yt 1 X t1 2 X t 2 k X tk t yt - empiryczna wartość zmiennej objaśnianej w okresie t X tj - empiryczna wartość zmiennej objaśniającej j w okresie t j - nieznany parametr stojący przy zmiennej X j t - zakłócenie w okresie t (składnik losowy) Zapis macierzowy modelu 1 x11 x12 x1k x 21 x 22 x 2k 2 1 y1 y 2 2 α ε X y k n x n1 . x n 2 x nk yn y Xα ε 4 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Model po oszacowaniu parametrów strukturalnych yt a1 X t1 a2 X t 2 ak X tk et lub yˆt a1 X t1 a2 X t 2 ak X tk yt - empiryczna wartość zmiennej objaśnianej w okresie t ŷt - teoretyczna wartość zmiennej objaśnianej w okresie t X tj - empiryczna wartość zmiennej objaśniającej j w okresie t a j - oszacowany parametr stojący przy zmiennej X j et -realizacja zakłócenia w okresie t (reszta w okresie t) Zapis macierzowy oszacowanego modelu x11 x12 y1 yˆ1 x y yˆ x22 21 2 2 X y yˆ ˆ xn1. xn 2 yn yn a1 a a 2 a k e1 x1k e x2 k e 2 xnk e n y Xa e gdzie lub e y yˆ yˆ Xa 5 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 6 Wzór MNK (Wyprowadzenie wzoru) Minimalizujemy sumę kwadratów reszt modelu: n t 1 2 et eT e y Xa y Xa T T T T T T y y 2a X y a X Xa min Znajdujemy wartość najmniejszą powyższej funkcji (pochodna po a przyrównana do 0) 2X y 2X Xa 0 T T T X X T X Xa X y T :2 1 lewostronnie Wzór MNK ma postać: 1 a X X X y T T Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński WARUNKI STOSOWALNOŚCI MNK 7 1. Zmienna objaśniana y jest zmienną losową, 2. Zmienne objaśniające X nie są zmiennymi losowymi, 3. n>k , tzn. liczba obserwacji n powinna być większa od liczby szacowanych parametrów (zmiennych objaśniających) k 4. zmienne objaśniające nie mogą być współliniowe, tzn wektory obserwacji zmiennych objaśniających (kolumny macierzy X) powinny być liniowo niezależne. 5. składnik losowy musi spełniać następujące założenia: t : N(0, 2 ), E(t )=0, D2 (t )=2 oraz Cov (ij) =0, ij W zapisie macierzowym 4 powyższe założenia sprowadzają się do następującej postaci macierzy wariancji i kowariancji składnika losowego 2 0 2 0 E ( T ) 2 ... ... 0 0 ... 0 ... 0 ... ... 2 ... Przy w/w założeniach MNK daje estymatory: zgodne, nieobciążone i najefektywniejsze. Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 8 Estymacja przedziałowa parametrów strukturalnych modelu Zakładając, że t:N(0,) dla każdego t otrzymujemy, że estymatory (aj) parametrów (j) mają również rozkłady normalne: a j : N j , Da j W praktyce zastępujemy nieznane odchylenie standardowe D(aj) odchyleniem S(aj) postaci: S a j Se2 c jj gdzie: c jj - j-ty element głównej przekątnej macierzy (X X) T S e2 -1 - wariancja resztowa wyliczana jako: 1 S ( y T y a T XT y ) nk 2 e Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Można oszacować nieznane wartości parametrów używając techniki estymacji przedziałowej (przedziały ufności). Przedział ufności z przyjętym z góry prawdopodobieństwem u=1- (poziom ufności) pokrywa nieznaną wartość parametru j. Pa j t ,r S a j a j t ,r S a j 1 t,r - wartość krytyczna zmiennej o rozkładzie t-Studenta dla r=n-k stopniach swobody przy ustalonym z góry poziomie istotności (). 9 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 10 Miara dopasowania oszacowanego modelu do danych empirycznych (współczynnik determinacji R2) Mówi nam w jakim procencie zmienność y jest objaśniana przez model. W modelu musi występować wyraz wolny. Interpretacja jest poprawna pod warunkiem, że badane związki są liniowe. R2 przyjmuje wartości z przedziału (0, 1) n R2 1 2 e t t 1 n 2 y y t t 1 T e e R 1 T y y ny 2 2 T T 2 a X y n y R2 T y y ny 2 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński ŚREDNI BŁĄD SZACUNKU (SEE-Standard Error of Estimation) Wariancja resztowa 1 T S e e nk 1 2 T T T Se (y y a X y ) nk 2 e Średni błąd szacunku Se S 2 e Przewidywane przez oszacowane równanie (model) wartości zmiennej objaśnianej y (y teoretyczne) średnio różnią się od empirycznych wartości tej zmiennej (y empiryczne) o wartość błędu Se. 11 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Testowanie istotności ocen parametrów 12 (tj. testowanie trafności doboru zmiennej objaśniającej) HIPOTEZY H0: j = 0 (zmienna Xj nie ma wpływu na zmienną objaśnianą y) H1: j 0 (zmienna Xj ma wpływ na zmienną objaśnianą y) SPRAWDZIAN t a j aj S a j S(aj) jest średnim błędem szacunku nieznanego parametru j. S aj 2 Se c jj cjj jest j-tym elementem głównej przekątnej macierzy (XTX)-1. Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Statystyka t(aj) ma rozkład Studenta o n-k stopniach swobody. Wyliczoną wartość sprawdzianu t(aj) porównujemy z odczytaną z tablic Studenta wartością krytyczną t,r. Jeżeli: t(aj) t,r. nie ma podstaw do odrzucenia hipotezy H0 t(aj) > t,r. odrzucamy H0 na korzyść H1. 13 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 14 Testowanie założeń dla składnika losowego modelu Macierz wariancji składnika losowego powinna mieć w przypadku MNK następującą postać: 2 0 2 0 E ( T ) 2 ... ... 0 0 ... 0 ... 0 ... ... 2 ... W przypadku braku spełnienia założeń odnośnie do składnika losowego nie wolno używać metody MNK. 1. O przypadku heteroskedstyczności mówimy gdy na głównej przekątnej tej macierzy są różne elementy. 2. O przypadku autokorelacji powiemy gdy poza główną przekątną tej macierzy będą elementy niezerowe. 3. Dodatkowo powinniśmy sprawdzić czy składniki losowe mają rozkłady normalne. Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Testowanie przypadku heteroskedastyczności Problem ten najczęściej występuje przy estymacji modelu na podstawie danych przekrojowych lub przekrojowo-czasowych. Załóżmy że dane pochodzą z dwóch różnych populacji. Wówczas na głównej przekątnej macierzy wariancji i kowariancji 2 2 mogą wystąpić dwie różne wartości wariancji: 1 oraz 2 . Statystyczną istotność różnic testujemy wykorzystując test F Snedecora. H 0 : 12 22 H1 : 12 22 Sprawdzianem hipotezy (H0) jest statystyka F Snedecora postaci: F Se21 Se22 2 2 przy czym Se1 Se2 o r1 n1 1 oraz r2 n2 1 stopniach swobody Se21 , Se22 - oznaczają wariancje resztowe dla prób odpowiednio z populacji pierwszej i z populacji drugiej Jeżeli F F , r1 , r2 przy określonym poziomie istotności , to należy użyć uogólnionej MNK (UMNK) zamiast klasycznej MNK. 15 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 16 Testowanie przypadku autokorelacji składnika losowego Przyczyny autokorelacji: 1. Dłuższe działanie czynników przypadkowych (powodujących zaburzenia w normalnym przebiegu zjawiska) niż w czasie przyjętym za jednostkę. 2. Błędy w budowie modelu. 3. Pominięcie jednej lub kilku istotnych zmiennych objaśniających. 4. Użycie zmiennej z nieprawidłowo określonym opóźnieniem. 5. Przyjęcie niewłaściwej postaci analitycznej modelu. Test Durbina-Watsona (test DW) Na początek obliczamy współczynnik autokorelacji reszt oszacowanego MNK: r dla modelu n r e e t t 1 t 2 n n e e t 1 et 2 t t 2 2 t 1 - reszta empiryczna dla okresu t w modelu oszacowanym MNK Następnie weryfikujemy poniższe hipotezy ( jest nieznanym współczynnikiem autokorelacji składnika losowego): H0: 0 (nie istnieje autokorelacja) H1 : 0 (istnieje autokorelacja dodatnia; jeżeli r jest dodatni) lub H1 : 0 (istnieje autokorelacja ujemna; jeżeli r jest ujemny) Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 17 Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: >0 jest statystyka d. Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: <0 jest statystyka 4d. Statystyka d ma rozkład Durbina-Watsona. n d 2 e e t t 1 t 2 n e t 1 2 t Jeżeli ddL odrzucamy H0 na rzecz H1. Istnieje autokorelacja. Jeżeli ddU przyjmujemy H0. Brak autokorelacji. Jeżeli dL<d<dU test nie daje odpowiedzi. Nie możemy podjąć decyzji o przyjęciu lub odrzuceniu H0. Należy podjąć decyzję o powiększeniu próby. Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński Testowanie normalności zakłóceń (składnika losowego) TEST JARQUE-BERA (TEST JB) TEST JB jest oparty o trzeci oraz czwarty moment rozkładu. Trzeci moment mówi o asymetrii. Dla rozkładów symetrycznych jest on równy zero (rozkład normalny jest rozkładem symetrycznym). Czwarty moment mówi o smukłości rozkładu (tzw. kurtoza); (dla rozkładu normalnego kurtoza=3). Test JB oparto na porównaniu jak miary asymetrii i kurtozy odbiegają od wielkości charakterystycznych dla rozkładu normalnego. H0: składniki losowe podlegają rozkładowi normalnemu H1: składniki losowe nie podlegają rozkładowi normalnemu Sprawdzianem testu jest statystyka Jarque-Bera postaci: 1 1 2 JB n 1 2 3 24 6 gdzie: 1 n et3 1 3 n t 1 S 2 1 n et4 2 4 n t 1 S 1 n 2 S et n t 1 Statystyka JB ma rozkład zawsze o r=2 stopniach swobody (przykładowo dla poziomu istotności =0,05 wartość krytyczna wynosi 2 02,05;2 5,991 ). 18 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 19 Wnioskowanie na podstawie statystyki JB Jeżeli JB ; 2 , to wówczas nie mamy podstaw do odrzucenia hipotezy H0 mówiącej o tym, że składniki losowe podlegają rozkładowi normalnemu. 2 Jeżeli natomiast JB ; 2 , to odrzucamy H0 i przyjmujemy hipotezę H1 mówiącą o tym, że składniki losowe podlegają rozkładowi innemu niż normalny. 2 Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 20 Prognozowanie na podstawie modelu ekonometrycznego TP – numer okresu na który dokonujemy prognozy yTP ŷTP - nieznana przyszła wartość zmiennej objaśnianej dla okresu TP x TP - wektor obserwacji dla zmiennych objaśniających w okresie TP - przyszła wartość zmiennej objaśnianej dla okresu TP wyliczona na podstawie modelu ekonometrycznego (dodatkowy wiersz w macierzy X) xTP xTP,1 xTP, 2 xTP, k PROGNOZA PUNKTOWA Wartość prognozy następująco: ŷTP dla zmiennej objaśnianej na okres TP wyliczmy yˆTP xTP a ŚREDNI BŁĄD PREDYKCJI (STP) 2 TP S S xTP X X x 1 2 e 1 T STP S 2 TP T TP Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 21 PROGNOZA PRZEDZIAŁOWA Przedział ufności dla nieznanej wartości zmiennej objaśnianej w okresie TP. yTP PyˆTP t ,r STP yTP yˆTP t ,r STP 1 gdzie: 1 u - poziom ufności r n 1 - liczba stopni swobody t , r - wartość krytyczna rozkładu Studenta o r stopniach swobody przy poziomie istotności Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 22 Komentarz do miar wyznaczanych przez arkusz kalkulacyjny EXCEL (analiza danych, regresja) Wielokrotność R - współczynnik korelacji wielorakiej R kwadrat – współczynnik determinacji (R2) n R2 WSK OSK _ ^ (Yt Y) 2 t 1 _ Yt Y t 1 n 2 1 RSK OSK gdzie: WSK - wyjaśniona suma kwadratów (ta część zmienności zmiennej objaśnianej, która została wyjaśniona przez model) RSK – resztowa suma kwadratów (ta część zmienności zmiennej objaśnianej, której model nie wyjaśnia) OSK – ogólna suma kwadratów OSK=WSK+RSK n RSK Yt Ŷ 2 t 1 Dopasowany R kw – skorygowany R kwadrat2 (współczynnik determinacji skorygowany stopniami swobody). Pozwala porównać dopasowanie równań różniących się ilością zmiennych objaśniających. R2 1 var( ) eT e n k 1 _ var( y ) T 2 Y Y n( y ) n 1 Błąd standardowy – pierwiastek z wariancji resztowej ( Se Obserwacje – liczba obserwacji (n) Se2 ) Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 23 ANALIZA WARIANCJI df – degrees of freedom – liczba stopni swobody liczba zmiennych objaśniających (k) liczba obserwacji pomniejszona o liczbę szacowanych parametrów (n k1) lub (n k) dla modelu bez wyrazu wolnego razem (k+ n k1= n1) lub (k+ n k= n) dla modelu bez wyrazu wolnego SS – sum of squares (kolejno: WSK, RSK, OSK) MS – mean of squares (kolejno: WSK/k, k – liczba zmiennych objaśniających, RSK/(n-k-1), (k+1)liczba szacowanych parametrów. WSK k n k 1R 2 F RSK n k 1 k 1 R2 Statystyka F Statystyka F ma rozkład Fishera. Jest ona związana z hipotezą odnośnie istotności szacunków parametrów. H0: 1=2=...=k=0 Wszystkie zmienne objaśniające są nieistotne; nie mają wpływu na zmienną objaśnianą H1: co najmniej jeden z parametrów jest różny od zera Co najmniej jedna zmienna objaśniająca ma wpływ na zmienną objaśnianą Uwaga! Stosowanie testów t oraz F jest poprawne przy założeniu, że składnik losowy ma rozkład normalny