t - WSEHSK

Transkrypt

t - WSEHSK
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
1
MODEL EKONOMETRYCZNY
„Model jest to schematyczne uproszczenie, pomijające nieistotne aspekty w celu
wyjaśnienia wewnętrznego działania, formy lub konstrukcji bardziej
skomplikowanego mechanizmu.” (Lawrence R. Klein)
ZALETY MODELU- możliwość względnie taniego eksperymentowania, możliwość
analizy, realizacji prognozy, symulacji.
Model ekonometryczny- formalny matematyczny zapis istniejących
prawidłowości ekonomicznych. Celem takiego modelu może być opis zależności,
przewidywanie przyszłego kształtowania się zależności, symulacja.
KLASYFIKACJA MODELI EKONOMETRYCZNYCH
 Ze względu na wyróżnione cechy:
występowanie lub brak w modelu zmiennej losowej;
modele deterministyczne lub stochastyczne.
 ze względu na formę związku między zmiennymi występującymi w modelu;
modele liniowe i nieliniowe
 ze względu na ilość rozpatrywanych zależności
modele jednorównaniowe i wielorównaniowe
 ze względu na czynnik czasu;
modele statyczne [związki zachodzą w tej samej jednostce czasowej] i
modele dynamiczne [uwzględniają czynnik czasu w formie opóźnień lub
zmiennej czasowej]
 ze względu na charakter analizowanych związków;
modele przyczynowo-skutkowe i modele symptomatyczne.
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
2
KLASYFIKACJA ZMIENNYCH I PARAMETRÓW
WYSTĘPUJĄCYCH W EKONOMETRYCZNYCH MODELACH.
Zmienne endogeniczne i egzogeniczne w modelu ekonometrycznym.
Zmienne egzogeniczne (zmienne objaśniające w modelu, wśród nich zmienne
sterujące będące przedmiotem polityki gospodarczej).
Zmienne objaśniane i objaśniające (dot. danego równania )
Zmienne z góry ustalone (zm. egzogeniczne, zmienne endogeniczne z
opóźnieniami i z wyprzedzeniami, zmienna czasowa-wyrażająca systematyczne
zmiany w czasie zmiennej endogenicznej).
Zmienne zerojedynkowe (dla określenia czynników niemierzalnych).
Składnik losowy ( zmienna wyrażająca łączny efekt tych czynników, które nie
zostały wyspecyfikowane w modelu, a także z błędów wynikających z przyjęcia
niewłaściwej postaci funkcyjnej modelu, błędów pomiaru wartości zmiennych.
Parametry struktury stochastycznej modelu (parametry rozkładu składnika
losowego)
Parametry strukturalne modelu (parametry występujące przy kolejnych
zmiennych, określające kształtowanie zmiennej objaśnianej).
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
3
ETAPY ANALIZY EKONOMETRYCZNEJ
SPECYFIKACJA ZMIENNYCH I DOBÓR POSTACI MODELU
USTALENIE PRZEDMIOTU BADANIA, LISTA ZMIENNYCH
OBJAŚNIAJĄCYCH I OBJAŚNIANYCH, POSTAĆ FUNKCYJNA MODELU.
W OPARCIU O TEORIĘ EKONOMII, ZEBRANE DANE STATYSTYCZNE, KORELACJE.
ZEBRANIE DANYCH STATYSTYCZNYCH
ZEBRANIE DANYCH, UPORZĄDKOWANIE (SZEREGI CZASOWE, PRZEKROJOWE,
PRZEKROJOWO-CZASOWE) I ANALIZA PRZYDATNOŚCI DANYCH. OKREŚLENIE
MIERNIKA, PORÓWNYWALNOŚĆ DANYCH.
ESTYMACJA PARAMETRÓW
WYZNACZENIE OCEN PARAMETRÓW STRUKTURALNYCH ORAZ
PARAMETRÓW STRUKTURY STOCHASTYCZNEJ MODELU.
NARZĘDZIE - METODA NAJMNIEJSZYCH KWADRATÓW (MNK).
WERYFIKACJA MODELU
ANALIZA OTRZYMANYCH OCEN PARAMETRÓW STRUKTURALNYCH
I STRUKTURY STOCHASTYCZNEJ MODELU.
WERYFIKACJA MERYTORYCZNA I STATYSTYCZNA.
PRAKTYCZNE WYKORZYSTANIE MODELU
ANALIZA PRAWIDŁOWOŚCI ( HISTORYCZNA ).
PROGNOZOWANIE
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
ESTYMACJA PARAMETRÓW
MODELU EKONOMETRYCZNEGO
(ESTYMACJA PUNKTOWA)
METODA NAJMNIEJSZYCH KWADRATÓW
(MNK)
Model
yt  1 X t1   2 X t 2   k X tk   t
yt - empiryczna wartość zmiennej objaśnianej w okresie t
X tj - empiryczna wartość zmiennej objaśniającej j w okresie t
 j - nieznany parametr stojący przy zmiennej X j
 t - zakłócenie w okresie t (składnik losowy)
Zapis macierzowy modelu
1 
 x11 x12  x1k 
 
x

21 x 22  x 2k
 2
1 
 y1 
 
y 
2
2




α

ε

X
y


   
 
  
 
 


 
 k 
 n 
 x n1 . x n 2  x nk 
 yn 
y  Xα  ε
4
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Model po oszacowaniu parametrów
strukturalnych
yt  a1 X t1  a2 X t 2  ak X tk  et
lub
yˆt  a1 X t1  a2 X t 2  ak X tk
yt - empiryczna wartość zmiennej objaśnianej w okresie t
ŷt - teoretyczna wartość zmiennej objaśnianej w okresie t
X tj - empiryczna wartość zmiennej objaśniającej j w okresie t
a j - oszacowany parametr stojący przy zmiennej X j
et -realizacja zakłócenia w okresie t (reszta w okresie t)
Zapis macierzowy oszacowanego modelu
 x11 x12
 y1 
 yˆ1 
x
y 
 yˆ 
x22
21
2
2



X
y
yˆ 
 

  
 

 
ˆ 
 xn1. xn 2
 yn 
 yn 
 a1 
a 
a   2
  
 
a k 
 e1 
 x1k 
e 

 x2 k 
e   2

  

 
 xnk 
e n 
y  Xa  e
gdzie
lub
e  y  yˆ
yˆ  Xa
5
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
6
Wzór MNK
(Wyprowadzenie wzoru)
Minimalizujemy sumę kwadratów reszt modelu:
n

t 1
2
et 
 eT e 
 y  Xa  y  Xa  
T
T
T
T
T
T
 y y  2a X y  a X Xa  min
Znajdujemy wartość najmniejszą powyższej funkcji
(pochodna po a przyrównana do 0)
 2X y  2X Xa  0
T
T
T

 X X
T
X Xa  X y
T
:2

1
lewostronnie
Wzór MNK ma postać:


1
a X X X y
T
T
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
WARUNKI STOSOWALNOŚCI MNK
7
1. Zmienna objaśniana y jest zmienną losową,
2. Zmienne objaśniające X nie są zmiennymi losowymi,
3. n>k , tzn. liczba obserwacji n powinna być większa
od liczby szacowanych parametrów (zmiennych
objaśniających) k
4. zmienne objaśniające nie mogą być współliniowe, tzn
wektory obserwacji zmiennych objaśniających (kolumny
macierzy X) powinny być liniowo niezależne.
5. składnik losowy musi spełniać następujące założenia:
 t : N(0, 2 ),
 E(t )=0,
 D2 (t )=2 oraz
 Cov (ij) =0, ij
W zapisie macierzowym 4 powyższe założenia
sprowadzają się do następującej postaci macierzy wariancji i
kowariancji składnika losowego
 2 0

2
0

E ( T )   2   
 ... ...

0
 0
... 0 

... 0 
... ... 
2
...  
Przy w/w założeniach MNK daje estymatory:
 zgodne,
 nieobciążone i
 najefektywniejsze.
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
8
Estymacja przedziałowa parametrów
strukturalnych modelu
Zakładając, że t:N(0,) dla każdego t otrzymujemy, że estymatory
(aj) parametrów (j) mają również rozkłady normalne:
a j : N  j , Da j 
W praktyce zastępujemy nieznane odchylenie standardowe D(aj)
odchyleniem S(aj) postaci:
 
S a j  Se2  c jj
gdzie:
c jj - j-ty element głównej przekątnej macierzy (X X)
T
S e2
-1
- wariancja resztowa wyliczana jako:
1
S 
( y T y  a T XT y )
nk
2
e
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Można oszacować nieznane wartości parametrów używając
techniki estymacji przedziałowej (przedziały ufności).
Przedział ufności z przyjętym z góry prawdopodobieństwem
u=1- (poziom ufności) pokrywa nieznaną wartość parametru j.
Pa j  t ,r S a j     a j  t ,r S a j  1  
t,r
- wartość krytyczna zmiennej o rozkładzie t-Studenta
dla r=n-k stopniach swobody przy ustalonym z góry poziomie
istotności ().
9
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
10
Miara dopasowania oszacowanego modelu
do danych empirycznych
(współczynnik determinacji R2)
Mówi nam w jakim procencie zmienność y
jest objaśniana przez model.
 W modelu musi występować wyraz wolny.
 Interpretacja jest poprawna pod warunkiem, że
badane związki są liniowe.
 R2 przyjmuje wartości z przedziału (0, 1)
n
R2  1 
2
e
t
t 1
n
2


y

y
 t

t 1
T
e e
R  1 T
y y  ny 2
2
T T
2
a
X
y

n
y
R2  T
y y  ny 2
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
ŚREDNI BŁĄD SZACUNKU
(SEE-Standard Error of Estimation)
Wariancja resztowa
1 T
S 
e e
nk
1
2
T
T T
Se 
(y y  a X y )
nk
2
e
Średni błąd szacunku
Se  S
2
e
Przewidywane przez oszacowane równanie (model)
wartości zmiennej objaśnianej y (y teoretyczne)
średnio różnią się od empirycznych wartości tej
zmiennej (y empiryczne) o wartość błędu Se.
11
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Testowanie istotności ocen parametrów
12
(tj. testowanie trafności doboru zmiennej objaśniającej)
HIPOTEZY
H0: j = 0
(zmienna Xj nie ma wpływu
na zmienną objaśnianą y)
H1: j  0
(zmienna Xj ma wpływ
na zmienną objaśnianą y)
SPRAWDZIAN
t a j  
aj
S a j 
S(aj) jest średnim błędem szacunku nieznanego parametru j.
 
S aj 
2
Se  c jj
cjj jest j-tym elementem głównej przekątnej macierzy (XTX)-1.
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Statystyka t(aj) ma rozkład Studenta o n-k stopniach swobody.
Wyliczoną wartość sprawdzianu t(aj) porównujemy z odczytaną z tablic
Studenta wartością krytyczną t,r. Jeżeli:
  t(aj)   t,r. nie ma podstaw do odrzucenia hipotezy H0
  t(aj)  > t,r. odrzucamy H0 na korzyść H1.
13
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
14
Testowanie założeń
dla składnika losowego modelu
Macierz wariancji składnika losowego powinna mieć w przypadku
MNK następującą postać:
 2 0

2
0

E ( T )   2   
 ... ...

0
 0
... 0 

... 0 
... ... 
2
...  
W przypadku braku spełnienia założeń odnośnie do składnika
losowego nie wolno używać metody MNK.
1. O przypadku heteroskedstyczności mówimy gdy na głównej
przekątnej tej macierzy są różne elementy.
2. O przypadku autokorelacji powiemy gdy poza główną
przekątną tej macierzy będą elementy niezerowe.
3. Dodatkowo powinniśmy sprawdzić czy składniki losowe mają
rozkłady normalne.
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Testowanie przypadku
heteroskedastyczności
Problem ten najczęściej występuje przy estymacji modelu na
podstawie danych przekrojowych lub przekrojowo-czasowych.
Załóżmy że dane pochodzą z dwóch różnych populacji.
Wówczas na głównej przekątnej macierzy wariancji i kowariancji
2
2
mogą wystąpić dwie różne wartości wariancji:  1 oraz  2 .
Statystyczną istotność różnic testujemy wykorzystując test F
Snedecora.
H 0 :  12   22
H1 :  12   22
Sprawdzianem hipotezy (H0) jest statystyka F Snedecora postaci:
F
Se21
Se22
2
2
przy czym Se1  Se2
o r1  n1  1 oraz r2  n2  1 stopniach swobody
Se21 , Se22 - oznaczają wariancje resztowe dla prób odpowiednio
z populacji pierwszej i z populacji drugiej
Jeżeli F  F , r1 , r2 przy określonym poziomie istotności , to należy
użyć uogólnionej MNK (UMNK) zamiast klasycznej MNK.
15
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
16
Testowanie przypadku autokorelacji
składnika losowego
Przyczyny autokorelacji:
1. Dłuższe działanie czynników przypadkowych (powodujących
zaburzenia w normalnym przebiegu zjawiska) niż w czasie przyjętym
za jednostkę.
2. Błędy w budowie modelu.
3. Pominięcie jednej lub kilku istotnych zmiennych objaśniających.
4. Użycie zmiennej z nieprawidłowo określonym opóźnieniem.
5. Przyjęcie niewłaściwej postaci analitycznej modelu.
Test Durbina-Watsona (test DW)
Na początek obliczamy współczynnik autokorelacji reszt
oszacowanego MNK:
r dla modelu
n
r
e e
t t 1
t 2
n
n
e e
t 1
et
2
t
t 2
2
t 1
- reszta empiryczna dla okresu t w modelu oszacowanym MNK
Następnie weryfikujemy poniższe hipotezy ( jest nieznanym
współczynnikiem autokorelacji składnika losowego):
H0:   0
(nie istnieje autokorelacja)
H1 :   0
(istnieje autokorelacja dodatnia; jeżeli r jest dodatni)
lub
H1 :   0
(istnieje autokorelacja ujemna; jeżeli r jest ujemny)
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
17
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: >0 jest
statystyka d.
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: <0 jest
statystyka 4d.
Statystyka
d
ma rozkład Durbina-Watsona.
n
d
2


e

e
 t t 1
t 2
n
e
t 1
2
t
Jeżeli ddL odrzucamy H0 na rzecz H1. Istnieje autokorelacja.
Jeżeli ddU przyjmujemy H0. Brak autokorelacji.
Jeżeli dL<d<dU test nie daje odpowiedzi. Nie możemy podjąć decyzji o
przyjęciu lub odrzuceniu H0. Należy podjąć decyzję o powiększeniu próby.
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
Testowanie normalności zakłóceń
(składnika losowego)
TEST JARQUE-BERA (TEST JB)
TEST JB jest oparty o trzeci oraz czwarty moment rozkładu.
Trzeci moment mówi o asymetrii. Dla rozkładów symetrycznych jest on
równy zero (rozkład normalny jest rozkładem symetrycznym).
Czwarty moment mówi o smukłości rozkładu (tzw. kurtoza); (dla rozkładu
normalnego kurtoza=3).
Test JB oparto na porównaniu jak miary asymetrii i kurtozy odbiegają od
wielkości charakterystycznych dla rozkładu normalnego.
H0: składniki losowe podlegają rozkładowi normalnemu
H1: składniki losowe nie podlegają rozkładowi normalnemu
Sprawdzianem testu jest statystyka Jarque-Bera postaci:
1
1
2
JB  n  1  2  3 
24
6

gdzie:
 1 n et3 
1    3 
 n t 1 S 
2
1 n et4
2   4
n t 1 S
1 n 2
S
et

n t 1
Statystyka JB ma rozkład  zawsze o r=2 stopniach swobody
(przykładowo dla poziomu istotności =0,05 wartość krytyczna wynosi
2
 02,05;2  5,991 ).
18
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
19
Wnioskowanie na podstawie statystyki JB
Jeżeli JB   ; 2 , to wówczas nie mamy podstaw do odrzucenia hipotezy H0
mówiącej o tym, że składniki losowe podlegają rozkładowi normalnemu.
2
Jeżeli natomiast JB   ; 2 , to odrzucamy H0 i przyjmujemy hipotezę H1
mówiącą o tym, że składniki losowe podlegają rozkładowi innemu niż
normalny.
2
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
20
Prognozowanie na podstawie modelu
ekonometrycznego
TP – numer okresu na który dokonujemy prognozy
yTP
ŷTP
- nieznana przyszła wartość zmiennej objaśnianej dla okresu TP
x TP
- wektor obserwacji dla zmiennych objaśniających w okresie TP
- przyszła wartość zmiennej objaśnianej dla okresu TP wyliczona na
podstawie modelu ekonometrycznego
(dodatkowy wiersz w macierzy X)
xTP  xTP,1
xTP, 2  xTP, k 
PROGNOZA PUNKTOWA
Wartość prognozy
następująco:
ŷTP
dla zmiennej objaśnianej na okres TP wyliczmy
yˆTP  xTP a
ŚREDNI BŁĄD PREDYKCJI (STP)
2
TP
S


 S xTP X X x  1
2
e
1
T
STP  S
2
TP
T
TP
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
21
PROGNOZA PRZEDZIAŁOWA
Przedział ufności dla nieznanej wartości zmiennej objaśnianej
w okresie TP.
yTP
PyˆTP  t ,r STP  yTP  yˆTP  t ,r STP   1  
gdzie:
1  u
- poziom ufności
r  n  1 - liczba stopni swobody
t , r
- wartość krytyczna rozkładu Studenta o r stopniach swobody przy
poziomie istotności 
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
22
Komentarz do miar wyznaczanych
przez arkusz kalkulacyjny EXCEL
(analiza danych, regresja)
Wielokrotność R - współczynnik korelacji wielorakiej
R kwadrat – współczynnik determinacji (R2)
n
R2 
WSK

OSK
_
^
 (Yt  Y) 2
t 1
_


 Yt  Y 


t 1 
n
2
1
RSK
OSK gdzie:
WSK - wyjaśniona suma kwadratów (ta część zmienności zmiennej objaśnianej,
która została wyjaśniona przez model)
RSK – resztowa suma kwadratów (ta część zmienności zmiennej objaśnianej,
której model nie wyjaśnia)
OSK – ogólna suma kwadratów OSK=WSK+RSK
n

RSK   Yt  Ŷ
2
t 1
Dopasowany R kw – skorygowany R kwadrat2 (współczynnik determinacji
skorygowany stopniami swobody). Pozwala porównać dopasowanie równań
różniących się ilością zmiennych objaśniających.
R2  1
var( )
eT e n  k 
 1
_ 
var( y )
 T
2
Y Y  n( y )  n  1


Błąd standardowy – pierwiastek z wariancji resztowej ( Se 
Obserwacje – liczba obserwacji (n)
Se2
)
Ekonometria – materiały („folie”) do wykładu
D.Miszczyńska, M.Miszczyński
23
ANALIZA WARIANCJI
df – degrees of freedom – liczba stopni swobody
liczba zmiennych objaśniających (k)
liczba obserwacji pomniejszona o liczbę szacowanych parametrów (n k1)
lub (n k) dla modelu bez wyrazu wolnego
razem (k+ n k1= n1) lub (k+ n k= n) dla modelu bez wyrazu wolnego
SS – sum of squares (kolejno: WSK, RSK, OSK)
MS – mean of squares (kolejno:
WSK/k, k – liczba zmiennych objaśniających,
RSK/(n-k-1), (k+1)liczba szacowanych parametrów.

WSK k
n  k  1R 2
F

RSK n  k  1
k 1  R2

Statystyka F

Statystyka F ma rozkład Fishera. Jest ona związana z hipotezą odnośnie
istotności szacunków parametrów.
H0: 1=2=...=k=0
Wszystkie zmienne objaśniające są nieistotne;
nie mają wpływu na zmienną objaśnianą
H1: co najmniej jeden z parametrów jest różny od zera
Co najmniej jedna zmienna objaśniająca ma wpływ
na zmienną objaśnianą
Uwaga! Stosowanie testów t oraz F jest poprawne przy założeniu,
że składnik losowy ma rozkład normalny