Zagadnienia

9. Teoria dużej próbki

Teoria dużej próbki. Założenia modelu. Asymptotyczne własności estymatorów MNK. Statystyczna weryfikacja modelu. (2 wykłady)

9.1. Założenia modelu

W teorii dużej próbki przez model rozumie się K+1 wymiarowy proces stochastyczny

Yt,Xtt=0

spełniający pewne założenia.

Z̃1. Liniowość.

βRKεtt=0Yt=Xtβ+εt,t=0,1,,

Z̃2. Stacjonarność i ergodyczność.
K+1
wymiarowy proces stochastyczny Yt,Xtt=0 jest stacjonarny i ergodyczny.

Uwaga.
Z warunków Z̃1 i Z̃2 wynika, że również proces εtt=0 jest stacjonarny i ergodyczny.

Z̃3. Warunek maksymalnego rzędu.
Proces Xt jest klasy L2 i K×K macierz

Σxx=EXtTXt

jest odwracalna.

Uwaga.
Ze stacjonarności procesu Xt wynika, że macierz Σxx nie zależy od t.

Z̃4. Ortogonalność zmiennych objaśniających do składnika losowego.

EεtXt=0,t=0,1,.

Oznaczenie.

gt=εtXt.

Uwaga.
Z warunków Z̃1 i Z̃2 wynika, że również proces gtt=0 jest stacjonarny i ergodyczny.

Z̃5. Martyngałowość.
Proces gtt=0 jest ciągiem przyrostów martyngałowych, gt jest klasy L2 i K×K macierz

Σgg=EgtTgt

jest odwracalna.

Uwaga.
1. Ze stacjonarności procesu gt wynika, że macierz Σgg nie zależy od t.
2. Z centralnego twierdzenia granicznego (8.6) wynika , że Σgg jest równa asymptotycznej wariancji procesu średnich g¯t

Σgg=Avarg¯t,g¯t=1ts=0t-1gs.

Z̃6. Warunkowa homoskedastyczność.

E(εt2|Xt)=σ2>0,t=0,1,.
Lemat 9.1

Z warunków Z̃2 i Z̃6 wynika, że

Σgg=σ2Σxx.

Dowód.
gt=εtXt
, zatem

Σgg=E(gTtgt)=E(ε2XtTXt)=E(E(εt2XtTXt|Xt))=
=E(E(ε2t|Xt)XtTXt)=E(σ2XtTXt)=σ2E(XtTXt)=σ2Σxx.
Uwaga 9.1

Aksjomaty modelu dużej próbki (poza Z̃2) są słabsze od aksjomatów Z modelu klasycznego. Otóż, niech Yt,Xtt=0 będzie K+1 wymiarowym, klasy L2, stacjonarnym i ergodycznym procesem stochastycznym, wówczas jeśli dla każdego n>K jego początkowy fragment Yt,Xtt=0n spełnia aksjomaty Z1, Z2, Z3, Z4 i Z5 to spełnia on Z̃1, Z̃2, Z̃3, Z̃4, Z̃5 i Z̃6.

9.2. Asymptotyka estymatorów MNK

Niech Yt,Xtt=0 będzie procesem generującym dane. W modelu dużej próbki, podobnie jak w modelu klasycznym, będziemy estymowali parametry modelu β i σ2 w oparciu o metodę najmniejszym kwadratów. Niech n oznacza ilość obserwacji (nK), X macierz wymiaru n×K, której wierszami są wektory losowe Xt a Y wektor kolumnowy wymiaru n o wyrazach Yt. Estymatory MNK możemy zapisać na dwa sposoby jako iloczyn macierzy X i Y lub za pomocą średnich z iloczynów Xt i Yt.

Gdy macierz X ma rząd maksymalny czyli K, to estymator MNK wektora β wynosi

B=XTX-1XTY=Sxx-1Sxy,

gdzie

Sxx=1nXTX=1nt=0n-1XtTXt,
Sxy=1nXTY=1nt=0n-1YtXtT.

W wyjątkowych przypadkach gdy rząd macierzy X jest mniejszy niż K to jako B bierzemy dowolny wektor minimalizujący sumę kwadratów reszt – patrz uwaga 2.1.

Natomiast estymator MNK parametru σ2 wynosi

S2=ξTξn-K=1n-Kt=0n-1ξt2,

gdzie

ξt=Yt-XtB.

Omówimy teraz podstawowe własności powyższych estymatorów w zależności od wielkości próbki n.

Twierdzenie 9.1

Własności estymatorów B i S2:
a. Zgodność B

Z̃1 – Z̃4limnB=βp.n.

b. Asymptotyczna normalność B

Z̃1 – Z̃5nB-βdN0,AvarB,

gdzie

AvarB=Σxx-1ΣggΣxx-1.

Jeśli dodatkowo założymy Z̃6, to

AvarB=σ2Σxx-1.

c. Zgodność S2

Z̃1 – Z̃4limnS2=Eε02p.n.

Jeśli dodatkowo założymy Z̃6, to

plimnS2=σ2.

d. Zgodna estymacja AvarB

Z̃1 – Z̃6limnS2Sxx-1=AvarBp.n.

Dowód.
Mamy dwa równania opisujące zależność Yt od Xt:

Yt=Xtβ+εt,
Yt=XtB+ξt.

Po odjęciu stronami otrzymujemy:

XtB-β=εt-ξt. (9.1)

Mnożymy obie strony przez XtT

XtTXtB-β=εtXtT-ξtXtT.

Następnie liczymy średnią po t. Biorąc pod uwagę, że t=0n-1ξtXtT=XTξ=0 (patrz wniosek 2.1) otrzymujemy:

SxxB-β=1nt=0n-1XtTXtB-β=1nt=0n-1εtXtT=g¯nT.

Ponieważ proces XtTXt jest stacjonarny i ergodyczny to

Sxx=1nt=0n-1XtTXtasEXtTXt=Σxx.

Macierz Σxx jest odwracalna (warunek Z̃3), zatem dla dużych n również macierz Sxxω jest odwracalna. W wyjątkowych przypadkach gdy detSxxω=0 dookreślamy Sxx-1ω w dowolny sposób.

Po przemnożeniu obu stron przez macierz Sxx-1 otrzymujemy równość analogiczną do 4.2

B-β=Sxx-1g¯n+γn, (9.2)

gdzie γnω=0 dla n odpowiednio dużych.

Ad. a.
Ponieważ proces gt jest stacjonarny i ergodyczny to z warunku Z̃4 otrzymujemy

limng¯n=Eg0=0p.n.

Zatem

limnB-β=limnSxx-1g¯n=Σxx-10=0p.n.

Ad. b.
Proces gt oprócz tego, że jest stacjonarny i ergodyczny to jest ciągiem przyrostów martyngałowych, a więc ((8.6))

ng¯dN0,Σgg.

Zatem

nB-βdN0,Σxx-1ΣggΣxx-1.

Jeśli ponadto założymy Z̃6 to

Σgg=σ2Σxx,

zatem

AvarB=Σxx-1ΣggΣxx-1=Σxx-1σ2ΣxxΣxx-1=σ2Σxx-1.

Ad. c.
Przepisując odpowiednio równanie 9.1 otrzymujemy

ξt=εt-XtB-β.

Zatem

ξt2=εt2-2gtB-β+B-βTXtTXtB-β.

Po uśrednieniu otrzymujemy

1nt=0n-1ξt2=1nt=0n-1εt2-2g¯nB-β+B-βTSxxB-β.

Przechodzimy do granicy. Ponieważ

limnB-β=0=limng¯n, oraz limnSxx=Σxxp.n.,

to otrzymujemy, że

limn1nt=0n-1ξt2=Eε2p.n.

Zatem

limnS2=limnnn-K1nt=0n-1ξt2=Eε2p.n.

Jeśli ponadto założymy Z̃6 to

E(ε2)=E(E(ε2|Xt))=σ2,

zatem

limnS2=σ2p.n.

Ad. d.
Korzystając z warunku Z̃6 otrzymujemy

limnS2Sxx-1=σ2Σxx-1=AvarBp.n.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.