Zagadnienia

10. Teoria dużej próbki cd

10.1. Testy asymptotyczne

10.1.1. Testowanie pojedynczego parametru strukturalnego b_{k}

Przyjmujemy założenia Z̃1 – Z̃6. Wówczas dwa poniższe ciągi mają tą samą granicę:

\sqrt{n}(B-\beta)\stackrel{d}{\sim}N(0,S^{2}S_{{xx}}^{{-1}}).

Zatem dla pojedynczej współrzędnej otrzymujemy

\sqrt{n}(B_{k}-\beta _{k})\stackrel{d}{\sim}N(0,S^{2}S_{{xx}}^{{-1}})_{{k,k}}.

Oznaczenie. Błąd standardowy estymatora B_{k} będziemy oznaczać przez SE(B_{k})

SE(B_{k})=\sqrt{\frac{1}{n}S^{2}(S_{{xx}}^{{-1}})_{{k,k}}}.

Testujemy hipotezę H_{0}:\beta _{k}=\bar{\beta}_{k} wobec hipotezy alternatywnej H_{1}:\beta _{k}\neq\bar{\beta}_{k}, gdzie \bar{\beta}_{k} ustalona liczba rzeczywista.

Jako statystykę testową przyjmujemy stosunek odchylenia estymatora od wartości testowej i błędu standardowego estymatora

T_{k}=\frac{B_{k}-\bar{\beta}_{k}}{SE(B_{k})}.
Twierdzenie 10.1

Przy założeniach Z̃1 – Z̃6 i H_{0}

T_{k}=\frac{B_{k}-\bar{\beta}_{k}}{SE(B_{k})}\stackrel{d}{\longrightarrow}N(0,1).

Dowód.
Ponieważ \sqrt{n}(B_{k}-\beta _{k}) zbiega według rozkładu do N(0,Avar(B_{k})) a S^{2}(S_{{xx}}^{{-1}})_{{k,k}} prawie napewno do Avar(B_{k}), to otrzymujemy

T_{k}=\frac{B_{k}-\bar{\beta}_{k}}{\sqrt{\frac{1}{n}S^{2}(S_{{xx}}^{{-1}})_{{k,k}}}}=\frac{\sqrt{n}(B_{k}-\bar{\beta}_{k})}{\sqrt{S^{2}(S_{{xx}}^{{-1}})_{{k,k}}}}\stackrel{d}{\longrightarrow}N(0,1).
\Box

Reguła decyzyjna dla zadanego poziomu istotności \alpha.
1. Na podstawie próbki \omega wyznaczamy realizację statystyki testowej t_{k}=T_{k}(\omega).
2. Wyznaczamy wartość krytyczną t^{\ast}_{{\alpha/2}} jako kwantyl rozkładu normalnego

F(t^{\ast}_{{\alpha/2}})=1-\frac{\alpha}{2},

gdzie F oznacza dystrybuantę rozkładu N(0,1).
3. Jeżeli |t_{k}|<t^{\ast}_{{\alpha/2}} to nie ma podstaw do odrzucenia hipotezy H_{0}.
Jeżeli |t_{k}|\geq t^{\ast}_{{\alpha/2}} to odrzucamy H_{0} na rzecz H_{1}.

Uwaga.
Powyższa reguła jest zgodna z regułami przedstawionymi w rozdziale 5.1, gdyż rozkład t-Studenta wraz ze wzrostem liczby stopni swobody zbiega do standardowego rozkładu normalnego

t(n-K)\stackrel{d}{\longrightarrow}N(0,1).

10.1.2. Testowanie hipotezy liniowości

Zajmiemy sie teraz testowaniem hipotezy, że nieznany parametr \beta=(\beta _{1},\dots,\beta _{K})^{T} spełnia m niezależnych warunków liniowych. Czyli, że należy do podprzestrzeni afinicznej kowymiaru m.

Niech r macierz o współczynnikach rzeczywistych wymiaru m\times K, rzędu m, gdzie m=1,\dots,K, a \tilde{r} wektor kolumnowy wymiaru m. Testujemy hipotezę

H_{0}:\;\; r\beta=\tilde{r},

wobec

H_{1}:\;\; r\beta\neq\tilde{r}.

Jako statystykę testową przyjmujemy statystykę Walda

W=\frac{n}{S^{2}}(rB-\tilde{r})^{T}(rS_{{xx}}^{{-1}}r^{T})^{{-1}}(rB-\tilde{r}).
Twierdzenie 10.2

Przy założeniach Z̃1 – Z̃6 i H_{0}

W=\frac{n}{S^{2}}(rB-\tilde{r})^{T}(rS_{{xx}}^{{-1}}r^{T})^{{-1}}(rB-\tilde{r})\stackrel{d}{\longrightarrow}\chi^{2}(m),

gdzie \chi^{2}(m) oznacza rozkład chi-kwadrat z m stopniami swobody.

Dowód.
Zapiszemy statystykę W jako

W=C_{n}^{T}Q_{n}^{{-1}}C_{n},

gdzie

C_{n}=\sqrt{n}(rB-\tilde{r}),\;\;\; Q_{n}=S^{2}rS_{{xx}}^{{-1}}r^{T}.

Hipoteza zerowa H_{0} implikuje, że r\beta=\tilde{r} i

C_{n}=r(\sqrt{n}(B-\beta)).

Zatem (Tw. 9.1 b.)

C_{n}\stackrel{d}{\longrightarrow}C\sim N(0,r\, Avar(B)\, r^{T}).

Natomiast Q_{n} zbiega do pewnej macierzy deterministycznej Q (Tw. 9.1 d.)

Q_{n}\stackrel{as}{\longrightarrow}Q=r\, Avar(B)\, r^{T}=Var(C).

Ponieważ asymptotyczna macierz wariancji Avar(B) jest dodatnio określona, a wiersze macierzy r są liniowo niezależne (macierz r ma rząd m), to m\times m macierz Q jest odwracalna (jest to macierz Grama wierszy macierzy r). Zatem przechodząc do granicy otrzymujemy

W\stackrel{d}{\longrightarrow}C^{T}Q^{{-1}}C=C^{T}Var(C)^{{-1}}C\sim\chi^{2}(m).
\Box
Uwaga 10.1

Zauważmy, że statystyka Walda daje się wyrazić przez F-statystykę stosowaną w modelu klasycznym (Tw. 5.2)

W=\frac{n}{n-K}mF.

W przypadku gdy spełnione są zarówno aksjomaty modelu klasycznego jak i modelu dużej próbki, to oba podejścia są zgodne. Rzeczywiście gdy n\rightarrow\infty, to

\frac{\chi^{2}(n-K)}{n-K}\stackrel{as}{\longrightarrow}1,

a zatem

F(m,n-K)\stackrel{d}{\sim}\frac{\frac{\chi^{2}(m)}{m}}{\frac{\chi^{2}(n-K)}{n-K}}\stackrel{d}{\longrightarrow}\frac{\chi^{2}(m)}{m}.
Uwaga 10.2

Podobnie jak w modelu klasycznym możemy wyrazić statystykę W za pomocą sum kwadratów reszt. Niech SKR_{o} suma kwadratów reszt dla modelu spełniającego ograniczenie r\beta=\tilde{r}. Wówczas

W=m\frac{SKR_{o}-SKR}{SKR}.
Uwaga 10.3

W modelu z wyrazem stałym (X_{K}=e) współczynnik determinacji daje się wyrazić za pomocą statystyki W wyznaczonej dla K-1 warunków \beta _{1}=\dots=\beta _{{K-1}}=0,

nR^{2}=\frac{W}{1+\frac{W}{n}}.

Zatem, po przejściu z n do granicy otrzymujemy

nR^{2}\stackrel{d}{\longrightarrow}\chi^{2}(m).

10.1.3. Testowanie nieliniowych zależności między parametrami modelu

Metoda delty (Tw. 8.4) pozwala uogólnić test Walda na przypadek zależności nieliniowych. Niech \Phi oznacza submersję

\Phi:\mathbb{R}^{K}\longrightarrow\mathbb{R}^{m},\;\;\; m\leq K,

tzn. odwzorowanie klasy C^{1} o maksymalnym rzędzie pochodnej

\forall p\in\mathbb{R}^{K}\;\;\;\; rank(D\Phi(p))=m.

Dla ustalenia uwagi przyjmiemy, że \Phi(p) jest wektorem kolumnowym.

Będziemy testować hipotezę

H_{0}:\Phi(\beta)=0,

wobec hipotezy alternatywnej

H_{1}:\Phi(\beta)\neq 0.

Jako statystykę testową przyjmujemy statystykę Walda

W=\frac{n}{S^{2}}\Phi(B)^{T}(D\Phi(B)S_{{xx}}^{{-1}}D\Phi(B)^{T})^{{-1}}\Phi(B).
Twierdzenie 10.3

Przy założeniach Z̃1 – Z̃6 i H_{0}

W=\frac{n}{S^{2}}\Phi(B)^{T}(D\Phi(B)S_{{xx}}^{{-1}}D\Phi(B)^{T})^{{-1}}\Phi(B)\stackrel{d}{\longrightarrow}\chi^{2}(m),

gdzie \chi^{2}(m) oznacza rozkład chi-kwadrat z m stopniami swobody.

Dowód.
Z twierdzenia o odwzorowaniu ciągłym (Tw. 8.2) i założenia H_{0} otrzymujemy, że

\Phi(B)\stackrel{as}{\longrightarrow}\Phi(\beta)=0.

Zatem możemy zastosować metodę delty (Tw. 8.4)

\sqrt{n}\Phi(B)=\sqrt{n}(\Phi(B)-\Phi(\beta))\stackrel{d}{\longrightarrow}C\sim N(0,D\Phi(\beta)Avar(B)D\Phi(\beta)^{T}).

Z założeń modelowych wynika, że

S^{2}S_{{xx}}^{{-1}}\stackrel{as}{\longrightarrow}Avar(B),

a z twierdzenia o odwzorowaniu ciągłym, że

D\Phi(B)\stackrel{as}{\longrightarrow}D\Phi(\beta).

Z powyższego wynika, że

S^{2}D\Phi(B)S_{{xx}}^{{-1}}D\Phi(B)^{T}\stackrel{as}{\longrightarrow}D\Phi(\beta)Avar(B)D\Phi(\beta)^{T}=Var(C).

Ponieważ macierz pochodnych ma rząd m to m\times m macierz Var(C) jest odwracalna. Zatem statystyka W jest dobrze zdefiniowana i

W=\frac{n}{S^{2}}\Phi(B)^{T}(D\Phi(B)S_{{xx}}^{{-1}}D\Phi(B)^{T})^{{-1}}\Phi(B)\stackrel{d}{\longrightarrow}C^{T}Var(C)^{{-1}}C\sim\chi^{2}(m).
\Box

10.1.4. Testowanie warunkowej homoskedastyczności – test White'a

Rozważamy model liniowy

Y_{t}=X_{t}\beta+\varepsilon _{t},\;\;\; t=0,1,\dots,

gdzie X_{t} jest K wymiarowym wektorem wierszowym.
Niech

Z_{t}=(Z_{{t,1}},\dots,Z_{{t,m}},1)

wektor złożony z wybranych elementów K\times K macierzy X_{t}^{T}X, m\leq K^{2} i wyrazu stałego. Załóżmy, że proces \{\varepsilon _{t}^{2},Z_{t}\} spełnia warunki Z̃1 – Z̃6 modelu dużej próbki, w szczególności, że istnieją wektor \tilde{\beta} i składnik losowy \varepsilon _{1} takie, że

\varepsilon _{t}^{2}=Z_{t}\tilde{\beta}+\varepsilon _{{1,t}}.

Testujemy hipotezę

H_{0}:\tilde{\beta}_{1}=\dots=\tilde{\beta}_{m}=0,

wobec hipotezy alternatywnej

H_{1}:\exists i\;\;\;\tilde{\beta}_{i}\neq 0.

W teście White reguła decyzyjna opiera się na fakcie, że przy załóżeniu H_{0}

nR^{2}\stackrel{d}{\longrightarrow}\chi^{2}(m),

gdzie R^{2} współczynnik determinacji wyznaczony dla modelu pomocniczego

\xi _{t}^{2}=Z_{t}\tilde{\beta}+\xi _{{1,t}},\;\;\;\xi _{t}=Y-X_{t}B,

w którym składnik losowy \varepsilon zastąpiono składnikiem resztowym \xi z metody MNK.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.