Klasyczny jednorównaniowy liniowy model ekonometryczny -cd. Statystyczna weryfikacja modelu. (1 wykład)
Na tym wykładzie zajmiemy się ”kompletnym” modelem regresji, tzn. przyjmiemy wszystkie pięć założeń Z1 – Z5.
Jeśli zachodzą Z1,Z2,Z3,Z4 i Z5 to estymator NMK ma warunkowy rozkład normalny
Dowód.
Zatem ma rozkład normalny o wartości oczekiwanej 0 i wariancji
Niech pewna ustalona liczba rzeczywista.
Testujemy hipotezę
wobec hipotezy alternatywnej .
Przy założeniach Z1–Z5 i statystyka
ma rozkład -Studenta z stopniami swobody.
Rozkład nie zależy od .
Dowód.
zatem
gdzie
Przy założeniach twierdzenia 5.1:
1. .
2. i są warunkowo względem niezależne.
Dowód.
Ad.1.
zatem
zaś po odpowiednim obrocie układu współrzędnych jest macierzą diagonalną mającą na przekątnej jedynek i zer, zatem
Ad.2.
zatem warunkowy względem rozkład i jest normalny. Ale są one warunkowo nieskorelowane a zatem warunkowo niezależne. Ponieważ zależy od i a od i to są one warunkowo względem niezależne.
Cd. dowodu twierdzenia.
Z lematu wynika, że
ma warunkowy względem rozkład t-Studenta z stopniami swobody. Ponieważ rozkład warunkowy nie zależy od warunkowania to ma ”bezwarunkowy” rozkład t-Studenta z stopniami swobody.
Reguła decyzyjna testu .
Przedstawimy trzy równoważne warianty reguły decyzyjnej dla zadanego poziomu istotności .
Wariant 1.
1. Na podstawie próbki wyznaczamy realizację statystyki testowej .
2. Wyznaczamy wartość krytyczną
3. Jeżeli to nie ma podstaw do odrzucenia hipotezy (akceptujemy ).
Jeżeli to odrzucamy na rzecz .
Wariant 2.
1. Na podstawie próbki wyznaczamy etymator i jego błąd .
2. Wyznaczamy przedział ufności
3. Jeżeli to nie ma podstaw do odrzucenia hipotezy (akceptujemy ).
Jeżeli to odrzucamy na rzecz .
Wariant 3.
1. Na podstawie próbki wyznaczamy realizację statystyki testowej .
2. Wyznaczamy prawdopodobieństwo (tzw. -value)
3. Jeżeli to nie ma podstaw do odrzucenia hipotezy (akceptujemy ).
Jeżeli to odrzucamy na rzecz .
Najczęściej testujemy przypadek . Wówczas przyjecie oznacza, że zmienną objaśniającą należy wykluczyć z naszago modelu. Tzn. jeżeli
to parametr nie jest statystycznie istotny.
Zajmiemy sie teraz testowaniem hipotezy, że nieznany parametr spełnia niezależnych warunków liniowych.
Czyli, że należy do podprzestrzeni afinicznej kowymiaru .
Niech macierz o współczynnikach rzeczywistych wymiaru , rzędu , gdzie , a wektor kolumnowy wymiaru . Testujemy hipotezę
wobec
Przy założeniach Z1–Z5 i statystka
ma rozklad F-Snedecora (rozkład z i stopniami swobody).
Jeśli i są niezależnymi zmiennymi losowymi o rozkładzie o odpowiednio i stopniach swobody to zmienna losowa
ma rozkład ([12] s.44-46).
Dowód twierdzenia.
Dzielimy licznik i mianownik przez i podstawiamy . Otrzymujemy
gdzie
Jak pokazaliśmy w lemacie 5.2 .
Przy założeniach twierdzenia 5.2:
1. .
2. i są warunkowo względem niezależne.
Dowód.
Ad.1.
Przyjmijmy oznaczenie .
Z wynika, że , zatem
Ponieważ warunkowy rozkład względem jest normalny (lemat 5.1)to
Rzeczywiście
A więc
i są warunkowo względem niezależne. Ponieważ zależy od i a od i to również one są warunkowo względem niezależne.
Cd. dowodu twierdzenia.
Z lematu wynika, że statystyka
ma warunkowy względem rozkład F-Snedecora .
Ponieważ rozkład warunkowy nie zależy od warunkowania to ma ”bezwarunkowy” rozkład .
Reguła decyzyjna testu .
Przedstawimy dwa równoważne warianty reguły decyzyjnej dla zadanego poziomu istotności .
Wariant 1.
1. Na podstawie próbki wyznaczamy realizację statystyki testowej .
2. Wyznaczamy wartość krytyczną
3. Jeżeli to nie ma podstaw do odrzucenia hipotezy (akceptujemy ).
Jeżeli to odrzucamy na rzecz .
Wariant 2.
1. Na podstawie próbki wyznaczamy realizację statystyki testowej .
2. Wyznaczamy prawdopodobieństwo (tzw. -value)
3. Jeżeli to nie ma podstaw do odrzucenia hipotezy (akceptujemy ).
Jeżeli to odrzucamy na rzecz .
Statystyka w terminach sumy kwadratów reszt.
Statystykę mozna wyrazić w prostszy sposób wykorzystując sumę kwadratów reszt modelu ograniczonego
Dowód.
Krok 1. Pokażemy, że estymator OMNK (metody najmniejszych kwadratów z ograniczeniami) wynosi
Rozważamy funkcję Lagrange'a
gdzie jest -elementowym wektorem wierszowym.
Różniczkujemy po współrzędnych .
gdzie -elementowym wektorem kolumnowym o współrzędnych 0 i 1
Ponieważ wszystkie pochodne cząstkowe zerują się w punktach, w których funkcja przyjmuje minimum to
Czyli po transpozycji mamy
Po przemnożeniu przez macierz otrzymujemy
Ponieważ rząd macierzy wynosi , a macierz jest prawie na pewno dodatnio określona, to macierz jest prawie na pewno odwracalna. Zatem
Czyli
Krok 3.
Ponieważ , a to otrzymujemy
Sprowadzanie modelu ograniczonego do modelu z mniejszą liczbą parametrów.
Rozwiązanie ogólne układu równań liniowych mozna zapisać w postaci parametrycznej:
gdzie jest wektorem kolumnowym , jest macierzą , a wektor kolumnowy jest wektorem nieznanych parametrów, które należy wyestymować. Zauważmy, że
Model z ograniczeniami można zapisać w następujący sposób:
Po podstawieniu i otrzymujemy równoważny mu model zredukowany
Niech będzie estymatorem MNK dla modelu zredukowanego. Wówczas jest estymatorem dla modelu z ograniczeniami. Zauważmy, że w obu wypadkach mamy ten sam składnik resztowy .
Test istotności regresji dla regresji z wyrazem wolnym.
W przypadku gdy ostatni parametr jest wyrazem wolnym, czyli gdy ,
stosuje się często następujący wariant testu liniowości:
W tym przypadku jest wymiarową macierzą o wyrazach
a .
Statystyka wynosi wtedy
można wyrazić za pomocą współczynnika determinacji
Dowód.
Dlatego też
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.