W tym rozdziale zajmiemy się problemem oszacowania błędu markowowskich algorytmów Monte Carlo. W odróżnieniu od wstępnych rozważań w Rozdziale 10, będą nas interesowały ścisłe nierówności, a nie oceny oparte na twierdzeniach granicznych. Skupimy się na rozkładzie spektralnym macierzy przejścia. Jest to najbardziej znana i zapewne najskuteczniejsza metoda otrzymywania dobrych oszacowań, przynajmniej dla łańcuchów odwracalnych na przestrzeni skończonej.
Rozważmy łańcuch nieprzywiedlny i odwracalny z macierzą przejścia
Niech
Warunek odwracalności możemy zapisać w postaci
gdzie
Odwracalność
Znaczy to, że
Wiadomo, że
Reprezentacja spektralna macierzy
gdzie
lub, równoważnie,
są prawostronnymi wektorami własnymi macierzy
Lewostronne wektory własne
przy tym
Zauważmy jeszcze, że pierwszy (lub raczej - zerowy) składnik jest macierzą stabilną (o jednakowych wierszach):
Reprezentacja spektralna prowadzi do zgrabnych wyrażeń na potęgi macierzy. Łatwo zauważyć, że
(15.1) |
Wiemy, że wszystkie wartości własne
Jest to nic innego jak teza Słabego Twierdzenia Ergodycznego (Twierdzenie 14.5), otrzymana zupełnie inną metodą,
przy założeniu odwracalności. Można pokazać, że warunek
Następujący lemat będzie podstawą dalszych rozważań i umożliwi ,,przerobienie” STE na jawne wyniki. Zdefiniujmy
Załóżmy, że łańcuch jest nieokresowy, więc
Jeżeli
Wystarczy zauważyć, że
Korzystamy tu z faktu, że
Przejdźmy teraz do jawnych oszacowań szybkości zbieżności w STE.
Wyniki zawarte z tym podrozdziale pochodzą z pracy Diaconisa i Strooka [5].
Dla rozkładu prawdopodobieństwa
Ta ,,odległość” nie ma własności symetrii, więc nie jest metryką, ale to nie przeszkadza. Istotna jest
interpretacja
Jeśli łańcuch odwracalny, nieprzywiedlny i nieokresowy ma rozkład początkowy
Zastosujmy Lemat 15.1 do wektora
Dla łańcucha o rozkładzie początkowym skupionym w punkcie
Istotnie, mamy jeszcze jedno wyrażenie na ,,odległość”
Wystarczy teraz podstawić
Istnieje prosta nierówność pomiędzy normą pełnego wahania i ,,odległością”
Wynika to z następującego rachunku:
Stąd natychmiast otrzymujemy wniosek
Rozważmy zadanie obliczania wartości oczekiwanej
Jeśli łańcuch jest odwracalny, nieprzywiedlny, nieokresowy i ma rozkład początkowy
gdzie
Mamy
Rozważmy teraz naturalny estymator
Jest to średnia wzdłuż trajektorii łańcucha, dlugości
Dla dowolnego
Wynika to z nierówności trójkąta i wzoru na sumę szeregu geometrycznego:
Zwróćmy uwagę, że obciążenie maleje w tempie geometrycznym przy
Oszacowanie błędu średniokwadratowego (BŚK) estymatora MCMC jest znaczne trudniejsze i subtelniejsze, niż obciążenia.
Zacznijmy od wyprowadzenia kolejnego wzoru na asymptotyczną wariancję. Przypomnijmy, że zgodnie ze Stwierdzeniem 14.1,
gdzie
Skorzystajmy z reprezentacji spektralnej macierzy
Z definicji macierzy
Wreszcie, ponieważ
Zauważmy teraz, że wektor
Dla łańcucha odwracalnego, wzór na asymptotyczną wariancję przybiera postać
gdzie
Wynika stąd ważna nierówność.
Dla łańcucha odwracalnego mamy następujące oszacowanie asymptotycznej wariancji:
gdzie
Istotnie,
a łatwo widzieć, że
Na zakończenie przytoczę jeszcze kilka sugestywnych wzorów.
Macierz
Ponieważ
uzasadnia to interpretację macierzy
Dorzućmy przy okazji jeszcze jedno wyrażenie na asymptotyczną wariancję:
Jeśli
Wyniki w tym podrozdziale zostały otrzymane przez Aldousa [1].
Pomysł polega na tym, żeby najpierw otrzymać nierówność dla łańcucha stacjonarnego,
a potem postarać się o uogólnienie dla łańcucha o dowolnym rozkładzie początkowym.
Przypomnijmy oznaczenia
Dla dla łańcucha nieprzywiedlnego, odwracalnego i stacjonarnego,
gdzie
Korzystamy ze stacjonarności i z rozkładu spektralnego macierzy
Zwróćmy uwagę na miejsce, w którym pomijamy składniki odpowiadające ujemnym wartościom własnym.
Uzasadnienie jest takie, że dla ,
Niech teraz
Rozpatrzmy łańcuch o rozkładzie początkowym
będzie średnią długości
Dla dla łańcucha nieprzywiedlnego, odwracalnego startującego z dowolnego rozkładu
gdzie
Na mocy Stwierdzeń 15.4 i 15.2 mamy
bo
Nierówność podane przez Aldousa w cytowanej pracy była nieco inna.
Dla dla łańcucha nieprzywiedlnego, odwracalnego startującego z dowolnego rozkładu
gdzie
Istotnie, załóżmy, że łańcuch startuje z deterministycznie wybranego punktu
i zastosujmy Stwierdzenie 15.4. Wykorzystaliśmy tu nierówność
W powyższym wzorze symbol
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.