Wiele spośród ogólnych metod generowania zmiennych losowych jest całkowicie niezależnych od wymiaru. W szczególności, metody eliminacji, kompozycji i przekształceń są z powodzeniem stosowane do generowania zmiennych losowych wielowymiarowych. Wyjątek stanowi ,,najbardziej ogólna” metoda odwracania dystrybuanty, która nie ma naturalnego odpowiednika dla wymiaru większego niż 1.
Jest to właściwie jedyna metoda ,,w zasadniczy sposób wielowymiarowa”. Opiera się na przedstawieniu gęstości łącznej zmiennych losowych jako iloczynu gęstości brzegowej i gęstości warunkowych (wzór łańcuchowy):
Wynika stąd następujący algorytm:
for to do |
Gen |
Ograniczymy się do zmiennych losowych pochodzących z rozkładu dwuwymiarowego o gęstości
Jak wiadomo (można to sprawdzić elementarnym rachunkiem),
To znaczy, że jest rozkładem brzegowym oraz
jest rozkładem warunkowym dla . Algorytm jst więc następujący.
Gen |
Efekt działania powyższego algorytmu widać na Rysunku 5.1. W tym konkretnym przykładzie ma rozkład brzegowy , zaś ma rozkład warunkowy . Zauważmy, że i . Prosta jest wykresem funkcji regresji i jest przedstawiona na wykresie. Pokazane są też poziomice gęstości (elipsy). Warto zwrócić uwagę, że funkcja regresji nie pokrywa się ze wspólną osią tych elips. Dlaczego? Jak obliczyć oś?
Uogólnienie na przypadek rozkładu normalnego , z niezerowymi średnimi, jest banalne. Uogólnienie na wyższe wymiary też nie jest skomplikowane. Okazuje się jednak, że metoda rozkładów warunkowych dla rozkładów normalnych prowadzi to do algorytmu identycznego jak otrzymany metodą przekształceń.
Podstawą jest następujące twierdzenie o przekształcaniu gęstości.
Załóżmy, że jest -wymiarową zmienną losową o wartościach w otwartym zbiorze . Jeżeli
i jest dyfeomorfizmem, to
Rozważmy niezależne zmienne losowe . Wektor ma -wymiarowy rozkład normalny o gęstości
Jeżeli teraz R jest nieosobliwą macierzą to przekształcenie jest dyfeomorfizmem z jakobianem . Z Twierdzenia 5.1 wynika, że wektor losowy ma rozkład normalny o gęstości
gdzie . Innymi słowy, . Algorytm generacji jest oczywisty:
Gen |
Rozmaitych rozkładów wielowymiarowych jest więcej, niż gwiazd na niebie – a wśród nich tyle przykładów ciekawych i ważnych! Musiałem wybrać zaledwie kilka z nich. Rzecz jasna, wybrałem te, które mi się szczególnie podobają.
Najważniejszy, być może, przykład to wielowymiarowy rozkład normalny, omówiony już w 5.2. Rozpatrzymy teraz rozklady jednostajne na kuli
i sferze
Oczywiście, oznacza normę euklidesową, . Rozkład ma po prostu stałą gęstość względem -wymiarowej miary Lebesgue'a na kuli. Rozkład ma stałą gęstość względem -wymiarowej miary ,,powierzchniowej” na sferze. Oba te rozkłady są niezmiennicze względem obrotów (liniowych przekształceń ortogonalnych) . Takie rozkłady nazywamy sferycznie symetrycznymi lub krócej: sferycznymi. Zauważmy, że zmienną losową o rozkładzie możemy interpretować jako losowo wybrany kierunek w przestrzeni -wymiarowej. Algorytmy ,,poszukiwań losowych” często wymagają generowania takich losowych kierunków.
Rozkłady jednostajne na kuli i sferze są blisko ze sobą związane.
Jeśli i to
Łatwo też zauważyć, że jest zmienną losową o rozkładzie niezależną od .
Jeśli i jest niezależną zmienną losową o rozkładzie to .
Zmienną łatwo wygenerować metodą odwracania dystrybuanty.
Najprostszy wydaje się algorytm eliminacji:
repeat |
Gen |
until |
W istocie, dokładnie ta metoda, dla , była częścią algorytmu biegunowego Marsaglii. Problem w tym, że w wyższych wymiarach efektywnosc eliminacji gwałtownie maleje. Prawdopodobieństwo akceptacji jest równe stosunkowi ,,objętości” kuli do kostki . Ze znanego wzoru na objętość kuli -wymiarowej wynika, że
Zbieżność do zera jest bardzo szybka. Dla dużego kula jest znikomą częścią opisanej na niej kostki.
Inna metoda, którą z powodzeniem stosuje się dla jest związana ze współrzędnymi biegunowymi:
Gen ; |
; |
Gen ; |
; |
Gen |
Efekt działania algorytmu ,,współrzędnych sferycznych” jest widoczny na trzech początkowych obrazkach na Rysunku 5.2. Górny lewy rysunek przedstawia punkty widoczne ,,z płaszczyzny równika”, czyli . Górny prawy – te same punkty widziane ,,znad bieguna”, czyli . Dolny lewy – górną półsferę widzianą ,,skośnie”, czyli , gdzie . Dla porównania, na ostatnim rysunku po prawej stronie u dołu – punkty wylosowane rzeczywiście z rozkładu przy pomocy poprawnego algorytmu podanego niżej.
Gen ; |
; |
; |
Gen ; |
; |
Niech będzie wektorem losowym o rozkładzie , zaś – niezależną zmienną losową o rozkładzie . Wektor
ma, z definicji, Sferyczny rozkład -Studenta z stopniami swobody. Gęstość tego rozkładu (z dokładnością do stałej normującej) jest równa
W przypadku jednowymiarowym, a więc przyjmując , otrzymujemy dobrze znane rozklady t-Studenta z stopniami swobody o gęstości
W szczególnym przypadku, biorąc za liczbę stopni swobody , otrzymujemy rozkłady Cauchy'ego. Na przykład, dwuwymiarowy rozkład Cauchy'ego ma taką gęstość:
Użytecznym uogólnieniem rozkładów sferycznych są rozkłady eliptyczne. Są one określone w następujący sposób. Niech będzie macierzą symetryczną i nieosbliwą. Nazwijmy uogólnionym obrotem przekształcenie liniowe, które zachowuje uogólnioną normę . Rozkład jest z definicji eliptycznie konturowany lub krócej eliptyczny, gdy jest niezmienniczy względem uogólnionych obrotów (dla ustalonej macierzy ).
Mówimy, że -wymiarowa zmienna losowa ma rozkład Dirichleta,
jesli i zmienne mają gęstość
Parametry mogą być dowolnymi liczbami dodatnimi.
Rozkłady Dirichleta dla są to w istocie rozkłady beta:
Jeśli są niezależnymi zmiennymi o jednakowym rozkładzie jednostajnym i
oznaczają statystyki pozycyjne, to
maja rozklad .
Jeśli są niezależnymi zmiennymi losowymi o rozkładach gamma,
i to
Wektor losowy jest niezależny od .
Obliczymy łączną gęstość zmiennych losowych . Ze wzoru na przekształcenie gęstości wynika, że
ponieważ jakobian przekształcenia odwrotnego jest równy . Wystarczy teraz zauważyć, że
Dla niezależnych zmiennych losowych o jednakowym rozkładzie wykładniczym,
jeśli to
Wiele ciekawych własności rozkładów Dirichleta wynika niemal natychmiast z 5.2 (choć nie tak łatwo wyprowadzić je posługując się gęstością 5.2). Mam na myśli przede wszystkim zasadniczą własność ,,grupowania zmiennych”.
Rozważmy rozbicie zbioru indeksów na sumę rozłącznych podzbiorów:
Jeżeli i rozważymy ,,zgrupowane zmienne”
to wektor tych zmiennych ma też rozkład Dirichleta,
gdzie
Co więcej, każdy z wektorów ma rozkład Dirichleta i wszystkie te wektory są niezależne od .
Wniosek 5.3 razem z 5.1 pozwala szybko generować wybrane statystyki pozycyjne. Na przykład łączny rozkład dwóch statystyk pozycyjnych z rozkładu jednostajnego jest wyznaczony przez rozkład trzech ,,zgrupowanych spacji”:
Aby wygenerować zmienną o rozkładzie dwumianowym wystarczy rozpoznać między którymi statystykami pozycyjnymi z rozkładu leży liczba . Nie musimy w tym celu generować wszystkich staystyk pozycyjnych, możemy wybierać ,,najbardziej prawdopodobne”. W połączeniu 5.4 daje to następujący algorytm.
; ; ; |
repeat |
; |
Gen ; |
if then |
begin ; end |
else |
begin ; ; end |
until |
Metoda generowania zmiennych o rozkładzie Dirichleta opiera sie na następującym fakcie, który jest w istocie szczególnym przypadkiem ,,reguły grupowania” 5.3.
Jeśli i, dla , określimy to zmienne
są niezależne i
Odwrotnie, jeśli zmienne są niezależne i każda z nich ma rozkład beta, to wektor ma rozkład Dirichleta.
Oczywiście, jeśli wygenerujemy niezależne zmienne o rozkładach beta, to zmienne łatwo ,,odzyskać” przy pomocy wzorów:
Powyższe równania określają algorytm generowania zmiennych o rozkładzie .
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.