Wiele spośród ogólnych metod generowania zmiennych losowych jest całkowicie niezależnych od wymiaru. W szczególności, metody eliminacji, kompozycji i przekształceń są z powodzeniem stosowane do generowania zmiennych losowych wielowymiarowych. Wyjątek stanowi ,,najbardziej ogólna” metoda odwracania dystrybuanty, która nie ma naturalnego odpowiednika dla wymiaru większego niż 1.
Jest to właściwie jedyna metoda ,,w zasadniczy sposób wielowymiarowa”.
Opiera się na przedstawieniu gęstości łącznej zmiennych losowych
jako iloczynu gęstości brzegowej i gęstości
warunkowych (wzór łańcuchowy):
![]() |
Wynika stąd następujący algorytm:
for ![]() ![]() |
Gen ![]() |
Ograniczymy się do zmiennych losowych pochodzących z rozkładu dwuwymiarowego
o gęstości
![]() |
Jak wiadomo (można to sprawdzić elementarnym rachunkiem),
![]() |
![]() |
To znaczy, że jest rozkładem brzegowym
oraz
![]() |
jest rozkładem warunkowym dla
. Algorytm jst więc następujący.
Gen ![]() |
![]() |
![]() |
Efekt działania powyższego algorytmu widać na Rysunku 5.1. W tym konkretnym przykładzie
ma rozkład brzegowy
, zaś
ma rozkład warunkowy
. Zauważmy, że
i
. Prosta
jest wykresem funkcji regresji
i jest przedstawiona na wykresie.
Pokazane są też poziomice gęstości (elipsy). Warto zwrócić uwagę, że funkcja regresji nie pokrywa się
ze wspólną osią tych elips. Dlaczego? Jak obliczyć oś?
Uogólnienie na przypadek rozkładu normalnego
, z niezerowymi średnimi, jest banalne. Uogólnienie na wyższe
wymiary też nie jest skomplikowane. Okazuje się jednak, że metoda rozkładów warunkowych dla rozkładów normalnych prowadzi to do algorytmu identycznego jak otrzymany metodą przekształceń.
Podstawą jest następujące twierdzenie o przekształcaniu gęstości.
Załóżmy, że jest
-wymiarową zmienną losową o wartościach w otwartym
zbiorze
. Jeżeli
![]() |
i jest dyfeomorfizmem, to
![]() |
Rozważmy niezależne zmienne losowe .
Wektor
ma
-wymiarowy rozkład normalny
o gęstości
![]() |
Jeżeli teraz R jest nieosobliwą macierzą to przekształcenie
jest dyfeomorfizmem z jakobianem
. Z Twierdzenia 5.1 wynika, że wektor losowy
ma rozkład normalny o gęstości
![]() |
gdzie . Innymi słowy,
. Algorytm generacji jest oczywisty:
Gen ![]() |
![]() |
Rozmaitych rozkładów wielowymiarowych jest więcej, niż gwiazd na niebie – a wśród nich tyle przykładów ciekawych i ważnych! Musiałem wybrać zaledwie kilka z nich. Rzecz jasna, wybrałem te, które mi się szczególnie podobają.
Najważniejszy, być może, przykład to wielowymiarowy rozkład normalny, omówiony już w 5.2. Rozpatrzymy teraz rozklady jednostajne na kuli
![]() |
i sferze
![]() |
Oczywiście, oznacza normę euklidesową,
. Rozkład
ma po prostu stałą gęstość względem
-wymiarowej miary Lebesgue'a na kuli.
Rozkład
ma stałą gęstość względem
-wymiarowej miary ,,powierzchniowej” na sferze. Oba te rozkłady są niezmiennicze względem
obrotów (liniowych przekształceń ortogonalnych)
. Takie rozkłady nazywamy sferycznie symetrycznymi lub krócej:
sferycznymi. Zauważmy, że zmienną losową o rozkładzie
możemy interpretować jako losowo wybrany kierunek w
przestrzeni
-wymiarowej. Algorytmy ,,poszukiwań losowych” często
wymagają generowania takich losowych kierunków.
Rozkłady jednostajne na kuli i sferze są blisko ze sobą związane.
Jeśli i
to
![]() |
Łatwo też zauważyć, że jest zmienną losową o
rozkładzie
niezależną od
.
Jeśli i
jest niezależną zmienną losową o
rozkładzie
to
.
Zmienną łatwo wygenerować metodą odwracania dystrybuanty.
Najprostszy wydaje się algorytm eliminacji:
repeat |
Gen ![]() |
until ![]() |
![]() |
W istocie, dokładnie ta metoda, dla , była częścią algorytmu biegunowego
Marsaglii. Problem w tym, że w wyższych wymiarach
efektywnosc eliminacji gwałtownie maleje. Prawdopodobieństwo akceptacji jest równe
stosunkowi ,,objętości” kuli
do kostki
. Ze znanego wzoru na objętość kuli
-wymiarowej wynika, że
![]() |
Zbieżność do zera jest bardzo szybka. Dla dużego kula jest znikomą
częścią opisanej na niej kostki.
Inna metoda, którą z powodzeniem stosuje się dla jest związana
ze współrzędnymi biegunowymi:
Gen ![]() |
![]() |
Gen ![]() |
![]() |
Gen ![]() |
![]() |
Efekt działania algorytmu ,,współrzędnych sferycznych” jest widoczny na trzech początkowych obrazkach
na Rysunku 5.2.
Górny lewy rysunek przedstawia punkty widoczne ,,z płaszczyzny równika”,
czyli . Górny prawy – te same punkty widziane ,,znad bieguna”,
czyli
. Dolny lewy – górną półsferę widzianą ,,skośnie”,
czyli
, gdzie
. Dla porównania,
na ostatnim rysunku po prawej stronie u dołu – punkty wylosowane
rzeczywiście z rozkładu
przy pomocy poprawnego algorytmu podanego
niżej.
Gen ![]() |
![]() |
![]() |
Gen ![]() |
![]() |
Niech będzie wektorem losowym o rozkładzie
, zaś
– niezależną zmienną losową o rozkładzie
.
Wektor
![]() |
ma, z definicji, Sferyczny rozkład -Studenta z
stopniami swobody. Gęstość tego rozkładu (z dokładnością do stałej normującej) jest równa
![]() |
W przypadku jednowymiarowym, a więc przyjmując , otrzymujemy
dobrze znane rozklady t-Studenta z
stopniami swobody o gęstości
![]() |
W szczególnym przypadku, biorąc za liczbę stopni swobody , otrzymujemy rozkłady Cauchy'ego. Na przykład, dwuwymiarowy rozkład Cauchy'ego ma taką gęstość:
![]() |
Użytecznym uogólnieniem rozkładów sferycznych są rozkłady eliptyczne. Są
one określone w następujący sposób.
Niech będzie macierzą symetryczną i nieosbliwą.
Nazwijmy uogólnionym obrotem przekształcenie liniowe, które zachowuje uogólnioną normę
.
Rozkład jest z definicji eliptycznie konturowany lub krócej eliptyczny, gdy jest niezmienniczy względem uogólnionych obrotów (dla ustalonej macierzy
).
Mówimy, że -wymiarowa zmienna losowa
ma rozkład Dirichleta,
![]() |
jesli i zmienne
mają gęstość
![]() |
Parametry mogą być dowolnymi liczbami dodatnimi.
Rozkłady Dirichleta dla są to w istocie rozkłady beta:
![]() |
Jeśli są niezależnymi zmiennymi o jednakowym
rozkładzie jednostajnym
i
![]() |
oznaczają statystyki pozycyjne, to
![]() |
maja rozklad .
Jeśli są niezależnymi zmiennymi losowymi o rozkładach
gamma,
![]() |
i to
![]() |
Wektor losowy jest niezależny od
.
Obliczymy łączną gęstość zmiennych losowych . Ze wzoru na przekształcenie gęstości wynika, że
![]() |
ponieważ jakobian przekształcenia odwrotnego jest równy
. Wystarczy teraz zauważyć, że
![]() |
![]() |
Dla niezależnych zmiennych losowych o jednakowym rozkładzie wykładniczym,
![]() |
jeśli to
![]() |
Wiele ciekawych własności rozkładów Dirichleta wynika niemal natychmiast z 5.2 (choć nie tak łatwo wyprowadzić je posługując się gęstością 5.2). Mam na myśli przede wszystkim zasadniczą własność ,,grupowania zmiennych”.
Rozważmy rozbicie zbioru indeksów na sumę rozłącznych podzbiorów:
![]() |
Jeżeli i
rozważymy ,,zgrupowane zmienne”
![]() |
to wektor tych zmiennych ma też rozkład Dirichleta,
![]() |
gdzie
![]() |
Co więcej, każdy z wektorów ma rozkład Dirichleta
i wszystkie te wektory są
niezależne od
.
Wniosek 5.3 razem z 5.1 pozwala szybko generować wybrane statystyki pozycyjne. Na przykład łączny rozkład dwóch statystyk pozycyjnych z rozkładu jednostajnego jest wyznaczony przez rozkład trzech ,,zgrupowanych spacji”:
![]() |
Aby wygenerować zmienną o rozkładzie dwumianowym wystarczy rozpoznać między którymi statystykami pozycyjnymi z rozkładu
leży liczba
. Nie musimy w tym celu
generować wszystkich staystyk pozycyjnych, możemy wybierać
,,najbardziej prawdopodobne”. W połączeniu 5.4 daje to
następujący algorytm.
![]() ![]() ![]() |
repeat |
![]() |
Gen ![]() |
if ![]() |
begin ![]() ![]() |
else |
begin ![]() ![]() ![]() |
until ![]() |
Metoda generowania zmiennych o rozkładzie Dirichleta opiera sie na następującym fakcie, który jest w istocie szczególnym przypadkiem ,,reguły grupowania” 5.3.
Jeśli i, dla
, określimy
to zmienne
![]() |
są niezależne i
![]() |
Odwrotnie, jeśli zmienne są niezależne i każda z nich
ma rozkład beta, to wektor
ma rozkład Dirichleta.
Oczywiście, jeśli wygenerujemy niezależne zmienne o rozkładach beta, to zmienne
łatwo ,,odzyskać” przy
pomocy wzorów:
![]() |
![]() |
![]() |
![]() |
![]() |
Powyższe równania określają algorytm generowania zmiennych o
rozkładzie .
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.