Zagadnienia

2. Funkcje charakterystyczne rozkładów prawdopodobieństwa w Rd

Do tej pory zajmowaliśmy się zmiennymi losowymi o wartościach w Rd bądź, ogólniej, w przestrzeniach metrycznych (bez żadnej dodatkowej struktury). W tym rozdziale ważną rolę będą pełniły zmienne losowe o wartościach w C.

2.1. Zmienne losowe o wartościach zespolonych.

Załóżmy, że Ω,F,P jest przestrzenią probabilistyczną. Funkcja X:ΩC jest zmienną losową, jeśli jest zmienną losową przy utożsamieniu C=R2 - innymi słowy, jeśli X1,X2=ReX,ImX jest zmienną losową w R2. Jeśli X1 oraz X2 są całkowalne (co jest równoważne temu, że EX=EX12+X22<), to definiujemy EX=EX1+iEX2. Bez trudu dowodzimy, iż mają miejsce następujące fakty.

(i) Mamy EXEX.

(ii) Zachodzi twierdzenie Lebesgue'a o zmajoryzowanym przejściu do granicy pod znakiem wartości oczekiwanej.

(iii) Dla dowolnych z1,z2C i dowolnych zespolonych zmiennych losowych X,Y takich, że EX,EY istnieją, mamy

Ez1X+z2Y=z1EX+z2EY.

2.2. Funkcje charakterystyczne

Przechodzimy do definicji głownego pojęcia tego rozdziału.

Definicja 2.1

(i) Załóżmy, że P jest rozkładem prawdopodobieństwa w Rd. Funkcję

φPt=Rdeit,xPdx,tRd,

nazywamy funkcją charakterystyczną P.

(ii) Załóżmy, że X jest zmienną losową o wartościach w Rd, określoną na Ω,F,P. Wówczas φX:=φPX nazywamy funkcją charakterystyczną (rozkładu) zmiennej losowej X.

Uwaga: Z twierdzenia o zamianie zmiennych wynika, iż φXt=Eeit,X.

Bezpośrednio z definicji widzimy, że funkcja charakterystyczna zmiennej losowej zależy tylko od rozkładu tej zmiennej.

Własności funkcji charakterystycznych.

1) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest dobrze określona na całym Rd, ponadto φX0=1 oraz

φXtEeit,X=1 dla wszystkich tRd.

2) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest jednostajnie ciągła na Rd; istotnie, dla hRd,

suptRdφXt+h-φXt=suptRdEeit+h,X-Eeit,XsuptRdEeit+h,X-eit,XEeih,X-10,

gdy h0.

3) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest dodatnio określona, tzn. dla wszystkich a1,a2,,anC oraz t1,t2,,tnRd,

j,kφXtj-tkajak¯0.

Istotnie, mamy

0Rdj=1najeitj,x2PXdx=Rdj,kajeitj,xakeitk,x¯PXdx=j,kajak¯Rdeitj,xe-itk,xPXdx=j,kφXtj-tkajak¯.

Powstaje naturalne pytanie: kiedy funkcja φ:RdC jest funkcją charakterystyczną pewnego rozkładu? Odpowiedź jest zawarta w następującym twierdzeniu.

Twierdzenie 2.1 (Bochner)

Funkcja φ:RdC jest funkcją charakterystyczną pewnego rozkładu prawdopodobieństwa w Rd wtedy i tylko wtedy, gdy jest ciągła, dodatnio określona oraz φ0=1.

4) Załóżmy, że X jest d-wymiarową zmienną losową, A jest macierzą n×d oraz bRn. Wówczas

φAX+bt=Eeit,AX+b=eit,bEeit,AX=eit,bEeiATt,X=eit,bφXATt.

W szczególności, φ-Xt=φX-t=φXt¯. Oznacza to, iż jeśli PX=P-X (rozkład zmiennej jest symetryczny), to φX jest rzeczywista.

5) Załóżmy, że X jest rzeczywistą zmienną losową taką, że EXk< dla pewnej liczby całkowitej dodatniej k. Wówczas φX ma k-tą pochodną ciągłą i

φXkt=ikEeitXXk.

W szczególności, φXk0=ikEXk.

Weźmy najpierw k=1. Mamy

φXt+h-φXth=Eeit+hX-eitXh=EeitXeihX-1h.

Zauważmy, że limh0h-1eihX-1=iX oraz

eitXeihX-1hcoshX-1h+sinhXh=XsinhX/2sinhX/2hX/2+sinhXhX2XL1,

zatem z twierdzenia Lebesgue'a wynika teza. Dla k>1 dowód jest analogiczny, opierający się na indukcji.

Zachodzi następujący ogólniejszy fakt: jeśli X=X1,X2,,Xd jest d-wymiarową zmienną losową taką, że EXk<, to φX ma ciągłe pochodne cząstkowe k-tego rzędu i

kt1j1t2j2tdjdφXt1,t2,,td=ikEeit,XX1j1X2j2Xdjd.

6) Jeśli zmienne X1, X2, , Xn są niezależne, to

φX1+X2++Xnt=φX1tφX2tφXnt.

Istotnie, mamy, iż eit,X1,eit,X2,,eit,Xd są niezależne, skąd

φX1+X2++Xnt=Ej=1neit,Xj=j=1nEeit,Xj=j=1nφXjt.

2.3. Przykłady.

(I) Załóżmy najpierw, że X jest d-wymiarową zmienną losową o rozkładzie skokowym i niech SX oznacza zbiór atomów. Bezpośrednio z definicji mamy, iż

φXt=xSXeit,xPXx.

W szczególności:

1) Jeśli PX=δa, aRd, to φXt=eit,a. Co więcej, jeśli a=0, to φX1.

2) Załóżmy, że PX=Poisλ, λ>0. Mamy

φXt=k=0eitkλkk!e-λ=e-λk=0eitλkk!=e-λeλeit=eλeit-1.

3) PX=Bn,p. Niech X1,X2,,Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie PXi=1=p=1-PXi=0. Ponieważ X1+X2++Xn ma ten sam rozkład co X, to

φXt=φX1+X2++Xnt=φX1tφX2tφXnt=φX1tn=1+peit-1n.

(II) Załóżmy teraz, że X jest d-wymiarową zmienną losową o rozkładzie ciągłym z gęstością g. Z definicji mamy, iż

φXt=Rdeit,xgxdx.

W szczególności:

4) Jeśli PX jest rozkładem jednostajnym na przedziale a,b, to

φXt=1b-aabeitxdx=1itb-aeitb-eita.

Jeśli b=-a, to φX jest funkcją rzeczywistą i φXt=sintbtb.

5) Jeśli PX=Nm,σ2, mR,σ>0, to

gx=12πσexp-x-m22σ2

oraz

φXt=eitme-σ2t2/2 (*)

(w szczególności, dla standardowego rozkładu normalnego, dostajemy φt=e-t2/2).

Istotnie, weźmy X jak wyżej. Zmienna X-m/σ ma standardowy rozkład normalny i

φXt=φσX-mσ+mt=φX-m/σσteitm.

Zatem wystarczy udowodnić wzór (*) dla rozkładu N0,1. Załóżmy więc, że X ma ten rozkład i zauważmy najpierw, że φX jest funkcją rzeczywistą, gdyż rozkład X jest symetryczny. Zatem

φXt=Rcostx12πe-x2/2dx

oraz

φXt=Rsintx12π-xe-x2/2dx=12πsintxe-x2/2--12πRtcostxe-x2/2dx=-tφXt.

Dodatkowo, jak wiemy, φX0=1: stąd φXt=e-t2/2.

Ogólniej, jeśli X ma d-wymiarowy rozkład normalny z gęstością

gx=detA2πd/2exp-12Ax-m,x-m

(gdzie A to pewna macierz d×d symetryczna i dodatnio określona, a m jest pewnym wektorem z Rd), to

φXt=eim,teA-1t,t/2.

Dowód tego faktu przeprowadzimy nieco później.

Przejdziemy teraz do twierdzenia o jednoznaczności: okazuje się, że funkcja charakterystyczna wyznacza rozkład jednoznacznie.

Twierdzenie 2.2 (O jednoznaczności)

Jeśli P, P są rozkładami prawdopodobieństwa w Rd takimi, że φPt=φPt dla wszystkich tRd, to P=P.

Zanim podamy dowód, najpierw sformułujmy wniosek.

Stwierdzenie 2.1

Zmienne losowe X1,X2,,Xn są niezależne wtedy i tylko wtedy, gdy

φX1,X2,,Xnt1,t2,,tn=φX1t1φX2t2φXntn (*)

dla wszystkich t1,t2,,tnRn.

Dowód:

Mamy

φX1,X2,,Xnt1,t2,,tn=φPX1,X2,,Xnt1,t2,,tn=φPX1PX2PXnt1,t2,,tn=Rnexpij=1ntjxjPX1dx1PXndxn=j=1nReitjxjPXjdxj=j=1nφXjtj,

gdzie w przedostatnim przejściu korzystaliśmy z twierdzenia Fubiniego.

Korzystając z przed chwilą udowodnionej implikacji, możemy zapisać (*) w postaci

φPX1,X2,,Xnt1,t2,,tn=φPX1PX2PXnt1,t2,,tn,

a więc twierdzenie o jednoznaczności daje

PX1,X2,,Xn=PX1PX2PXn,

czyli niezależność zmiennych X1,X2,,Xn.

W dowodzie twierdzenia o jednoznaczności będziemy potrzebować następującego pomocniczego faktu.

Twierdzenie 2.3 (Weierstrass)

Załóżmy, że f:RR jest ciągłą funkcją okresową. Wówczas istnieje ciąg wn wielomianów trygonometrycznych o tym samym okresie co f, zbieżny jednostajnie do f. (wielomian trygonometryczny o okresie T to funkcja w:RR postaci wx=k=0nαksinkx2π/T+βkcoskx2π/T.)

Dowód twierdzenia o jednoznaczności (tylko dla d=1):

Wystarczy udowodnić, że dla dowolnej funkcji fCR mamy

RfdP=RfdP. (*)

Z założenia, (*) zachodzi dla funkcji xeitx, xR, przy każdym ustalonym tR. Zatem, z liniowości, powyższa równość ma miejsce dla dowolnego wielomianu trygonometrycznego; mamy bowiem sintx=eitx-e-itx/2i, costx=eitx+e-itx/2. Na mocy twierdzenia Weierstrassa, (*) jest prawdziwa dla dowolnej funkcji ciągłej okresowej. Niech teraz f będzie dowolną funkcją ciągłą i ograniczoną. Istnieje ciąg fn funkcji ciągłych i okresowych o następującej własności:

fx=fnx dla x-n,n oraz supxRfnxsupxRfx.

Mamy, na mocy nierówności trójkąta,

RfdP-RfdPRf-fndP+RfndP-RfndP+Rf-fndP=-n,ncf-fndP+0+-n,ncf-fndP2supxRfxP-n,nc+P-n,nc0

gdy n. Stąd otrzymujemy tezę. W przypadku ogólnym (tzn. dla d>1) dowód jest bardzo podobny; rolę twierdzenia Weierstrassa pełni ogólniejsze twierdzenie Stone'a-Weierstrassa.

Rozkłady Gaussa (rozkłady normalne) w Rd. Załóżmy, że X ma rozkład normalny w Rd, o wartości ozekiwanej m i macierzy kowariancji Λ. Udowodnimy, że

φXt=eit,m-Λt,t/2.

Istotnie, niech Y1, Y2, , Yd będą niezależnymi zmiennymi losowymi o standarowym rozkładzie normalnym na R i niech Z=BY+m, gdzie B jest macierzą d×d i mRd. Mamy

φYt=e-t2/2,
φZt=eit,mφYBTt=eit,m-BTt,BTt/2=eit,m-BBTt,t/2.

Zauważmy, że BBT jest macierzą symetryczną, nieujemnie określoną. Co więcej, każda macierz symetryczna d×d nieujemnie określona da się ta zapisać; stąd, dla dowolnej nieujemnie określonej symetrycznej macierzy Λ o wymiarach d×d i dowolnego wektora mRd, funkcja

φt=eit,m-Λt,t/2

jest funkcją charakterystyczną dokładnie jednego rozkładu prawdopodobieństwa w Rd. Rozkłady tej postaci nazywamy rozkładami Gaussa w Rd. Zauważmy, że niektóre rozkłady Gaussa nie mają gęstości.

Bezpośrednio z definicji dostajemy następujące wnioski.

Stwierdzenie 2.2

Załóżmy, że X ma rozkład Gaussa w Rd, a A jest macierzą n×d i mRn. Wówczas AX+m ma rozkład Gaussa w Rn.

Stwierdzenie 2.3

Jeśli X, Y są niezależnymi zmiennymi losowymi o rozkładach Gaussa w Rd o wartościach oczekiwanych mX, mY oraz macierzach kowariancji Λ1, Λ2, odpowiednio, to X+Y ma rozkład Gaussa w Rd o wartości średniej mX+mY oraz macierzy Λ1+Λ2.

Przechodzimy do kolejnego bardzo ważnego faktu, łączącego zbieżność według rozkładu ze zbieżnością funkcji charakterystycznych.

Twierdzenie 2.4 (Lévy - Cramera)

Załóżmy, że Pn (n=1, 2,) są rozkładami prawdopodobieństwa w Rd.

(i) Jeśli PnP, to dla każdego tRd, φPntφPt.

(ii) Jeśli dla każdego tRd mamy φPntφt, gdzie φ-pewna funkcja ciągła w 0, to φ=φP dla pewnego rozkładu P i PnP.

Dowód:

(i) Z definicji zbieżności według rozkładu mamy, dla dowolnego tRd,

φPnt=Rdcosx,tPndx+iRdsint,xPndxRdcosx,tPdx+iRdsint,xPdx=Rdeit,xdx=φPt.

(ii) Zacznijmy od pomocniczego faktu.

Lemat 2.1

Jeśli φPntφt dla t należących do pewnego otoczenia 0 i φ jest ciągła w 0, to rodzina Pnn jest ciasna.

Dowód lematu:

Wprowadźmy oznaczenie Qa=-a,a-a,a-a,aRd. Przypuśćmy, wbrew tezie, że rodzina Pn nie jest ciasna. Wówczas istnieje ε>0 o tej własności, iż przy każdym kN mamy PnkQk<1-ε dla pewnego nk. Zauważmy, iż nk; istotnie, w przeciwnym razie pewna liczba m znalazłaby się w ciągu nkk nieskończenie wiele razy, co prowadziłoby do nierówności PmRd1-ε; sprzeczność.

Ponieważ φ jest ciągła w 0, to Reφ także ma tę własność; ponadto, na mocy zbieżności punktowej, Reφ0=φ0=1. Wobec tego istnieje takie a>0, że dla każdego tQa mamy φPntφt oraz Reφt>1-ε/2. Dalej,

QaφtdtQaReφtdt1-ε/22ad,
QaφPnktdt=QaRdeit,xPnkdxdt=RdQaeit,xdtPnkdxQkQaeit,xdtPnkdx+QkcQaeit,xdtPnkdx2adPnkQk+T,

gdzie

T=QkcQaeit,xdtPnkdx=Qkcj=1d-aaeitjxjdtjPnkdx.

Ustalmy teraz xQkc. Istnieje współrzędna xl punktu x większa co do modułu niż k, zatem

j=1d-aaeitjxjdtj2ad-1eialxl-e-ialxlixl22aa-1/k.

Stąd

2adPnkQk+T2adPnkQk+22ad-1PnkQkc/k2ad1-ε+22ad-1/kk2ad1-ε.

Ale na mocy twierdzenia Lebesgue'a, QaφPnktdtQaφtdt; stąd sprzeczność: 2ad1-ε/2<2aa1-ε.

Przechodzimy do dowodu części (ii) twierdzenia Levy-Cramera. Powyższy lemat oraz twierdzenie Prochorowa dają istnienie miary probabilistycznej P na Rd oraz podciągu Pnkk zbieżnego słabo do P. Na mocy części (i) twierdzenia Levy-Cramera, mamy φPnktkφPt, skąd φt=φPt. Pozostaje jeszcze tylko udowodnić, że PnP. Przypuśćmy przeciwnie, iż dla pewnej funkcji fCRd mamy RdfdPnnotRdfdP; stąd, dla pewnego podciągu mk,

RdfdPmkαRdfdP. (*)

Ale na mocy lematu, rodzina Pmk także jest ciasna, stąd z twierdzenia Prochorowa istnieje podciąg mkj oraz miara probabilistyczna P taka, że PmkjP. Zatem, korzystając z (i), φPmkjtφPt, czyli φP=φP. Sprzeczność z (*) kończy dowód.

Na zakończenie zaprezentujemy twierdzenie o odwróceniu, pozwalające odczytać gęstość rozkładu za pomocą jego funkcji charakterystycznej. Analogiczny fakt dla zmiennych dyskretnych jest treścią zadania 10 poniżej.

Twierdzenie 2.5

Załóżmy, że P jest rozkładem prawdopodobieństwa w Rd o funkcji charakterystycznej φP. Wówczas jeśli RdφPtdt<, to P ma ciągłą ograniczoną gęstość g daną wzorem

gx=12πdRde-it,xφPtdt.
Dowód:

Rozważmy funkcję

gεx=12πdRde-it,xφPte-t2ε2/2dt=12πdRde-it,xRdeit,yPdye-t2ε2/2dt=12πd/2εdRdεd2πd/2Rdeit,y-xe-t2ε2/2dtPdy=12πd/2εdRde-y-x2/2ε2Pdy,

gdzie w trzecim przejściu skorzystaliśmy z twierdzenia Fubiniego (dzięki czynnikowi e-t2ε2/2 wyrażenie podcałkowe jest całkowalne), a w czwartym użyliśmy faktu, iż wewnętrzna całka to funkcja charakterystyczna rozkładu N0,ε-2 w punkcie y-x. Jak widać, ostatnie wyrażenie to splot rozkładu P z rozkładem N0,ε2, w punkcie x; innymi słowy, jeśli X, Y są niezależnymi zmiennymi o rozkładach P i N0,1, odpowiednio, to X+εY ma rozkład z gęstością gε. Na mocy całkowalności funkcji charakterystycznej i twierdzenia Lebesgue'a, mamy gεxgx dla każdego xR. Wykażemy teraz, że Rdg=1. Oczywiście, na mocy lematu Fatou, Rdg1. By udowodnić nierówność przeciwną, weźmy δ>0 oraz taką liczbę M>0, by P-M,M>1-δ. Ponieważ X+εYXP, to

1-δlim infε0+PX+εY-M,M=lim infε0+-MMgεxdx=-MMgxdx,

i z dowolności δ dostajemy, iż g jest gęstością. Wystarczy teraz skorzystać z zadania 7 z pierwszego rozdziału: punktowa zbieżność gεg pociąga za sobą, iż X+εYε zbiega, przy ε0+, do rozkładu o gęstości g; stąd teza.

2.4. Zadania

1. Rozstrzygnąć, czy podane niżej funkcje są funkcjami charakterystycznymi i jeśli tak, podać odpowiedni rozkład.

a)cost,b)cos2t,c)141+eit2,d)1+cost2,e)2-eit-1.

2. Niech ϕ1, ϕ2, , ϕn będą funkcjami charakterystycznymi pewnych rozkładów. Udowodnić, iż dowolna kombinacja wypukła tych funkcji jest funkcją charakterystyczną pewnego rozkładu.

3. Dany jest ciąg Xn niezależnych zmiennych losowych o tym samym rozkładzie. Zmienna losowa N jest od nich niezależna i ma rozkład Poissona z parametrem λ. Wyznaczyć funkcję charakterystyczną zmiennej X1+X2++XN.

4. Niech ϕ będzie funkcją charakterystyczną pewnego rozkładu. Rostrzygnąć, czy

a) ϕ2,b) Reϕ,c) ϕ2,d) ϕ

są funkcjami charakterystycznymi.

5. Zmienne X,Y są niezależne, przy czym X oraz X+Y mają rozkłady normalne. Udowodnić, że Y ma rozkład normalny lub jest stała p.n..

6. Zmienne losowe X,Y są niezależne, przy czym X ma rozkład jednostajny U0,1, a Y ma rozkład zadany przez

PY=k=1n,k=0, 1, 2,,n-1.

Wyznaczyć rozkład zmiennej X+Y.

7. Zmienne losowe X1,X2,,Xn są niezależne i mają ten sam rozkład, przy czym zmienna X1+X2++Xn ma rozkład normalny N0,1. Wyznaczyć rozkład zmiennych Xi.

8. Zmienna losowa X ma rozkład jednostajny U-1,1. Czy istnieje niezależna od niej zmienna Y taka, że rozkłady zmiennych X+Y oraz 12Y są takie same?

9. Funkcja charakterystyczna zmiennej losowej X ma drugą pochodną w zerze. Udowodnić, że EX2<.

10. Zmienna losowa X przyjmuje wartości całkowite. Udowodnić, że

PX=k=12π-ππe-iktϕXtdt,kZ.

11. Udowodnić, że dla p>2 funkcja ϕt=e-tp nie jest funkcją charakterystyczną żadnego rozkładu.

12. Udowodnić, że ϕt=e-t jest funkcją charakterystyczną rozkładu Cauchy'ego w R, tzn. rozkładu o gęstości

gx=1π11+x2.

13. Niech X1, X2, będą niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na przedziale -1,1. Zdefiniujmy

Yn=sgnXnXn1/α,n=1, 2,,

gdzie α0,2 jest ustalone. Udowodnić, że ciąg

Y1+Y2++Ynn1/α

jest zbieżny według rozkładu i wyznaczyć funkcję charakterystyczną rozkładu granicznego.

14. Udowodnić, że jeśli Pn (n=1, 2,) są rozkładami Gaussa w Rd i PnP, to P jest rozkładem Gaussa.

15. Rzucamy monetą, dla której prawdopodobieństwo wypadnięcia orła wynosi p, aż do momentu, gdy uzyskamy n orłów (łącznie, niekoniecznie pod rząd). Niech Xp oznacza liczbę rzutów. Udowodnić, że 2pXp jest zbieżny według rozkładu gdy p0.

16. Niech X będzie zmienną losową o funkcji charakterystycznej φX. Udowodnić, że następujące warunki są równoważne.

(i) Istnieje a0 takie, że φXa=1.

(ii) Istnieją b,cR takie, że zmienna X jest skoncentrowana na zbiorze ck+b:kZ.

17. Dany jest ciąg Xn niezależnych zmiennych losowych o tym samym rozkładzie, zadanym przez PXn=0=PXn=1=1/2. Wykazać, że szereg n=12-nXn jest zbieżny p.n. i wyznaczyć rozkład sumy tego szeregu.

18. Dla aR, niech

φat=1+axjeśli x1,1+ajeśli x>1.

Dla jakich wartości parametru a funkcja φa jest funkcją charakterystyczną rozkładu pewnej zmiennej losowej?

19. Załóżmy, że μ jest rozkładem prawdopodobieństwa o funkcji charakterystycznej φ. Udowodnić, że dla dowolnego r>0 zachodzi nierówność

μ-r,r1-r2-2/r2/r1-φsds

oraz

μ0,rr-π/2rπ/2rφsds.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.