2.2. Funkcje charakterystyczne
Przechodzimy do definicji głownego pojęcia tego rozdziału.
Definicja 2.1
(i) Załóżmy, że P jest rozkładem prawdopodobieństwa w Rd. Funkcję
|
φPt=∫Rdeit,xPdx,t∈Rd, |
|
nazywamy funkcją charakterystyczną P.
(ii) Załóżmy, że X jest zmienną losową o wartościach w Rd, określoną na Ω,F,P. Wówczas φX:=φPX nazywamy funkcją charakterystyczną (rozkładu) zmiennej losowej X.
Uwaga: Z twierdzenia o zamianie zmiennych wynika, iż φXt=Eeit,X.
Bezpośrednio z definicji widzimy, że funkcja charakterystyczna zmiennej losowej zależy tylko od rozkładu tej zmiennej.
Własności funkcji charakterystycznych.
1) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest dobrze określona na całym Rd, ponadto φX0=1 oraz
|
φXt≤Eeit,X=1 dla wszystkich t∈Rd. |
|
2) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest jednostajnie ciągła na Rd; istotnie, dla h∈Rd,
|
supt∈RdφXt+h-φXt=supt∈RdEeit+h,X-Eeit,X≤supt∈RdEeit+h,X-eit,X≤Eeih,X-1→0, |
|
gdy h→0.
3) Załóżmy, że X jest d-wymiarową zmienną losową. Wówczas φX jest dodatnio określona, tzn. dla wszystkich
a1,a2,…,an∈C oraz t1,t2,…,tn∈Rd,
Istotnie, mamy
|
0≤∫Rd∑j=1najeitj,x2PXdx=∫Rd∑j,kajeitj,xakeitk,x¯PXdx=∑j,kajak¯∫Rdeitj,xe-itk,xPXdx=∑j,kφXtj-tkajak¯. |
|
Powstaje naturalne pytanie: kiedy funkcja φ:Rd→C jest funkcją charakterystyczną pewnego rozkładu? Odpowiedź jest zawarta w
następującym twierdzeniu.
Twierdzenie 2.1 (Bochner)
Funkcja φ:Rd→C jest funkcją charakterystyczną pewnego rozkładu prawdopodobieństwa w Rd wtedy i tylko wtedy, gdy jest ciągła, dodatnio określona oraz φ0=1.
4) Załóżmy, że X jest d-wymiarową zmienną losową, A jest macierzą n×d oraz b∈Rn. Wówczas
|
φAX+bt=Eeit,AX+b=eit,bEeit,AX=eit,bEeiATt,X=eit,bφXATt. |
|
W szczególności, φ-Xt=φX-t=φXt¯. Oznacza to, iż jeśli PX=P-X (rozkład zmiennej jest symetryczny), to φX jest rzeczywista.
5) Załóżmy, że X jest rzeczywistą zmienną losową taką, że EXk<∞ dla pewnej liczby całkowitej dodatniej k. Wówczas φX ma k-tą pochodną ciągłą i
W szczególności, φXk0=ikEXk.
Weźmy najpierw k=1. Mamy
|
φXt+h-φXth=Eeit+hX-eitXh=EeitXeihX-1h. |
|
Zauważmy, że limh→0h-1eihX-1=iX oraz
|
eitXeihX-1h≤coshX-1h+sinhXh=XsinhX/2sinhX/2hX/2+sinhXhX≤2X∈L1, |
|
zatem z twierdzenia Lebesgue'a wynika teza. Dla k>1 dowód jest analogiczny, opierający się na indukcji.
Zachodzi następujący ogólniejszy fakt: jeśli X=X1,X2,…,Xd jest d-wymiarową zmienną losową taką, że EXk<∞, to φX ma ciągłe pochodne cząstkowe k-tego rzędu i
|
∂k∂t1j1∂t2j2…∂tdjdφXt1,t2,…,td=ikEeit,XX1j1X2j2…Xdjd. |
|
6) Jeśli zmienne X1, X2, …, Xn są niezależne, to
|
φX1+X2+…+Xnt=φX1tφX2t…φXnt. |
|
Istotnie, mamy, iż eit,X1,eit,X2,…,eit,Xd są niezależne, skąd
|
φX1+X2+…+Xnt=E∏j=1neit,Xj=∏j=1nEeit,Xj=∏j=1nφXjt. |
|
2.3. Przykłady.
(I) Załóżmy najpierw, że X jest d-wymiarową zmienną losową o rozkładzie skokowym i niech SX oznacza zbiór atomów. Bezpośrednio z definicji mamy, iż
1) Jeśli PX=δa, a∈Rd, to φXt=eit,a. Co więcej, jeśli a=0, to φX≡1.
2) Załóżmy, że PX=Poisλ, λ>0. Mamy
|
φXt=∑k=0∞eitkλkk!e-λ=e-λ∑k=0∞eitλkk!=e-λeλeit=eλeit-1. |
|
3) PX=Bn,p. Niech X1,X2,…,Xn będą niezależnymi zmiennymi losowymi o tym samym rozkładzie PXi=1=p=1-PXi=0. Ponieważ X1+X2+…+Xn ma ten sam rozkład co X, to
|
φXt=φX1+X2+…+Xnt=φX1tφX2t…φXnt=φX1tn=1+peit-1n. |
|
(II) Załóżmy teraz, że X jest d-wymiarową zmienną losową o rozkładzie ciągłym z gęstością g. Z definicji mamy, iż
W szczególności:
4) Jeśli PX jest rozkładem jednostajnym na przedziale a,b, to
|
φXt=1b-a∫abeitxdx=1itb-aeitb-eita. |
|
Jeśli b=-a, to φX jest funkcją rzeczywistą i φXt=sintbtb.
5) Jeśli PX=Nm,σ2, m∈R,σ>0, to
oraz
|
φXt=eitme-σ2t2/2 |
| (*) |
(w szczególności, dla standardowego rozkładu normalnego, dostajemy φt=e-t2/2).
Istotnie, weźmy X jak wyżej. Zmienna X-m/σ ma standardowy rozkład normalny i
|
φXt=φσX-mσ+mt=φX-m/σσteitm. |
|
Zatem wystarczy udowodnić wzór (*) dla rozkładu N0,1. Załóżmy więc, że X ma ten rozkład i zauważmy najpierw, że φX jest funkcją rzeczywistą, gdyż rozkład X jest symetryczny. Zatem
|
φXt=∫Rcostx12πe-x2/2dx |
|
oraz
|
φX′t=∫Rsintx12π-xe-x2/2dx=12πsintxe-x2/2-∞∞-12π∫Rtcostxe-x2/2dx=-tφXt. |
|
Dodatkowo, jak wiemy, φX0=1: stąd φXt=e-t2/2.
Ogólniej, jeśli X ma d-wymiarowy rozkład normalny z gęstością
|
gx=detA2πd/2exp-12Ax-m,x-m |
|
(gdzie A to pewna macierz d×d symetryczna i dodatnio określona, a m jest pewnym wektorem z Rd), to
Dowód tego faktu przeprowadzimy nieco później.
Przejdziemy teraz do twierdzenia o jednoznaczności: okazuje się, że funkcja charakterystyczna wyznacza rozkład jednoznacznie.
Twierdzenie 2.2 (O jednoznaczności)
Jeśli P, P′ są rozkładami prawdopodobieństwa w Rd takimi, że φPt=φP′t dla wszystkich t∈Rd, to P=P′.
Zanim podamy dowód, najpierw sformułujmy wniosek.
Stwierdzenie 2.1
Zmienne losowe X1,X2,…,Xn są niezależne wtedy i tylko wtedy, gdy
|
φX1,X2,…,Xnt1,t2,…,tn=φX1t1φX2t2…φXntn |
| (*) |
dla wszystkich t1,t2,…,tn∈Rn.
Dowód:
⇒ Mamy
|
φX1,X2,…,Xnt1,t2,…,tn=φPX1,X2,…,Xnt1,t2,…,tn=φPX1⊗PX2⊗…⊗PXnt1,t2,…,tn=∫Rnexpi∑j=1ntjxjPX1dx1…PXndxn=∏j=1n∫ReitjxjPXjdxj=∏j=1nφXjtj, |
|
gdzie w przedostatnim przejściu korzystaliśmy z twierdzenia Fubiniego.
⇐ Korzystając z przed chwilą udowodnionej implikacji, możemy zapisać (*) w postaci
|
φPX1,X2,…,Xnt1,t2,…,tn=φPX1⊗PX2⊗…⊗PXnt1,t2,…,tn, |
|
a więc twierdzenie o jednoznaczności daje
|
PX1,X2,…,Xn=PX1⊗PX2⊗…⊗PXn, |
|
czyli niezależność zmiennych X1,X2,…,Xn.
∎
W dowodzie twierdzenia o jednoznaczności będziemy potrzebować następującego pomocniczego faktu.
Twierdzenie 2.3 (Weierstrass)
Załóżmy, że f:R→R jest ciągłą funkcją okresową. Wówczas istnieje ciąg wn wielomianów trygonometrycznych o tym samym okresie co f, zbieżny jednostajnie do f. (wielomian trygonometryczny o okresie T to funkcja w:R→R postaci wx=∑k=0nαksinkx⋅2π/T+βkcoskx⋅2π/T.)
Dowód twierdzenia o jednoznaczności (tylko dla d=1):
Wystarczy udowodnić, że dla dowolnej funkcji f∈CR mamy
Z założenia, (*) zachodzi dla funkcji x↦eitx, x∈R, przy każdym ustalonym t∈R. Zatem, z liniowości, powyższa równość ma miejsce dla dowolnego wielomianu trygonometrycznego; mamy bowiem sintx=eitx-e-itx/2i, costx=eitx+e-itx/2. Na mocy twierdzenia Weierstrassa, (*) jest prawdziwa dla dowolnej funkcji ciągłej okresowej. Niech teraz f będzie dowolną funkcją ciągłą i ograniczoną. Istnieje ciąg fn funkcji ciągłych i okresowych o następującej własności:
|
fx=fnx dla x∈-n,n oraz supx∈Rfnx≤supx∈Rfx. |
|
Mamy, na mocy nierówności trójkąta,
|
∫RfdP-∫RfdP′≤∫Rf-fndP+∫RfndP-∫RfndP′+∫Rf-fndP′=∫-n,ncf-fndP+0+∫-n,ncf-fndP′≤2supx∈RfxP-n,nc+P′-n,nc→0 |
|
gdy n→∞. Stąd otrzymujemy tezę. W przypadku ogólnym (tzn. dla d>1) dowód jest bardzo podobny; rolę twierdzenia Weierstrassa pełni ogólniejsze twierdzenie Stone'a-Weierstrassa.
∎
Rozkłady Gaussa (rozkłady normalne) w Rd. Załóżmy, że X ma rozkład normalny w Rd, o wartości ozekiwanej m i macierzy kowariancji Λ. Udowodnimy, że
Istotnie, niech Y1, Y2, …, Yd będą niezależnymi zmiennymi losowymi o standarowym rozkładzie normalnym na R i niech Z=BY+m, gdzie B jest macierzą d×d i m∈Rd. Mamy
|
φZt=eit,mφYBTt=eit,m-BTt,BTt/2=eit,m-BBTt,t/2. |
|
Zauważmy, że BBT jest macierzą symetryczną, nieujemnie określoną. Co więcej, każda macierz symetryczna d×d nieujemnie określona da się ta zapisać; stąd, dla dowolnej nieujemnie określonej symetrycznej macierzy Λ o wymiarach d×d i dowolnego wektora m∈Rd, funkcja
jest funkcją charakterystyczną dokładnie jednego rozkładu prawdopodobieństwa w Rd. Rozkłady tej postaci nazywamy rozkładami Gaussa w Rd. Zauważmy, że niektóre rozkłady Gaussa nie mają gęstości.
Bezpośrednio z definicji dostajemy następujące wnioski.
Stwierdzenie 2.2
Załóżmy, że X ma rozkład Gaussa w Rd, a A jest macierzą n×d i m∈Rn. Wówczas AX+m ma rozkład Gaussa w Rn.
Stwierdzenie 2.3
Jeśli X, Y są niezależnymi zmiennymi losowymi o rozkładach Gaussa w Rd o wartościach oczekiwanych mX, mY oraz macierzach kowariancji Λ1, Λ2, odpowiednio, to X+Y ma rozkład Gaussa w Rd o wartości średniej mX+mY oraz macierzy Λ1+Λ2.
Przechodzimy do kolejnego bardzo ważnego faktu, łączącego zbieżność według rozkładu ze zbieżnością funkcji charakterystycznych.
Twierdzenie 2.4 (Lévy - Cramera)
Załóżmy, że Pn (n=1, 2,…) są rozkładami prawdopodobieństwa w Rd.
(i) Jeśli Pn⇒P, to dla każdego t∈Rd, φPnt→φPt.
(ii) Jeśli dla każdego t∈Rd mamy φPnt→φt, gdzie φ-pewna funkcja ciągła w 0, to φ=φP dla pewnego rozkładu P i Pn⇒P.
Dowód:
(i) Z definicji zbieżności według rozkładu mamy, dla dowolnego t∈Rd,
|
φPnt=∫Rdcosx,tPndx+i∫Rdsint,xPndx→∫Rdcosx,tPdx+i∫Rdsint,xPdx=∫Rdeit,xdx=φPt. |
|
(ii) Zacznijmy od pomocniczego faktu.
Lemat 2.1
Jeśli φPnt→φt dla t należących do pewnego otoczenia 0 i φ jest ciągła w 0, to rodzina Pnn jest ciasna.
Dowód lematu:
Wprowadźmy oznaczenie Qa=-a,a-a,a…-a,a⊂Rd. Przypuśćmy, wbrew tezie, że rodzina Pn nie jest ciasna. Wówczas istnieje ε>0 o tej własności, iż przy każdym k∈N mamy PnkQk<1-ε dla pewnego nk. Zauważmy, iż nk→∞; istotnie, w przeciwnym razie pewna liczba m znalazłaby się w ciągu nkk nieskończenie wiele razy, co prowadziłoby do nierówności PmRd≤1-ε; sprzeczność.
Ponieważ φ jest ciągła w 0, to Reφ także ma tę własność; ponadto, na mocy zbieżności punktowej, Reφ0=φ0=1. Wobec tego istnieje takie a>0, że dla każdego t∈Qa mamy φPnt→φt oraz Reφt>1-ε/2. Dalej,
|
∫Qaφtdt≥∫QaReφtdt≥1-ε/22ad, |
|
|
∫QaφPnktdt=∫Qa∫Rdeit,xPnkdxdt=∫Rd∫Qaeit,xdtPnkdx≤∫Qk∫Qaeit,xdtPnkdx+∫Qkc∫Qaeit,xdtPnkdx≤2adPnkQk+T, |
|
gdzie
|
T=∫Qkc∫Qaeit,xdtPnkdx=∫Qkc∏j=1d∫-aaeitjxjdtjPnkdx. |
|
Ustalmy teraz x∈Qkc. Istnieje współrzędna xl punktu x większa co do modułu niż k, zatem
|
∏j=1d∫-aaeitjxjdtj≤2ad-1eialxl-e-ialxlixl≤22aa-1/k. |
|
Stąd
|
2adPnkQk+T≤2adPnkQk+22ad-1PnkQkc/k≤2ad1-ε+22ad-1/kk→∞→2ad1-ε. |
|
Ale na mocy twierdzenia Lebesgue'a, ∫QaφPnktdt→∫Qaφtdt; stąd sprzeczność: 2ad1-ε/2<2aa1-ε.
∎
Przechodzimy do dowodu części (ii) twierdzenia Levy-Cramera. Powyższy lemat oraz twierdzenie Prochorowa dają istnienie miary probabilistycznej P na Rd oraz podciągu Pnkk zbieżnego słabo do P. Na mocy części (i) twierdzenia Levy-Cramera, mamy φPnktk→∞→φPt, skąd φt=φPt. Pozostaje jeszcze tylko udowodnić, że Pn⇒P. Przypuśćmy przeciwnie, iż dla pewnej funkcji f∈CRd mamy ∫RdfdPnnot→∫RdfdP; stąd, dla pewnego podciągu mk,
|
∫RdfdPmk→α≠∫RdfdP. |
| (*) |
Ale na mocy lematu, rodzina Pmk także jest ciasna, stąd z twierdzenia Prochorowa istnieje podciąg mkj oraz miara probabilistyczna P′ taka, że Pmkj⇒P′. Zatem, korzystając z (i), φPmkjt→φP′t, czyli φP=φP′. Sprzeczność z (*) kończy dowód.
∎
Na zakończenie zaprezentujemy twierdzenie o odwróceniu, pozwalające odczytać gęstość rozkładu za pomocą jego funkcji charakterystycznej. Analogiczny fakt dla zmiennych dyskretnych jest treścią zadania 10 poniżej.
Twierdzenie 2.5
Załóżmy, że P jest rozkładem prawdopodobieństwa w Rd o funkcji charakterystycznej φP. Wówczas jeśli ∫RdφPtdt<∞, to P ma ciągłą ograniczoną gęstość g daną wzorem
|
gx=12πd∫Rde-it,xφPtdt. |
|
Dowód:
Rozważmy funkcję
|
gεx=12πd∫Rde-it,xφPte-t2ε2/2dt=12πd∫Rde-it,x∫Rdeit,yPdye-t2ε2/2dt=12πd/2εd∫Rdεd2πd/2∫Rdeit,y-xe-t2ε2/2dtPdy=12πd/2εd∫Rde-y-x2/2ε2Pdy, |
|
gdzie w trzecim przejściu skorzystaliśmy z twierdzenia Fubiniego (dzięki czynnikowi e-t2ε2/2 wyrażenie podcałkowe jest całkowalne), a w czwartym użyliśmy faktu, iż wewnętrzna całka to funkcja charakterystyczna rozkładu N0,ε-2 w punkcie y-x. Jak widać, ostatnie wyrażenie to splot rozkładu P z rozkładem N0,ε2, w punkcie x; innymi słowy, jeśli X, Y są niezależnymi zmiennymi o rozkładach P i N0,1, odpowiednio, to X+εY ma rozkład z gęstością gε. Na mocy całkowalności funkcji charakterystycznej
i twierdzenia Lebesgue'a, mamy gεx→gx dla każdego x∈R. Wykażemy teraz, że ∫Rdg=1. Oczywiście, na mocy lematu Fatou, ∫Rdg≤1. By udowodnić nierówność przeciwną, weźmy δ>0 oraz taką liczbę M>0, by P-M,M>1-δ. Ponieważ X+εY⇒X∼P, to
|
1-δ≤lim infε→0+PX+εY∈-M,M=lim infε→0+∫-MMgεxdx=∫-MMgxdx, |
|
i
z dowolności δ dostajemy, iż g jest gęstością. Wystarczy teraz skorzystać z zadania 7 z pierwszego rozdziału: punktowa zbieżność gε→g pociąga za sobą, iż X+εYε zbiega, przy ε→0+, do rozkładu o gęstości g; stąd teza.
∎
2.4. Zadania
1. Rozstrzygnąć, czy podane niżej funkcje są funkcjami
charakterystycznymi i jeśli tak, podać odpowiedni rozkład.
|
a)cost,b)cos2t,c)141+eit2,d)1+cost2,e)2-eit-1. |
|
2. Niech ϕ1, ϕ2, …, ϕn będą
funkcjami charakterystycznymi pewnych rozkładów. Udowodnić, iż
dowolna kombinacja wypukła tych funkcji jest funkcją
charakterystyczną pewnego rozkładu.
3. Dany jest ciąg Xn niezależnych zmiennych losowych o tym
samym rozkładzie. Zmienna losowa N jest od nich niezależna i
ma rozkład Poissona z parametrem λ. Wyznaczyć funkcję
charakterystyczną zmiennej X1+X2+…+XN.
4. Niech ϕ będzie funkcją charakterystyczną pewnego
rozkładu. Rostrzygnąć, czy
|
a) ϕ2,b) Reϕ,c) ϕ2,d) ϕ |
|
są funkcjami charakterystycznymi.
5. Zmienne X,Y są niezależne, przy czym X oraz X+Y
mają rozkłady normalne. Udowodnić, że Y ma rozkład normalny lub
jest stała p.n..
6. Zmienne losowe X,Y są niezależne, przy czym X ma
rozkład jednostajny U0,1, a Y ma rozkład zadany przez
|
PY=k=1n,k=0, 1, 2,…,n-1. |
|
Wyznaczyć rozkład zmiennej X+Y.
7. Zmienne losowe X1,X2,…,Xn są niezależne i
mają ten sam rozkład,
przy czym zmienna X1+X2+…+Xn ma rozkład normalny
N0,1. Wyznaczyć rozkład zmiennych Xi.
8. Zmienna losowa X ma rozkład jednostajny U-1,1. Czy
istnieje niezależna od niej zmienna Y taka, że rozkłady zmiennych
X+Y oraz 12Y są takie same?
9. Funkcja charakterystyczna zmiennej losowej X ma drugą
pochodną w zerze. Udowodnić, że EX2<∞.
10. Zmienna losowa X przyjmuje wartości całkowite. Udowodnić, że
|
PX=k=12π∫-ππe-iktϕXtdt,k∈Z. |
|
11. Udowodnić, że dla p>2 funkcja ϕt=e-tp nie jest funkcją charakterystyczną żadnego rozkładu.
12. Udowodnić, że ϕt=e-t jest funkcją charakterystyczną rozkładu Cauchy'ego w R, tzn. rozkładu o gęstości
13. Niech X1, X2, … będą niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na przedziale -1,1. Zdefiniujmy
|
Yn=sgnXnXn1/α,n=1, 2,…, |
|
gdzie α∈0,2 jest ustalone. Udowodnić, że ciąg
jest zbieżny według rozkładu i wyznaczyć funkcję charakterystyczną rozkładu granicznego.
14. Udowodnić, że jeśli Pn (n=1, 2,…) są rozkładami Gaussa w Rd i Pn⇒P, to P jest rozkładem Gaussa.
15. Rzucamy monetą, dla której prawdopodobieństwo wypadnięcia orła wynosi p, aż do momentu, gdy uzyskamy n orłów (łącznie, niekoniecznie pod rząd). Niech Xp oznacza liczbę rzutów. Udowodnić, że 2pXp jest zbieżny według rozkładu gdy p→0.
16. Niech X będzie zmienną losową o funkcji
charakterystycznej φX. Udowodnić, że następujące warunki są
równoważne.
(i) Istnieje a≠0 takie, że φXa=1.
(ii) Istnieją b,c∈R takie, że zmienna X jest skoncentrowana
na zbiorze ck+b:k∈Z.
17. Dany jest ciąg Xn niezależnych zmiennych losowych o tym samym rozkładzie, zadanym przez PXn=0=PXn=1=1/2. Wykazać, że szereg ∑n=1∞2-nXn jest zbieżny p.n. i wyznaczyć rozkład sumy tego szeregu.
18. Dla a∈R, niech
|
φat=1+axjeśli x≤1,1+ajeśli x>1. |
|
Dla jakich wartości parametru a funkcja φa jest funkcją charakterystyczną rozkładu pewnej zmiennej losowej?
19. Załóżmy, że μ jest rozkładem prawdopodobieństwa o funkcji charakterystycznej φ. Udowodnić, że dla dowolnego r>0 zachodzi nierówność
|
μ-r,r≥1-r2∫-2/r2/r1-φsds |
|
oraz
|
μ0,r≤r∫-π/2rπ/2rφsds. |
|