14. Wykład XIV, 15.I.2010
Pod koniec poprzedniego wykładu poznaliśmy klasę funkcji wielu zmiennych,
które są pseudo-wklęsłe lub pseudo-wypukłe. Najważniejszą dla nas sprawą
związaną z tymi funkcjami jest to, że zachodzi dla nich wersja twierdzenia
Karusha-Kuhna-Tuckera! Czasami mówi się krótko, że to twierdzenie, i to
w formacie `wteddy', jest też prawdziwe w kategorii pseudo-wypukłej. Podajemy
je tutaj, bez dowodu jak i Twierdzenie 9.2, w nienajogólniejszej
wersji – tylko przy ograniczeniach nierównościowych (bez równościowych, bo
w zastosowaniu nasze funkcje będą niezmiennicze ze względu na skalowanie
argumentu). Ponadto warunki nierównościowe są tylko w postaci liniowej.
Większej ogólności nie potrzebujemy; byłaby tylko naszym wrogiem, nie
zaś sojusznikiem.
(Większą ogólność czytelnik znajdzie już w pionierskiej pracy [18].
To właśnie tam, na stronie 281, zdefiniowane zostały funkcje pseudo-wklęsłe
i pseudo-wypukłe, natomiast Theorem 1 na stronach 284-5 jest ogólną wersją
twierdzenia typu K-KT w kategorii pseudo-wypukłej i w formacie `wteddy'.
Nazwisko Karush nie pojawia się w [18]. Warto też zwrócić uwagę
na `Section 3. Remarks on pseudo-convex functions' na stronach 288-9.
Lokalne minimum jest zawsze dla tych funkcji globalnym minimum (!)
i własność tę dziedziczy nawet pewna jeszcze szersza klasa funkcji
ściśle quasi-wypukłych, także zdefiniowana w [18].)
Twierdzenie 14.1 (Karush; Kuhn, Tucker; wersja znacznie późniejsza, w kategorii pseudo-wypukłej)
Niech G⊂Rk będzie otwarty i wypukły, zaś
f:G→R będzie pseudo-wklęsła (pseudo-wypukła)
na G. Niech ponadto punkt x=x0∈G spełnia warunki
|
aiTx≤bi,i=1, 2,…,l, |
| (14.1) |
gdzie bi∈R, ai∈Rk. Wtedy x0 jest punktem
globalnego warunkowego maksimum (minimum) funkcji f przy
warunkach (ograniczeniach) (14.1) ⟺
|
∃λ1,λ2,…,λl≤0(≥0)∇f(x0)+∑i=1lλiai=0 |
|
|
oraz ∑i=1lλibi-aiTx0=0 (warunek komplementarności). |
|
Z punktu widzenia formalnego prawie nie ma tu różnic z wersją podaną
w Wykładzie IX jako Twierdzenie 9.2. I wtedy i teraz mamy bowiem
do czynienia z produktami pochodnymi od fundamentalnych rezultatów
zawartych w pracach [11] i [14], o czym była już
mowa w Wykładzie IX. Należy jednak pamiętać – powtarzamy to –
że Karush oraz Kuhn z Tuckerem dawali tylko warunki konieczne dla
ekstremum warunkowego z ograniczeniami nierównościowymi. Dopiero
w kategorii wypukłej (Twierdzenie 9.2) bądź pseudo-wypukłej
(Twierdzenie 14.1) stają się one warunkami równoważnymi, i
to od razu na globalne ekstremum warunkowe.
Teraz do dzieła: wyruszamy na poszukiwanie w analizie portfelowej
funkcji pseudo-wklęsłej określonej na dziedzinie wypukłej, i do tego
mającej odpowiednie maksimum warunkowe.
Szczegółowa analiza funkcji prowadzącej do współczynnika Sharpe'a
Innym – a przy tym w analizie portfelowej najważniejszym! – przykładem
funkcji, która nie jest ani wklęsła, ani wypukła, jest tzw.
pre-współczynnik Sharpe'a. Dokładniej, mając dane Σ,μ,μ0,
gdzie Σ>0, μ∦e (to nasze dawne założenie (5.2))
oraz: μ0<E0=βγ w aspekcie B,
względnie μ0<max1≤i≤kμi w aspekcie
M, rozważamy funkcję
|
G=x∈Rkμ-μ0eTx0,eTx>0∋x⟼Sx=μ-μ0eTxxTΣx, |
| (14.2) |
określoną na otwartym i wypukłym (co widoczne) zbiorze G⊂Rk.
Zauważamy od razu, że gdy x∈G oraz eTx=1, wtedy Sx jest
po prostu współczynnikiem Sharpe'a, przy stopie bezryzykownej wynoszącej μ0,
portfela x. Jest tak zarówno w aspekcie B, jak i M.
Co prawda – szczegół dość istotny – w żadnym z aspektów nie liczymy tak
współczynników Sharpe'a wszystkich dostępnych portfeli, a tylko tych,
które mają ten współczynnik dodatni. Idzie jednak o jego maksymalizację i w każdym
z aspektów jasno widać, że są portfele o tym współczynniku dodatnim.
Obserwacja. 14.1 Przy wymienionych wyżej założeniach, każda taka
funkcja S [którą w analizie portfelowej chcemy maksymalizować] nie jest
wklęsła na G.
Uzasadnienie. Oznaczając dla krótkości ν=μ-μ0e
(ν≠0, bo (5.2)), mamy zwartą postać wzoru na funkcję S,
Sx=νTxxTΣx-12,
dzięki czemu szybko liczymy jej gradient:
|
∇SxT=νTxxTΣx-12+νTx-12xTΣx-322xTΣ=xTΣx-12νT-νTxxTΣxxTΣ. |
| (14.3) |
Pokażemy, że w dziedzinie G niezwykle często zachodzi
nierówność pojawiająca się w definicji ścisłej wypukłości
funkcji różniczkowalnych,
|
Sy>Sx+∇SxTy-x. |
| (14.4) |
Szukamy zatem takich ,,złych” par x,y∈G×G, że
|
νTyyTΣy>νTxxTΣx+xTΣx-12νT-νTxxTΣxxTΣy-x |
|
(porównaj (14.3)). Lub, równoważnie,
|
xTΣxyTΣyνTy>νTy-νTxxTΣxxTΣy-xTΣx. |
|
Lub jeszcze równoważnie,
|
νTxxTΣxxTΣy-νTy>νTx-xTΣxyTΣyνTy. |
| (14.5) |
Jak to spełnić? Okaże się, że da się to uzyskać przy dowolnym wektorze
x∈G takim, że x∦Σ-1ν, albo, co tutaj równoważne,
Σx∦ν. Ustalmy dowolny taki właśnie wektor x.
Zmieniajmy teraz y, biorąc ay zamiast y, a>0. Wtedy nowa lewa
strona w (14.5) to (stara LHS)⋅a, podczas gdy prawa strona
w (14.5) pozostaje niezmienna! Wystarczy więc, by stara LHS była
dodatnia. Wtedy (biorąc dostatecznie duże a>1) już łatwo uzyskamy pożądaną
nierówność dla poprawionej pary wektorów x i ay. Jak więc zapewnić sobie
νTxxTΣxxTΣy-νTy>0 ?
Szukajmy takich wektorów y (jeszcze przed ich ewentualnym przeskalowaniem)
w postaci y=x+h. Po podstawieniu i skróceniu wyrazów ma więc być
νTxxTΣxxTΣh-νTh>0 ,
albo równoważnie
|
hTνTxxTΣxΣx-ν> 0 . |
| (14.6) |
Wektor w nawiasie jest niezerowy – po to właśnie zrobiliśmy założenie Σx∦ν.
Łatwo zatem znaleźć taki wektor h, by zachodziła nierówność (14.6) i przy
tym taki, by x+h∈G. (Np, wobec otwartości zbioru G, dobry jest każdy h
spełniający (14.6) i dostatecznie mały co do długości; euklidesowej, czy
też wyznaczonej przez iloczyn skalarny dawany macierzą Σ – bez znaczenia.)
To już koniec (at long last!) uzasadniania Obserwacji 14.1. Nierówność (14.5)
zachodzi dla wektorów x oraz y=ax+h wyspecyfikowanych w trakcie tego
uzasadniania. Reasumując, pasują tu m. in. prawie wszystkie x∈G wraz
z dobieranymi do tych x-ów z ogromną swobodą wektorami y=ax+h.
Przykład 14.1
Prześledźmy jeszcze etapy powyższego uzasadnienia na konkretnym przykładzie
|
k=2,Σ=1002,μ=34,μ0=1,x=20, |
|
|
ν=23,νTxxTΣxΣx-ν=0-3. |
|
Weźmy więc np h=0-1; wtedy nierówność
(14.6) jest oczywiście spełniona. Czy dla tego x oraz y=x+h
od razu spełniona jest nierówność (14.5)?
Otóż nie, bo 3<4-26. Lewą stronę trzeba pomocniczo
pomnożyć przez dostatecznie dużą liczbę a>1. Tutaj np wystarcza wziąć
a=1110, bo już 3⋅1110>4-26.
Wtedy dla x jw i nowego
|
y=111020+0-1=115-1110 |
|
mamy już jak w (14.4). Mianowicie Sx=2, ∇SxT=0,32, Sy=16, no i
|
16>18>49400=720=2+0,32115-1110-20. |
|
Uwaga 14.1
Przykład 14.1 pokazuje też przy okazji, że pre-współczynnik Sharpe'a
nie jest różniczkowalną funkcją wypukłą (choć taka wiadomość jest dla
nas zupełnie marginesowa, bo przecież chcemy ten współczynnik maksymalizować,
nie zaś minimalizować). Istotnie, przed przeskalowaniem wektora y
mieliśmy tam nierówność S(y)<S(x)+∇(x)T(y-x):
16<12=2+0,320-1 łamiącą
różniczkowalną wypukłość.
Uwaga 14.2
Uzasadnienie Obserwacji 14.1 nie poszło nam szybko, bo
chodziło o pewne nierówności charakterystyczne dla ścisłej wypukłości
funkcji różniczkowalnych. Takie nierówności są – w sytuacji z Obserwacji
14.1 – sprawą delikatną. Mianowicie, w (14.5) szukane były
pary x,y∈G takie, że
|
xTΣyxTΣxνTx+xTΣxyTΣyνTy>νTx+νTy, |
|
przy czym oba składniki po prawej stronie były, z definicji zbioru G,
dodatnie. Zakładając nawet, że xTΣy>0, tzn., że i po
lewej stronie oba składniki były dodatnie, mimo wszystko iloczyn tych
składników po lewej stronie, czyli liczba
|
xTΣyxTΣxyTΣyνTx⋅νTy |
|
był, z nierówności Schwarza, niewiększy niż iloczyn νTx⋅νTy
składników po prawej stronie; najczęściej zaś był po prostu mniejszy. Otóż
potrzeba pewnej gimnastyki, by przy mniejszym iloczynie dwóch czynników
mieć (jednak) większą sumę tych czynników. Taką sytuację udało nam
się w sposób ścisły wygenerować.
Natomiast okazuje się, że takie funkcje S są pseudo-wklęsłe.
Twierdzenie 14.2
Przy założeniach jak na początku bieżącego wykładu,
pre-współczynnik Sharpe'a S jest funkcją pseudo-wklęsłą na G.
Zakładamy, że ∇SxTy-x≤0, przy czym
gradient(y) ∇SxT został(y) już policzony(e)
w uzasadnieniu Obserwacji 14.1 powyżej. Zapisujemy to w postaci
rozwiniętej
|
0≥xTΣx-12 | νTy-νTx-νTxxTΣxxTΣy-x |
|
|
= | xTΣx-12νTy-νTxxTΣxxTΣy, |
|
albo równoważnie – patrz lewa nierówność poniżej,
a potem kontynuując dalej (prawa nierówność poniżej)
przy pomocy nierówności Schwarza:
|
νTy≤νTxxTΣx︸ten ułamek >0xTΣy≤νTxxTΣxxTΣxyTΣy. |
|
To już daje
|
νTyyTΣy≤νTxxTΣx. |
|
∎
Maksymalizacja współczynnika Sharpe'a, w aspekcie M i przy silnych założeniach.
Aspekt M oznacza, że chcemy maksymalizować pre-współczynnik
Sharpe'a S na zbiorze G∩x≥0. Nie ma więc tu żadnych
ograniczeń równościowych (pracujemy z pre-współczynnikiem niezmienniczym
ze względu na skalowania), zaś ograniczenia nierównościowe to właśnie
x≥0 (jedna nierówność wektorowa skrywająca k nierówności
skalarnych). W tej części zakładamy, że Σ>0. Zaraz puścimy
w ruch budowaną od dawna maszynerię.
Jest niezmiernie ważne, że punkty maksymalizujące funkcję S na G
przy podanych ograniczeniach w ogóle istnieją – że mamy
czego szukać przy pomocy Twierdzeń 14.1 i 14.2.
Istotnie, z racji dodatniej jednorodności stopnia 0 funkcji S można
rozważać tylko argumenty z G∩Δk, zaś skoro o maksymalizację
S chodzi, to ,,nic złego nam nie dojdzie” gdy będziemy rozważać
wszystkie portfele z Δk (bo wobec założeń o μ0
istnieją portfele x∈Δk, dla których Sx>0, więc maksymalizacja
S i tak odbywać się będzie w części G∩Δk). Dalej to
już standard z pogranicza analizy i topologii: ciągłość S na zwartym
zbiorze Δk i twierdzenie Weierstrassa.
Tak więc maksimum funkcji S na G∩x≥0 jest
osiągane. Przechodzimy teraz do wyłuskiwania tych miejsc, gdzie to
się dzieje. Będzie ich dużo, bo przecież wspomniana dodatnia
jednorodność stopnia 0.
W Twierdzeniu 14.1 przyjmujemy l=k oraz ai=-ei, bi=0
dla i=1, 2,…,k. Wtedy warunki (14.1) właśnie kodują
nieujemność wszystkich składowych wektora x. (Spotykaliśmy się już
z takim kodowaniem nieujemności składowych portfela Markowitza przy
stosowaniu Twierdzenia 9.2. Można powiedzieć, że jest to dla
nas chleb powszedni.)
Na mocy Twierdzenia 14.1, x0∈G∩x≥0 jest punktem
(pre-portfelem) maksymalizującym S na G∩x≥0 wtedy i
tylko wtedy, gdy istnieją niedodatnie współczynniki
λ1,…,λk takie, że
-
-
∑i=1kλi0--eiTx0=0 (z warunku
komplementarności).
Pierwszy z tych wzorów pokazuje, że gradient S w x0 jest niedodatni
jako wektor i równocześnie mówi, że współczynniki λi są po
prostu składowymi tego wektora gradientu. To pozwala dużo bardziej
operatywnie zapisać drugi wzór, i łącznie w ten sposób
Teraz należy rozszyfrować ∙ pamiętając, że
∇Sx0=x0TΣx0-12ν-νTx0x0TΣx0Σx0.
Pisząc jako
y0=νTx0x0TΣx0x0
pewną dodatnią wielokrotność portfela x0, ∙ oznacza
zaś ∙A∙ oznacza
x0TΣy0-μ+μ0e=0,
albo równoważnie
przy czym oczywiście y0≥0, eTy0>0.
To właśnie są nasze stare dobrze znajome związki (11.10).
Uzasadnienie sposobu szukania portfeli optymalnych x~op
w teorii Tobina przy Σ>0 jest teraz zakończone. (W końcówce trochę
szybko to poszło; czytelnik nie takiej końcówki się spodziewał po długim
wstępie.) Jednak – uwaga – dalece nie jest zakończone przy
ogólniejszych macierzach Σ≥0. Tym przypadkiem zajmiemy się
niebawem.
W tym momencie narzuca się, tak: wręcz narzuca się pytanie, czy
rozwinięta tu powyżej technika pracy z pre-współczynnikiem Sharpe'a
S nie wyprodukowałaby jeszcze raz (niejako po drodze) wzoru na
portfele optymalne xop w zmodyfikowanej teorii Tobina,
tj przy z powrotem dopuszczanej nieograniczonej krótkiej sprzedaży
i, oczywiście, dla Σ>0.
Odpowiedź jest twierdząca, bo przecież zerowanie się gradientu funkcji
pseudo-wklęsłej w punkcie zbioru otwartego wypukłego jest równoważne
jej maksymalizacji na tym zbiorze w tym właśnie punkcie: konieczność
tego warunku to fakt ogólny z AM II, sięgający wstecz aż do Fermata
(połowa XVII wieku), natomiast jego dostateczność wynika z samej
definicji – patrz Definicja 13.1 w Wykładzie XIII.
Mając zatem jakiś y∈G taki, że
|
0=∇Sy=yTΣy-12ν-νTyyTΣyΣy, |
|
zapisujemy ten fakt w postaci
|
νTyyTΣyy=Σ-1ν. |
| (14.7) |
Skoro ten y spełnia (14.7), to wszystkie ty:ty∈G
też spełniają (14.7). Zatem wszystkie y=tΣ-1ν,
t>0, spełniają (14.7), a wśród nich ten dla
t=eTΣ-1ν-1, tzn.
portfel xop. Rozumiemy to tak, że wiele
punktów w G maksymalizuje S, lecz wśród nich jest
tylko jeden portfel — właśnie portfel
xop.
Maksymalizacja współczynnika Sharpe'a, w aspekcie M i teraz przy słabszych założeniach.
Założenie (5.2) jest nie do podważenia – nie mogą wszystkie
wartości oczekiwane stóp zwrotu z walorów giełdowych być takie same;
mapa Markowitza musi być dwuwymiarowa! Za to do rozważenia jest
osłabienie założenia Σ>0. W tej części Wykładu XIV
zakładamy tylko, że Σ≥0. Jaką wtedy mamy wiedzę nt portfeli
optymalnych?
Jeśli chodzi o aspekt B, to takie osłabienie wiedzy nt
macierzy kowariancji, nawet bez zerowania się ryzyka niektórych
portfeli, może prowadzić do nieistnienia portfeli optymalnych
ze względu na jakąkolwiek ustaloną stopę bezryzykowną. Pamiętamy
jeszcze Przykład 7.1 w Wykładzie VII, gdzie po przejściu od aspektu
M do aspektu B portfele efektywne po prostu wyparowały.
Tymczasem portfel optymalny względem jakiejś stopy μ0 musiałby być
efektywny; optymalnych więc nie ma. Zresztą granica minimalna jest
pionową prostą σ=12 jak na Rysunku 7.1,
i współczynnik Sharpe'a każdego portfela krytycznego łatwo jest
(graficznie) powiększyć.
Dużo ciekawszy jest aspekt M, kiedy to większość dotychczasowych
rozważań przechodzi, co prawda tylko dla odpowiednio wybranych wartości
μ0.
Po pierwsze, przy macierzy kowariancji nieujemnie określonej ryzyko
portfeli Markowitza nie musi schodzić do zera; widzieliśmy
to już w ćwiczeniu w Uwadze 7.2. Wtedy dodatkowe ograniczenie dolne
na μ0 zaproponowane w (14.8) poniżej jest puste. Często
jednak ryzyko schodzi do zera (choćby w modelach doskonale ±
skorelowanych), i wtedy w mianowniku wyrażenia definiującego
współczynnik Sharpe'a może (czy: mogłaby) dziać się katastrofa. By jej
uniknąć,
zakładamy w dalszym ciągu, że
|
maxEx|x∈Δk,σx=0<μ0<max1≤i≤kμi |
| (14.8) |
(piszemy max zamiast sup, bo znowu w grę wchodzi ciągła
funkcja E(⋅) na zbiorze zwartym).
Uwaga. Jeśli w Δk nie ma portfeli o zerowym ryzyku,
to dodatkowego dolnego ograniczenia na μ0 po prostu nie ma.
Pre-współczynnik Sharpe'a S zdefiniujemy teraz nie na całym zbiorze G
zdefiniowanym w (14.2), tylko na o wiele mniejszym zbiorze [też,
jak i G] wypukłym i otwartym G~ w Rk, G~⊂G.
W dobrym określeniu tej dziedziny dla S tkwi teraz główna trudność.
Szczególnie chodzi tu o wypukłość zbioru – funkcje pseudo-wklęsłe
potrzebują wszak wypukłej dziedziny!
Uwaga. W ważnym fragmencie wykładu przedstawionym tu niżej
mignie też przez chwilę jedna najprostsza możliwość, gdy nowy G~
będzie starym G. Nie o to nam jednak głównie chodzi …
Konstrukcja dziedziny pre-współczynnika Sharpe'a gdyΣ≥0.
Zauważamy, że zbiór
Z1=x∈Δk|νTx>0 jest niepusty
wypukły (co oczywiste) oraz nie zawiera portfeli o zerowym ryzyku, bo na
nich (jeśli takowe w Δk są) funkcjonał νT jest ujemny
– patrz (14.8).
Dla potrzeb dalszego rozumowania, niech Zero=x∈H|σx=0.
Ten zbiór stanowi przeszkodę, choć wyjątkowo może nawet być pusty przy
macierzy Σ≥0 (znamy dobrze jeden taki przykład).
Jeśli zbiory Δk i Zero są rozłączne, to liczby δ tu poniżej
nie definiujemy. Natomiast jeśli mają one niepuste przecięcie,
to zauważamy, że wartości funkcji liniowej E(⋅) na zbiorach Z1 oraz
Zero∩Δk różnią się – patrz (14.8) – o pewną dodatnią
wielkość. Te dwa zbiory wartości są od siebie oddzielone na osi liczbowej,
natomiast funkcja E:H→R jest jednostajnie ciągła. Zatem i
zbiory argumentów muszą być oddzielone w przestrzeni H:
|
distZ1,Zero∩Δk=δ>0 . |
| (14.9) |
Trochę większy kłopot jest z częścią zbioru Zero położoną poza Δk
— znowu: jeśli tylko jest ona niepusta. (Jeśli jest pusta, to z kolei
nie definiujemy liczby δ′ poniżej.)
Mamy więc sytuację Zero∖Δk≠∅.
Przypuśćmy wówczas, że distZ1,Zero∖Δk=0.
Istnieją zatem ciągi portfeli xn⊂Z1⊂Δk oraz
yn⊂Zero∖Δk takie, że xn-yn→0
gdy n→∞. Sympleks Δk jest zwarty, więc istnieje podciąg
portfeli xnm zbieżny do jakiegoś portfela x¯∈Δk
gdy m→∞. Oczywiście też ynm-x¯→0 gdy m→∞.
Wobec σynm=0 dla m∈N, i z ciągłości
funkcji σ(⋅) na H, mamy σx¯=0.
W sytuacji, gdy Zero∩Δk=∅ (tj gdy nie ma liczby
δ), sprzeczność jest już, bo jednak x¯∈Zero∩Δk.
Jeśli zaś Zero∩Δk≠∅ (liczba δ jest), wtedy
sprzeczność jeszcze przez chwilkę dokuwamy: νTx¯≥0,
bo νTxnm>0 dla m∈N. Ta własność
hipotetycznego portfela Markowitza x¯ wraz z
wcześniejszą wiadomością σx¯=0 już dają
sprzeczność z lewą nierównością w (14.8).
Tak, czy inaczej, portfel x¯ nie może istnieć.
Tym samym udowodniliśmy ad absurdum, że
|
distZ1,Zero∖Δk=δ′>0, |
| (14.10) |
o ile tylko Zero∖Δk≠∅.
Mamy więc dwie warunkowo zdefiniowane liczby: δ i δ′.
Warunkowość oznacza tu, że być może któraś z nich jest nieokreślona,
względnie nawet obie są nieokreślone (powtarzamy, że może
tak być nawet przy częściowo zdegenerowanej macierzy Σ).
Jeśli obie te liczby są nieokreślone, albo innymi słowy Zero=∅,
wtedy … nie dzieje się nic nowego pod słońcem
i kładziemy G~=G. O tej rozczarowującej możliwości
wspominaliśmy już w Uwadze wyżej.
Jeśli zaś przynajmniej jedna z tych liczb jest określona,
to wnioskiem z (14.9) i/lub (14.10) jest
|
distZ1,Zero=minδ,δ′=r>0, |
| (14.11) |
z naturalnym rozumieniem i rolą liczby r gdy jednej z liczb delta
nie ma. Teraz już możemy skonstruować zbiór Z2, H⊃Z2⊃Z1,
otwarty w H, wypukły i rozłączny z niebezpiecznym zbiorem Zero:
|
Z2=⋃x∈Z1Bx,r, |
| (14.12) |
gdzie Bx,r to kula otwarta w hiperpłaszczyźnie H o środku w x
i promieniu r (zawsze w użyciu jest odległość euklidesowa, dziedziczona
w H z Rk).
Otwartość Z2 w H jest jasna, rozłączność ze zbiorem Zero wynika
z (14.11) (kule w (14.12) są, przypominamy, otwarte).
Wypukłość Z2 wynika wprost z wypukłości Z1. Dokładniej, pożyteczne
jest samodzielnie rozwiązać następujące ogólne
Ćwiczenie 14.1
W przestrzeni euklidesowej V dany jest niepusty zbiór wypukły Z,
zaś r>0 jest ustaloną liczbą dodatnią. Uzasadnić, że zbiór
⋃x∈ZBx,r⊃Z też jest wypukły w V.
Wybór Z2 dokonany w (14.12) jest kluczowy. To pewna
wypukła otoczka w H pewnej części sympleksu standardowego Δk.
Może to jednak być bardzo cienka otoczka w H (r może być maleńkie dodatnie),
niewiele większa od samej otaczanej części sympleksu.
Niech teraz G~ będzie po prostu stożkiem nad Z2,
|
G~=⋃a∈R+aZ2⊂x∈RkeTx0,xTΣx>0 |
| (14.13) |
(prawa inkluzja jest oczywista). Skoro zbiór Z2 był wypukły i otwarty w H,
więc zbiór G~ zdefiniowany w (14.13) jest z kolei
wypukły i otwarty w Rk. Właśnie na takiej dziedzinie G~
rozważamy teraz pre-współczynnik Sharpe'a S:G~∋x↦Sx.
Dosyć ciężka walka została stoczona, by był on dobrze określony na całym
otwartym i wypukłym G~ (pamiętna rozłączność Z2 z Zero
na poziomie hiperpłaszczyzny H).
Czy jest to właściwy punkt wyjścia do jego maksymalizacji na całym sympleksie
standardowym, oczywiście z wyłączeniem portfeli mających zerowe ryzyko? Wyjaśnijmy to tutaj dokładniej. Lewą
nierówność w (14.8) można przepisać w postaci
|
maxνTx|x∈Δk,σx=0< 0 . |
|
Skoro jest tak, to także
|
supνTx|x∈Δk,σx<σ0< 0 |
|
dla pewnego dostatecznie małego dodatniego σ0. Wobec tego maksymalizacja
współczynnika Sharpe'a na zbiorze x∈Δkσx0 jest
tym samym, co jego maksymalizacja na zbiorze x∈Δk|σx≥σ0
– bo odpadają tylko pewne ujemne wartości funkcji, która przyjmuje też wartości dodatnie. Na ostatnim
zapisanym tu zbiorze ten współczynnik jest funkcją ciągłą, zaś sam zbiór jest
zwarty. Przeto jego kres górny na tym zbiorze jest skończony i jest osiągany.
To właśnie było nam potrzebne, bo tym samym kres górny współczynnika Sharpe'a
na x∈Δkσx0 jest skończony i osiągany!
Przy tym, rzecz prosta, jest on osiągany w punkcie, lub punktach, zbioru
Z1, który posłużył nam wcześniej do zaproponowania okrojonej dziedziny
dla pre-współczynnika S.
Idziemy teraz za ciosem, bez straty ogólności pozostajemy w
naszej dziedzinie dla S i z dodatniej jednorodności stopnia 0
funkcji S dostajemy, że
∗ kres górny S na G~∩x≥0 jest skończony i jest osiągany.
Twierdzenie 14.3
Gdy Σ≥0, wtedy warunki (11.10) skrywają wszystkie
portfele optymalne w aspekcie M ze względu na stopę
bezryzykowną μ0 spełniającą (14.8).
Innymi słowy, również wtedy portfele optymalne (już niekoniecznie
jeden jedyny portfel optymalny!) znajduje się, rozwiązując liniowe
zagadnienie komplementarności (11.10).
Czytelnik domyśla się już, że kluczowy dla dowodu jest właśnie
fakt ∗, czyli osiąganie największej wartości przez
S na wymienionym tam zbiorze. Gdyż poza tym cały (gruby, otwarty)
G~ jest zbiorem wypukłym, na którym funkcja S jest
pseudo-wklęsła.
Tak samo, jak przy Σ>0 ten sam pre-współczynnik Sharpe'a był
pseudo-wklęsły na (o wiele większym) zbiorze G⊃G~.
(Czasami G nie jest ,,o wiele większy”, tylko jest tym samym, co
G~, lecz to zupełny szczegół. W trudniejszych sytuacjach
G może być o wiele większy niż G~.)
Dowód pseudo-wklęsłości przechodzi bez zmian, bo skurczona dziedzina
jest wypukła, wzór na gradient ∇S pozostaje w mocy, zaś
nieostra nierówność Schwarza zachodzi też dla formy dwuliniowej
z nieujemnie określoną macierzą współczynników.
Dalej zaś włącza się znowu do akcji Twierdzenie 14.1,
drugi raz tak samo prowadząc do warunków (11.10),
w 100% wiernie charakteryzujących punkty warunkowego
maksimum S przy warunkach nieujemności współrzędnych.
∎
Uwaga 14.3 (po dowodzie)
(i) W sytuacji łatwiejszej (początek tego wykładu) wycinaliśmy z Δk
część νTx≤0, a potem resztę powiększaliśmy do
stożka G (nad tą resztą budowaliśmy stożek G).
Teraz w trudniejszej sytuacji też wycinamy tę część, lecz dodatkowo
musimy też wyciąć zbiór [nieprzyjemny, algebraiczny, niby ,,tylko”
stopnia 2, lecz przecież w wielu wymiarach!] Zero. To wycięcie
sprawia pewien kłopot, jeśli chodzi o otwartą wypukłość tego, co
zostaje. Potem już tylko powiększamy do stożka G~.
Po drodze ubezpieczamy się, postulując w (14.8), by
Zero∩Δk⊂{νTx≤pewna liczba ujemna}.
To ubezpieczenie jest absolutnie naturalne – wystarczy je sobie zinterpretować
graficznie na pionowej osi na płaszczyźnie R2σ,E.
Zauważmy jeszcze, by postawić małą kropkę nad ,,i”, że w definicji
zbioru G w (14.2) występował warunek νTx>0.
Natomiast w definicji (14.13) zbioru G~
ten warunek eksplicite się nie pojawia i wręcz miejscami może nie
być spełniony w G~.
Był on w definicji zbioru Z1 i był tam ważny, natomiast
mógł się zagubić przy rozszerzaniu Z1 do Z2 [stożkiem nad
którym jest G~]. Dla samej maksymalizacji funkcji S
nie ma to żadnego znaczenia, bo technika K-KT wyłuskuje nam
tutaj pre-portfele maksymalizujące S siedzące w
G~∩x≥0, czyli w stożku nad Z1,
gdzie z powrotem (czy: od początku) warunek νTx>0
zachodzi.
(ii) Twierdzenie 14.3 może zostać/zostanie w pełni ocenione
dopiero podczas wykładów APRK2, gdy staje/stanie się czymś nieodzownym
w badaniu ważnego modelu Alexandera ogłoszonego w roku 1993
w pracy [2], proponującego dość realistyczne podejście do
krótkiej sprzedaży. Nie tak krańcowo restryktywne, jak u Lintnera
(porównaj Wykład IX), i też nie tak krańcowo swobodne/nierealistyczne,
jak u Blacka i współautorów (porównaj Wykłady V i VI).
W modelu Alexandera macierze kowariancji tylko nieujemnie
określone są czymś najbardziej naturalnym pod słońcem.
Gdy to Twierdzenie 14.3 jest już udowodnione, najwyższa
pora na ilustrację, jak konkretnie tamte słynne warunki (11.10)
pracują w sytuacji, gdy macierz kowariancji jest tylko nieujemnie
określona.
W ćwiczeniu poniżej ograniczenie dolne na μ0 w (14.8)
jest puste, bo Zero∩Δ3=∅. I nawet ,,gorzej”:
po prostu Zero=∅, więc w całej konstrukcji dziedziny dla
S powyżej można było wziąć G~=G itd. Tym niemniej
macierz Σ jest tam tylko nieujemnie określona …
Algorytm z Wykładu XI nie działa w sensie dosłownym
– nie możemy wszak odwracać macierzy Σ. Mimo to, zgodnie
z Twierdzeniem 14.3, warunki (11.10) jednak dobrze
kodują portfele optymalne w aspekcie M. Rozwiążemy te warunki
(lecz dopiero w … Rozwiązaniu ćwiczenia!) ,,całościowo”, czyli
łącznie i z marszu rozwiążemy odpowiednie liniowe zagadnienie
komplementarności. Do dzieła zatem.
Ćwiczenie 14.2
W słynnym już modelu Markowitza z ćwiczenia w Uwadze 7.2 (Wykład VII)
znaleźć portfele optymalne ze względu na bankową stopę bezryzykowną
μ0∈0, 1. (Podkreślamy, że tym razem chodzi o aspekt
M, bo aspektowi B w tym modelu zostało już
poświęcone Ćwiczenie 9.2 w Wykładzie IX.)
Rozwiązanie:
Wiemy już z Uwagi 7.2, że w tym modelu wszystkie portfele Markowitza
są portfelami relatywnie minimalnego ryzyka. Przy każdej ustalonej
wartości E∈1, 3 jest cały odcinek takich portfeli; dla skrajnych
wartości E odcinek degeneruje się do punktu – jednego portfela.
Więc dla wartości E¯ odpowiadającej ustalonej na pionowej
osi wartości μ0 powinniśmy mieć cały taki odcinek portfeli
optymalnych względem tej stopy bezryzykownej.
Dokładniej, jaką pionową współrzędną E¯ ma punkt na górnym
,,wąsie” pocisku σ2-E-22=1, σ>0 (wzór uzyskany
w Uwadze 7.2), w którym styczna do pocisku przecina oś OE→
na wysokości μ0<2 ?
Jest to standardowa geometria analityczna krzywych stożkowych, kiedyś obecna
w podręcznikach licealnych: E¯=5-2μ02-μ0.
Konkretnie, gdy μ0∈0, 1, wtedy E¯∈52, 3.
Jakie portfele Markowitza przechodzą w mapie Markowitza na punkt pocisku Markowitza
położony na wysokości E? Na boku e1e3¯
jest to portfel 3-E20E-12, natomiast na boku e2e3¯ — portfel
03-EE-2.
Zatem cały odcinek między tymi skrajnymi portfelami,
|
xt,E=t3-E20E-12+1-t03-EE-2=t3-E21-t3-EtE-12+1-tE-2,0≤t≤1, |
|
przechodzi na punkt pocisku położony na wysokości E. Gdy podstawimy
E=5-2μ02-μ0 i policzymy Σxt,E, wtedy
zależność od t znika:
Σxt,E=12-μ01-μ02-μ03-μ0. Teraz staje się jasne, jak realizuje
się krytyczność, o której mowa we wskazówce do Uwagi 7.2:
|
Σxt,E=12-μ0μ-μ02-μ0e. |
|
Natomiast w terminach problemu (11.10) trzeba oczywiście wziąć
y=yt,E=2-μ0xt,E, który dla rozważanych tu wartości
t i E ma wszystkie składowe nieujemne, no i mieć wtedy, właśnie całościowo
i niezależnie od oddzielnych etapów, Σyt,E-μ+μ0e=0.
Normalizacja pre-portfela yt,E daje portfel xt,E optymalny
ze względu na stopę μ0. Zależność tych portfeli od t jest
oczywiście afiniczna. Jest ich wiele przy ustalonej μ0, nie ma
mowy o jakiejkolwiek jednoznaczności portfela optymalnego (od dawna
wiemy, że cały przykład jest co najmniej dziwny). Natomiast jak te
portfele zależą od μ0?
To też nic trudnego. Do znanego już wzoru na xt,E
podstawiamy znalezioną zależność E=Eμ0, dostając
|
xt,Eμ0=12-μ012t-12tμ01-t-μ0+tμ01+12t-12tμ0,0≤t≤1 . |
|
Ćwiczenie 14.3 (kontynuacja Ćwiczenia 14.2)
Znaleźć najmniejszą wartość stopy bezryzykownej μ0, ze
względu na którą portfel e3 jest optymalny w modelu Markowitza z Ćwiczenia 14.2.
Wskazać jakąś inną większą stopę bezryzykowną, ze względu
na którą portfel e3 także jest optymalny w aspekcie M.
Czy jest to jedyny portfel optymalny w aspekcie M przy
tej większej stopie bezryzykownej?
Na koniec tych rozważań o portfelach optymalnych ze względu na
stopę(y) μ0 w aspekcie M, przeprowadźmy jedną dłuższą
analizę ich zachowania i zmienności w trochę podkręconym przykładzie
Krzyżewskiego. Mianowicie, przy niezmienionej tamtej macierzy
kowariancji, przesuńmy wszystkie wartości oczekiwane o wielkość
3 w górę – rodzaj przesunięcia równoległego stóp, pojęcia
występującego m. in. w kursie Inżynierii Finansowej.
Tzn. rozważamy teraz model Markowitza
|
Σ=19616311112μ=432 |
| (14.14) |
wzbogacony o stopę wolną od ryzyka μ0 zmieniającą się od 0
do 3313. Te wartości graniczne stopy bezryzykownej są
uzasadnione geometrią przykładu i są po prostu wysokościami, na
których styczne do granicy minimalnej w obrazach portfeli e3
i e1 przecinają pionową oś OE→. (W samym przykładzie
Krzyżewskiego przedział wartości dla stopy bezryzykownej zaczynałby
się w -3 — dość nieciekawej stopie zwrotu pozbawionej ryzyka.)
Wiemy, że i tutaj cała granica minimalna jest efektywna, bo to
stary przykład Krzyżewskiego, tylko ,,kopnięty” o 3 w górę.
Portfele optymalne przy zmienianiu stopy μ0 przebiegają
więc całą łamaną wierzchołkową, która jest, oczywiście, identyczna
jak w przykładzie Krzyżewskiego – patrz Rysunek 7.5 w Wykładzie VII.
Gdy więc przejeżdżamy wartością μ0 przedział 0, 3,
wtedy portfele optymalne x~op jadą (bądź
stoją) kolejno po (w) częściach łamanej z Rysunku 7.5 położonych
na ścianach: (a) 3, (b) 1, 3, (c) 1, 2, 3,
(d) 2, 3, (e) 2, (f) 1, 2, (g) 1.
Skomentujemy prawdziwe ruchy portfela optymalnego oraz jego postój
w wierzchołku e2. Nie przytaczamy szczegółowych obliczeń –
mogą to być (bardzo zalecane) dla czytelnika ćwiczenia
sprawdzające.
Ad (b). Dzieje się tak dla 0<μ0≤1713,
zaś wartość oczekiwana portfela optymalnego E~op
zmienia się wtedy między 2 i 3617. Sam zaś ten portfel to
|
x~op=168-35μ0μ0068-36μ0. |
|
Jego składowe są wyrażone funkcjami wymiernymi (homografiami) od
μ0. Jest to całkiem naturalne, bo przecież jego wartość oczekiwana
jest pewną homografią od μ0.
Ad (c). Dzieje się tak dla 1713<μ0<43,
zaś E~op zmienia się wtedy między 3617
i 73. Natomiast
|
x~op=117-12μ04-3μ0-17+13μ030-22μ0. |
|
Ad (d). Dzieje się tak dla 43≤μ0<32,
zaś E~op zmienia się wtedy między 73 i 3.
Natomiast
|
x~op=15-3μ00-1+μ06-4μ0. |
|
Ad (e). Portfel optymalny stoi na e2, podczas gdy μ0 rośnie
od 32 do 2. Dostajemy proste nadstyczne w punkcie Me2
do granicy efektywnej, wszystko oczywiście w aspekcie M.
(Me2 jest punktem załamania – kinkiem – na
granicy minimalnej.)
Ad (f). Dzieje się tak dla 2<μ0<3313, zaś
E~op zmienia się wtedy między 3 i 4. Natomiast
|
x~op=127-10μ0-6+3μ033-13μ00. |
|
Spróbujmy raz jeden zobrazować wszystkie te portfele optymalne dynamicznie
na jednym wspólnym rysunku, na osi odciętych odkładając wartości μ0, zaś
na pionowych prostych, nad odpowiednimi wartościami stopy μ0, zaznaczając
różnymi kolorami wkłady odpowiednich walorów do portfela optymalnego.
Konkretnie: kolorem ciemnozielonym zaznaczając wkład waloru 1, czerwonym –
waloru 2, niebieskim – waloru 3. Oto wynik takiego obrazowania:
[w wersji pdf chochlik drukarski przerzucił diagram na następną stronę]
Łamana efektywna jest tu, jak wiemy, bardzo bogata. Jej wizualizacja
graficzna podana w funkcji parametru μ0 trochę rozczarowuje –
widać chyba mniej, niż na Rysunku 7.5. W ramach porównywania tamtego
rysunku z obecnym Rysunkiem 14.1, można zadać sobie pytanie (oczywiście kontrolne),
czy na obecnym umiemy wskazać punkty, w których, na dawnym,
prosta krytyczna przecina boki sympleksu standardowego.
Jest to nietrudne w przypadku portfela krytycznego niemającego waloru numer 2
(x2=0): nad odciętą μ0=1713 widzimy charakterystyczny
punkt potrójny.
Jest to trudniejsze w przypadku portfela krytycznego niemającego
waloru numer 1 (x1=0). Czytelnik widzi na pewno lekki kink
na Rysunku 14.1 na granicy między obszarami niebieskim i czerwonym.
Ma on odciętą μ0=43 i rzędną 23.
Taką samą odciętą 43 ma punkt o rzędnej 1 – wspólny
punkt narożny obszarów: małego zielonego i czerwonego. Oba wymienione
punkty trzeba myślowo skleić ze sobą; dostanie się wtedy drugi punkt
potrójny na diagramie.
Ćwiczenie 14.4
Dokonujemy przesunięcia równoległego wszystkich wartości oczekiwanych o wielkość
c, μ~=μ+ce, nie zmieniając przy tym [odwracalnej] macierzy
kowariancji.
∙ Znaleźć wzory na nowe wielkości ,,greckie” α~,
β~ i γ~ po takim przesunięciu, a następnie
∙ sprawdzić, że takie przesunięcie równoległe ma (skądinąd naturalną
i oczekiwaną) własność funktorialności
|
α~-β~t+cβ~-γ~t+c=α-βtβ-γt+c |
|
dla wszystkich wartości t∈R. (Taka własność funktorialności przebłyskiwała
kilka razy w ,,przesuniętym przykładzie Krzyżewskiego” dyskutowanym tuż
przed tym ćwiczeniem.)
Łamane wierzchołkowe revisited i początek dyskusji algorytmu CLA
Łamane wierzchołkowe – te odpowiedniki w modelach Markowitza
prostych krytycznych Blacka – mogą być, jak już wiemy, bardzo
skomplikowane. Szukanie portfeli relatywnie minimalnego ryzyka w
modelach Markowitza jest żmudne – porównaj algorytm, czyli de facto
metodę prób opisaną w Wykładzie X (bazującą na twierdzeniu Karusha-Kuhna-Tuckera).
Również podzbiór łamanej wierzchołkowej – łamana efektywna obsługująca
granicę efektywną – może być bardzo złożony, jak pokazują przykłady
znalezione przez studentów naszego wydziału w roku 2008.
Komentatorzy pracy Markowitza z 1952 czynili mu z tego zarzuty,
określając całą rzecz jako mało praktyczną. Jak bowiem w praktyce
[wtedy, prawie 60 lat temu] znajdywać tak złożone obiekty?
Markowitz odpowiedział artykułem [20] i [pierwszą]
książką [21]. Mianowicie ukonkretnił i wyszlifował
prawdziwy klejnot, tzw. algorytm prostej krytycznej (Critical
Line Algorithm – CLA) zręcznie wyłuskujący te ściany sympleksu,
przez które przebiega łamana efektywna, czy łamana wierzchołkowa,
zależnie od wariantu.
Należy jednak zaznaczyć, że pierwsze, i od razu przełomowe uwagi
na ten temat zawarł on już w [19]! Kluczowa w tym aspekcie
jest tam strona 87. Proszę ocenić samej/samemu, reprodukcja poniżej.
[W wersji pdf Rysunek 14.2 jest dopiero pół strony dalej …]
Natomiast jak po latech oceniał to sam Markowitz? Odpowiedź jest na
stronie 38 w jego drugiej książce [22]: `The general portfolio
selection model […] was presented in [20], along with the
critical line algorithm for computing efficient sets.' Te słowa nie
wymagają żadnego dodatkowego komentarza odnośnie pierwszeństwa
w odkryciu algorytmu prostej krytycznej w analizie portfelowej.
Przy ilości spółek w modelu k≈200, zamiast ogromnej
ilości ścian do rozważenia, algorytm CLA zwykle wskazuje tych
kilkaset istotnych, na których dzieje się wszystko, co ważne dla
analizy portfelowej i decyzji inwestycyjnych o nią opartych.
(W [22] na stronie 157 czytamy: `Fortunately we can
find these few hundred [critical lines], and their efficient
portions, without enumerating all critical lines.')
W naszym opisie algorytmu CLA będziemy stale zakładać,
że Σ>0 i (5.2). Potem dojdą jeszcze inne
niezbędne założenia. Wszystko polegać będzie na zręcznym,
innym niż do tej pory szukaniu portfeli relatywnie minimalnego
ryzyka xE bez eksponowania parametru E.
Zanim to ukonkretnimy i rozwiniemy, chcemy jeszcze przywołać
słowa Sharpe'a z [26]. Zamiast bardzo długiego w
tym przypadku cytatu, oto dwie odpowiednie strony z tamtej pracy.
Ich lektura, i to teraz, dosłownie na poczekaniu, może być
dla czytelnika pierwszym spotkaniem i pochyleniem się nad algorytmem
Markowitza. Wyjaśnienia, które nastąpią później, w tym i w następnym
(ostatnim) wykładzie, będą inaczej odbierane, gdy czytelnik będzie
coś pamiętał ze wstępnego opisu Sharpe'a.
[W wersji pdf idący teraz Rysunek 14.3 przeskoczył aż na następną
stronę, zaś zaraz po nim idący Rysunek 14.4 – na jeszcze następną.
Zapoznać się z nimi należy przed zagłębieniem się w konkrety
opisu algorytmu.]
Zagłębiamy się już teraz w konkrety opisu algorytmu. Przypuśćmy, że
szukamy takich portfeli na ścianie IN⊂1, 2,…,k,
#IN≥1 (wierzchołki sympleksu są teraz dopuszczalne!),
tzn. rozwiązujemy zagadnienie
|
xi>0,Σx+λe-λEμi=0 dla i∈IN, |
| (14.15) |
|
xj=0,Σx+λe-λEμj≥0 dla j∈OUT=1, 2,…,k\IN |
| (14.16) |
przy jakichś rzeczywistych λ,λE zależnych
od szukanego x. Markowitz doszedł do wniosku, że λE
należy traktować jako niezależny parametr oraz szukał
pełnego układu k równań, a nie jedynie #IN równań.
Sztuczne #OUT równań wprowadził on w zaskakująco
prosty sposób.
Definicja 14.1
Niech eIN, μIN to nowe wektory o k
współrzędnych, tożsame z e,μ na miejscach z IN, lecz zerowe
na miejscach z OUT. Niech ΣIN to macierz k×k,
której i,j-ty wyraz to
|
i,j-ty wyraz Σgdy i,j∈IN×IN,1gdy i=j∈OUT,0gdy i≠j,i,j∉IN×IN. |
|
(Proszę porównać te nowe symbole z innymi symbolami
eIN, μIN, ΣIN wprowadzonymi
i używanymi w Wykładzie X.)
Równania (14.15) zapisujemy teraz jako układ
do którego dołączamy równanie budżetowe eINTx=1.
Łącznie dostajemy układ k+1 równań z k+1 ,,niewiadomymi”, wśród
których jest #OUT wiadomych xj=0,j∈OUT:
|
ΣINeINeINT0xλ=λEμIN1. |
| (14.17) |
W podejściu Markowitza kluczowe są macierze
MIN=defΣINeINeINT0 układów równań (14.17).
Twierdzenie 14.4
Gdy Σ>0 oraz (10.3) (tzn. wszystkie liczby
μ1,μ2,…,μk są różne), wtedy wszystkie
macierze MIN są odwracalne dla
IN: 1≤#IN≤k.
Jest to widoczne bezpośrednio dla IN jednoelementowych.
Istotnie, gdy IN=i, wtedy, rozwijając wyznacznik względem i-go wiersza, składnik z czynnikiem
σii znika i zostaje tylko
|
detMIN=-1i+k10⋱01︷i-10︷k-i0010⋯0⋮10⋮⋮⋱000110⋯0=-1i+k-1k-i+1⋅1=-1, |
|
a więc ten wyznacznik nie zależy nawet od wariancji
σii=σi 2.
Dla IN więcej niż jednoelementowych potrzeba tu więcej pracy.
Na ścianie IN rozwijamy teorię Blacka przy danych ΣIN,
μIN, eIN – patrz wspomniane starsze
oznaczenia z Wykładu X. (Oczywiście wykorzystujemy tutaj założenia
Σ>0 oraz ≠μ1,μ2,…,μk, czyli
założenie (10.3), właśnie jeszcze z Wykładu X; jest
to centralny moment dowodu.)
Niech liczby α,β,γ pojawiające się w
tej teorii będą teraz nazwane A,B,C i, konsekwentnie,
|
λE=EB1CAC-B2,λ=-AEB1AC-B2. |
| (14.18) |
Pytamy się, czy układ k+1 równań (14.17) ma rozwiązanie.
W czystym sensie wyjętym z GALu, bez żadnego związku z analizą
portfelową.
To pytanie jest jednak źle postawione – trzeba najpierw
sprecyzować wartość λE w kolumnie wyrazów wolnych!
Sprecyzujmy więc, biorąc np E=0. Wtedy z (14.18)
dostajemy λE=BB2-AC i równocześnie
λ=AB2-AC. Jaki wektor x mógłby dopełnić
tę wartość λ do rozwiązania w sensie z GALu układu
(14.17)? Oczywiście portfel Blacka xIN0
– porównaj podstawowy wzór (6.2) –
uzupełniony zerami na miejscach OUT, by dostać portfel
x∈H⊂Rk (!)
Układ równań po doprecyzowaniu ma więc rozwiązanie.
Przypuśćmy teraz, że istnieją dwa różne rozwiązania,
cały czas w sensie z GALu, tego układu po doprecyzowaniu,
xλ,
x′λ′.
Natura równań (14.17) jest taka, że x,x′ leżą w płaszczyźnie
ściany IN: xj=xj′=0 dla j∈OUT. Wtedy także
x≠x′ (bo, wobec
równość x=x′ pociągałaby λ=λ′). W takiej sytuacji
wspomniana teoria Blacka na ścianie IN ma dwa różne rozwiązania
x i x′ przy jednej wartości oczekiwanej E=0. Dwa różne
portfele relatywnie minimalnego ryzyka w aspekcie B
odpowiadające ustalonej wartości oczekiwanej E!
(Punkty x, x′ rozumiane są teraz jako punkty
w przestrzeni #IN-wymiarowej;
#IN≥2 jest, przypominamy
to jeszcze raz, istotne.)
Tak, jak dobrze wiadomo, być nie może. Przypuszczenie o dwóch
różnych rozwiązaniach jest więc fałszywe. Skoro układ równań
liniowych (14.17), po doprecyzowaniu E=0, ma jedno
jedyne rozwiązanie w sensie z GALu, jego macierz MIN
jest nieosobliwa.
∎
Korzystamy teraz z Twierdzenia 14.4 i rozwiązujemy
układ (14.17), lecz teraz już przy dowolnej
ustalonej wartości λE (takie to added
values oferuje nam za darmo GAL; ktoś inny powie w
tym miejscu, że jest to alfabet matematyki):
|
xλ=MIN-101︸αIN+MIN-1μIN0︸βIN⋅λE. |
| (14.19) |
Tak zdefiniowane αIN oraz βIN
są to wektory o k+1 składowych (!), które będą używane w
każdym danym etapie IN algorytmu CLA. Lecz nie tylko one.
Obok nich używane będą jeszcze dwa inne wektory, tym razem o k
składowych, bezpośrednio związane z nierównościami (14.16).
Definicja 14.2
(podstawowy wektor używany podczas stosowania twierdzenia K-KT
do poszukiwania portfeli relatywnie minimalnego ryzyka).
Zapisujemy ten wektor η trochę inaczej, używając
rozwinięcia (14.19):
|
η=Σexλ-λEμ=ΣeαIN+βINλE-λEμ=ΣeαIN︸γIN+ΣeβIN-μ︸δINλE, |
| (14.20) |
gdzie Σe nie jest wynikiem działania macierzy
Σ na wektorze e, tylko niekwadratową macierzą
k×k+1.
Algorytm CLA to, na każdym etapie IN, dosyć zręczne
żonglowanie rozwinięciami (14.19) i (14.20).
Dla większej przejrzystości, w dalszym ciągu opuszczać będziemy
subskrypty IN w wektorach αIN,βIN,γIN,δIN. Istnieje ryzyko
kolizji oznaczeń z symbolami w teorii Blacka i współautorów,
lecz zawsze należy zwracać uwagę na kontekst pojawienia się
danego symbolu.