13. Wykład XIII, 8.I.2010

Zanim podamy uzasadnienie algorytmicznej40w sytuacjach niezdegenerowanych metody dochodzenia do portfeli optymalnych \widetilde{x}_{{\text{op}}} opisanej w Wykładzie XI, pierwszą połowę tego wykładu chcemy poświęcić alternatywnemu  spojrzeniu na optymalność portfeli w aspekcie M. W tym spojrzeniu [dominujący w głównym nurcie analizy portfelowej] współczynnik Sharpe'a zostaje zastąpiony tzw. oczekiwaną użytecznością inwestora.
Jest to podejście pochodzące od J. von Neumanna i O. Morgensterna – ich podstawowe dzieło poświęcone tej tematyce to [24]. Podejście to wykładane jest bardziej systematycznie na kursach mikroekonomii (także na Wydziale MIM UW; również na WNE, SGH, w Szkole Koźmińskiego, na LSE …). Dla ogólnego i zgrubnego wyrobienia sobie poglądu na tę dziedzinę bardzo godny polecenia jest przeglądowy artykuł [15] dobrze nam znanych autorów Kuhna i Tuckera w zeszycie BAMS upamiętniającym J. von Neumanna.
Podejście z funkcjami użyteczności prowadzi, przy szukaniu portfeli – teraz optymalnych w sensie oczekiwanej użyteczności danego inwestora! – do bardzo naturalnego, kolejnego już w tych wykładach, użycia twierdzenia K-KT (czyli Twierdzenia 9.2 z Wykładu IX). Z tego (i z innych) powodu(ów) warto zrobić taki détour.

Gdzie wobec tego w tej chwili jesteśmy? Po Wykładzie XI tkwimy w pewnym rozkroku, jeśli tak można powiedzieć: jesteśmy w trakcie maksymalizowania współczynnika Sharpe'a w aspekcie M, lecz wykracza to poza optymalizację najbardziej przez nas lubianych [różniczkowalnych] funkcji wklęsłych i wypukłych. Mamy już zasygnalizowane – koniec Wykładu XI – co należy robić; przy tym przy \Sigma>0 – czysto algorytmicznie.

Podczas, gdy ta nowa (dla nas) mgła osiada,41właśnie dlatego nowy algorytm był podany od razu z marszu w Wykładzie XI – by w międzyczasie miało co osiadać jest najlepszy moment, by przypomnieć słowa dawnej oceny twierdzenia K-KT, wypowiedziane przez Góreckiego i Turowicza w Wiadomościach Matematycznych XII.1 (i przytoczone w Wykładzie IX w akapicie poprzedzającym Twierdzenie 9.2). Twierdzenie było zaiste doniosłe. Kuhn i Tucker nadali swojej pracy [14] taki, a nie inny tytuł celowo. Chcieli oni wyjść poza rozwiązywanie bardzo wtedy modnych zadań programowania liniowego (liniowa funkcja celu i liniowe ograniczenia równościowe i nierównościowe) – i zdołali to zrobić, zaś przed nimi i niezależnie – uczynił to Karush w [11]. Dlatego nonlinear programming.
Zapowiedziane powyżej zastosowanie twierdzenia K-KT w teorii użyteczności jest dość świeże w wykładach z APRK1 na Wydziale MIM UW – datuje się dopiero od roku akademickiego 2007/08.

W podejściu von Neumanna i Morgensterna uważa się (albo: przyjmuje), że każdy inwestor ma swoją funkcję użyteczności u, którą mierzy czy ocenia możliwy zysk X danego scenariusza inwestycyjnego. Powszechnie przyjmuje się – patrz np już pierwszy rozdział w [1] – że funkcje użyteczności u spełniają trzy aksjomaty (tj, że inwestorzy tylko po takie funkcje sięgają w swoich podświadomościach, albo dokładniej: tylko po takie funkcje sięgają ich podświadomości):

  • A1. u jest rosnąca (inwestor jest nienasycony, ang. nonsatiation), u^{{\prime}}>0;

  • A2. u jest wklęsła (inwestor ma awersję do ryzyka, ang. risk aversion), u^{{\prime\prime}}<0;

  • A3. -\frac{u^{{\prime\prime}}}{u^{{\prime}}} jest malejąca (inwestor ma malejącą bezwzględną awersję do ryzyka, ang. decreasing absolute risk awersion).42wielkość -\frac{u^{{\prime\prime}}}{u^{{\prime}}} bywa nazywana miarą Pratta-Arrowa awersji do ryzyka, czyli: w A3 postuluje się malejącość tej właśnie miary

Dyskutuje się jeszcze jeden (uzupełniający) aksjomat A4, dotyczący zachowania się względnej  awersji do ryzyka inwestora, porównaj [1, strony 24–26], co do zasadności którego nie ma jednak pełnej zgody wśród ekonomistów. Jeden z najbardziej wśród nich znanych, Bawa, ujął to w roku 1975 następująco: ”… decreasing absolute risk aversion is the most restrictive class of utility functions acceptable to most economists.”

Taki X jest zmienną losową z wachlarza (czasem mówi się też: uniwersum) możliwych scenariuszy inwestycyjnych (biznesowych) \mathfrak{X}\colon X\in\mathfrak{X}. Zwykle są one wszystkie określone na tej samej przestrzeni probabilistycznej \Omega. Oczekiwana użyteczność danego scenariusza X, oznaczana  \mathcal{U}(X), to wartość oczekiwana zmiennej losowej u(X):

\mathcal{U}(X)=\mathbb{E}(u(X))=\int _{{\Omega}}u(X) (13.1)

dla X\in\mathfrak{X}. W teorii użyteczności przyjmuje się, że inwestor dąży do maksymalizacji oczekiwanej użyteczności \mathcal{U}(X):

\mathcal{U}(X)\longrightarrow\max _{{X\in\mathfrak{X}}}.

Jednak na takim poziomie ogólności nie jest to wszystko zbyt … użyteczne. Liczenie oczekiwanych użyteczności zależy przecież od całkowania po trudnych do dokładniejszego sprecyzowania przestrzeniach probabilistycznych. Także problem istnienia  scenariusza maksymalizującego oczekiwaną użyteczność jest w ogólności trudny.

Teoria użyteczności sama staje się użyteczna gdy oczekiwana użyteczność \mathcal{U}(X) zależy tylko od kilku dyskretnych parametrów związanych ze zmienną losową X. Najlepiej – jedynie od wartości oczekiwanej \mathbb{E}(X) i odchylenia standardowego \sigma(X):

\mathcal{U}(X)\,=\, f\big(\mathbb{E}(X),\,\sigma(X)\big)\,, (13.2)

przy czym, powtórzmy, \mathcal{U}(\cdot) cały czas spełnia (13.1), z funkcją użyteczności u spełniającą A1 – A3 +

Przykład 13.1

Wachlarz możliwych scenariuszy inwestycyjnych to zbiór zmiennych losowych, wyrażających np możliwy zysk z jakiejś dużej planowanej inwestycji (określonych na tej samej przestrzeni probabilistycznej) mających rozkłady normalne N(E,\,\sigma), przy podaniu jakichś rozsądnych przedziałów, z których brane są wartości parametrów \sigma oraz E. Natomiast funkcja użyteczności inwestora to u, u(w)=-e^{{-aw}}, gdzie a>0 jest stałą, która może podlegać kalibracji (albo: zależy od inwestora).

Taka funkcja użyteczności inwestora jest rosnąca (A1) i wklęsła (A2), choć już bezwzględna awersja do ryzyka takiego inwestora jest stała (równa a), nie zaś malejąca – lokujemy się więc na obrzeżach aksjomatu A3, wystawiając trochę na szwank słowa Bawy.

Jaka jest tutaj oczekiwana użyteczność \mathcal{U}? Po krótkim i pouczającym rachunku – czytelnik jest zachęcany do wykonania go samodzielnie – okazuje się być idealna, uzasadniając ex post  cały przykład. Po prostu i nawet bez żadnych przybliżeń (o których wspomina się niżej, gdy mowa o ogólnym stosowaniu aksjomatów A1 – A3),  \mathcal{U}(X)\,=\,-\exp\left(-a\mathbb{E}(X)+\frac{a^{2}\sigma(X)^{2}}{2}\right),  jak w (13.2).
Zatem na poziomicach tej funkcji jedynie od argumentów \sigma=\sigma(X) i E=\mathbb{E}(X), po rozwikłaniu, E=E(\sigma)=\frac{a}{2}\sigma^{2}+\text{const}. Są to funkcje rosnące i wypukłe; nie może być lepiej.

Jak naturalny jest, w teorii użyteczności na styku z analizą portfelową, warunek (13.2), niech świadczy następujący dłuższy cytat z jednej z najważniejszych prac w analizie portfelowej [23]. (Dodajmy, że `individuals' uczestniczący w grze akcjami na giełdzie pojawiają się tam, jak deus ex machina, dopiero w cytowanym twierdzeniu, na dziewiątej stronie pracy.)

Theorem I (a mutual fund theorem). Given m assets satisfying conditions […], there are two portfolios (”mutual funds”) constructed from these m assets, such that all risk-averse individuals, who choose their portfolios so as to maximize utility functions dependent only on the mean and variance of their portfolios, will be indifferent in choosing between portfolios from among the m original assets or these two funds.

To prove Theorem I, it is sufficient to show that any portfolio on the efficient frontier can be attained by a linear combination of two specific portfolios because an optimal portfolio for any individual (as described in the theorem) will be an efficient portfolio.

Podczas kursu APRK2 przedstawiana jest dosyć szeroka klasa rozkładów zmiennych losowych X, dla których (13.2) ma miejsce. Teraz musimy się zadowolić tylko stroną praktyczną – zakładać (13.2) i rozważać konkretne sytuacje związanie z maksymalizowaniem pewnych funkcji od E,\,\sigma, gdzie w domyśle E=\mathbb{E}(X), \sigma=\sigma(X) dla X\in\mathfrak{X}. Przy tym w analizie portfelowej, jak już wspominaliśmy w Wykładzie VII, wachlarz \mathfrak{X} to \{ x^{{\text{T}}}R\colon x\in\Delta^{k}\} w aspekcie M, względnie \{ x^{{\text{T}}}R\colon x\in H\subset\mathbb{R}^{k}\} w aspekcie B.

Co więcej można powiedzieć o pojawiających się w taki sposób funkcjach f(E,\,\sigma)? Dokładniej, co można powiedzieć o poziomicach takich funkcji, czyli krzywych obojętności inwestora (ang. indifference curves)?

Otóż wymienione wcześniej aksjomaty A1 – A3 implikują,43po pewnych dodatkowych przybliżeniach, w tym: bliskich zaproponowaniu pewnej formy aksjomatu A4, porównaj też [1] że rozwikłania związków f(E,\,\sigma)=\text{const}, tzn. funkcje E=E(\sigma), są rosnące i wypukłe.
Właśnie te własności funkcji E=E(\sigma) są implicite zakładane w konkretnych  zadaniach pojawiających się od pewnego czasu w kursie APRK1.

Przykład 13.2 (z kolokwium z APRK1 w XII. 2007)

Niech dane (13.6) (na których później jeszcze będzie ćwiczony i utrwalany algorytm dochodzenia do portfeli optymalnych) definiują taki model Markowitza, w którym inwestor dodatkowo  zna swoją funkcję oczekiwanej użyteczności \mathcal{U} zależną tylko od E i \sigma danego portfela (czyli scenariusza inwestycyjnego),

\mathcal{U}(E,\,\sigma)\,=\, 86E-7E^{2}-7\sigma^{2}. (13.3)

Należy wyznaczyć portfel optymalny dla tego  inwestora, tj portfel optymalny ze względu na tę  funkcję oczekiwanej użyteczności – po prostu portfel, który ma maksymalną oczekiwaną użyteczność wśród wszystkich portfeli Markowitza.
Chcemy zatem zmaksymalizować funkcję

\Delta^{3}\ni\begin{pmatrix}x_{1}\\
x_{2}\\
x_{3}\end{pmatrix}\longmapsto 86\big(3x_{1}+4x_{2}+5x_{3}\big)-7\big(3x_{1}+4x_{2}+5x_{3}\big)^{2}-7\big(x_{1}^{{\, 2}}+3x_{2}^{{\, 2}}+2x_{3}^{{\, 2}}+2x_{1}x_{2}\big) (13.4)

i w pierwszej chwili nie wydaje się to łatwe. Przedstawimy dwa zupełnie różne rozwiązania. Pierwsze opiera się o dodatkową ,,tajemną” wiedzę, która dopiero później znajdzie wyjaśnienie.

Rozwiązanie: 

[Rozwiązanie A]  Zapisujemy trochę inaczej funkcję

\frac{1}{7}\,\mathcal{U}(E,\sigma)\,=\,\left(\frac{43}{7}\right)^{2}-\left(E-\frac{43}{7}\right)^{2}-\,\sigma^{2},

przez co widoczne stają się poziomice funkcji \frac{1}{7}\,\mathcal{U}, więc też poziomice  \mathcal{U}. Są to części półokręgów (\sigma>0) w rodzinie współśrodkowych okręgów o środku w \left(0,\,\frac{43}{7}\right)^{{\text{T}}}, zaznaczone na czerwono na Rysunku 13.1 poniżej. Okazuje się, że ten wspólny środek tworzy, z: (a) pewnym punktem P44będącym \mathcal{M}-obrazem konkretnego portfela efektywnego w aspekcie M – patrz Rysunek 13.1 na granicy minimalnej F_{{\min}} w tym modelu Markowitza, i z (b) punktem, w którym prosta styczna w P do F_{{\min}} przecina oś \overrightarrow{OE}, trójkąt prostokątny widoczny tu na rysunku.

[W wersji pdf Rysunek 13.1 przeskakuje aż na następną stronę.]

\par
Rys. 13.1. Prostopadła do stycznej przecina oś \overrightarrow{OE} właśnie na wysokości \frac{43}{7}.

Upewniamy się o tym bezpośrednim rachunkiem

\left(\frac{43}{7}-\frac{34}{7}\right)^{2}+2\left(\frac{5\sqrt{3}}{7}\right)^{2}+\left(\frac{34}{7}-\frac{11}{3}\right)^{2}=\,\left(\frac{43}{7}-\frac{11}{3}\right)^{2}.

Skoro tak, to to już koniec rozwiązania: portfel x=\left(0,\,\frac{1}{7},\,\frac{6}{7}\right)^{{\text{T}}}, który w mapie \mathcal{M} przechodzi na punkt P [i który wypłynie jeszcze w innym zagadnieniu później w tym wykładzie] okazuje się być optymalny w sensie podanej funkcji oczekiwanej użyteczności. Wartość

\mathcal{U}\big(E(x),\,\sigma(x)\big)\,\,=\,\, 86\cdot\frac{34}{7}-7\left(\frac{34}{7}\right)^{2}-7\left(\frac{5}{7}\sqrt{3}\right)^{2}\,=\,\,\frac{1693}{7}

jest maksymalna możliwa dla portfeli – scenariuszy inwestycyjnych z \Delta^{3}.

W tym rozwiązaniu wsparliśmy się wyciągniętym z kapelusza faktem geometrycznym, który znajdzie swoje objaśnienie dopiero ex post. Czy nie możnaby rozwiązywać takich zadań na ślepo, niejako automatycznie?

Odpowiedź brzmi TAK, ponieważ chodzi tu o maksymalizację funkcji F(x_{1},\, x_{2},\, x_{3}) stojącej po prawej stronie (13.4), która jest wklęsła i różniczkowalna jako funkcja zmiennych (x_{1},\, x_{2},\, x_{3})\in\mathbb{R}^{3}. Maksymalizacja ma być warunkowa, przy ograniczeniu równościowym x_{1}+x_{2}+x_{3}=1 i ograniczeniach nierównościowych x_{1}\ge 0,\  x_{2}\ge 0,\  x_{3}\ge 0. Mieści się to dokładnie w zakresie stosowalności twierdzenia K-KT, skąd wyłania się

Rozwiązanie: 

[Rozwiązanie B]  Szukamy portfela x\in\Delta^{3} takiego, że

\nabla F(x)+\lambda e\le 0\quad\text{oraz}\quad x^{{\text{T}}}\big(\nabla F(x)+\lambda e\big)=0

dla jakiegoś \lambda\in\mathbb{R}; ten drugi warunek to aktualna postać warunku komplementarności w twierdzeniu K-KT.

Poszukiwanie odbywa się etapami, zaczynając od
Etap 0. x_{1}>0,\  x_{2}>0,\  x_{3}>0. Warunek komplementarności oznacza teraz ”=” zamiast ”\le”, co łącznie z ograniczeniem równościowym oznacza

\begin{bmatrix}-140&-182&-210&1\\
-182&-266&-280&1\\
-210&-280&-378&1\\
1&1&1&0\end{bmatrix}\begin{bmatrix}x_{1}\\
x_{2}\\
x_{3}\\
\lambda\end{bmatrix}=\begin{bmatrix}-258\\
-344\\
-430\\
1\end{bmatrix}.

Rozwiązaniem jest (x_{1},\, x_{2},\, x_{3},\,\lambda)=\left(-\frac{6}{17},\,\frac{52}{119},\,\frac{109}{119},\,-\frac{604}{17}\right), a więc Etap 0 nie daje rozwiązania.

Etap 1.1. x_{1}=0,\  x_{2}>0,\  x_{3}>0. Tym razem warunek komplementarności prowadzi do układu równań

\begin{bmatrix}-266&-280&1\\
-280&-378&1\\
1&1&0\end{bmatrix}\begin{bmatrix}x_{2}\\
x_{3}\\
\lambda\end{bmatrix}=\begin{bmatrix}-344\\
-430\\
1\end{bmatrix},

i dalej do (x_{2},\, x_{3},\,\lambda)=\left(\frac{1}{7},\,\frac{6}{7},\,-66\right). W tym momencie musimy jeszcze sprawdzić nierówność
(\nabla F(x)+\lambda e)_{1}\le 0, tzn. nierówność -182x_{2}-210x_{3}+192\le 0. Jest ona spełniona (-14\le 0), więc procedura opierająca się o twierdzenie K-KT właśnie znalazła rozwiązanie x=\left(0,\,\frac{1}{7},\,\frac{6}{7}\right)^{{\text{T}}}, to samo, co w Rozwiązaniu A.

Twierdzenie K-KT jeszcze raz pokazało swoją siłę.

Zwracamy uwagę, że w tym podejściu funkcja oczekiwanej użyteczności \mathcal{U} nie zawsze musi być podana explicite. Znane mogą być tylko jej poziomice, czyli krzywe obojętności inwestora, bez podania, jakim wartościom  \mathcal{U} odpowiadają. Tak było np w zadaniu z egzaminu z APRK1 ze stycznia 2008.

Ćwiczenie 13.1

Rozpatrujemy model Blacka z k=2 i parametrami \sigma _{1}=2, \sigma _{2}=1, \sigma _{{12}}=\frac{1}{2} oraz \mu _{1}=2, \mu _{2}=1. Wiadomo, że poziomice różniczkowalnej funkcji oczekiwanej użyteczności inwestora \mathcal{U}, są łukami współśrodkowych okręgów na płaszczyźnie \mathbb{R}^{2}(\sigma,\, E), mających środek w punkcie (0,\, 5)^{{\text{T}}}, i że gradient tej funkcji wszędzie patrzy w stronę środka (0,\, 5)^{{\text{T}}}.

  • \bullet Znaleźć portfel optymalny w powyższym modelu Blacka ze względu na taką funkcję oczekiwanej użyteczności \mathcal{U}(\sigma,\, E). Czy ten portfel używa krótkiej sprzedaży?

  • \bullet Rozważamy rodzinę modeli Blacka o parametrach

    \Sigma=\begin{pmatrix}\sigma _{1}^{{\, 2}}&\rho\,\sigma _{1}\sigma _{2}\\
\rho\,\sigma _{1}\sigma _{2}&\sigma _{2}^{{\, 2}}\end{pmatrix},\quad\mu=\begin{pmatrix}2\\
1\end{pmatrix},

    gdzie \sigma _{1} oraz \sigma _{2} są takie, jak powyżej. Powiększamy współczynnik korelacji \rho do takiej wartości, że portfel (1,\, 0)^{{\text{T}}} staje się portfelem optymalnym w danym modelu względem tej samej, niezmienianej funkcji oczekiwanej użyteczności. Wyznaczyć tę wartość \rho.

  • \bullet Wyznaczyć taką (jeszcze większą od poprzedniej) wartość \rho, by portfel (7/5,\,-2/5)^{{\text{T}}} był portfelem optymalnym w danym modelu Blacka względem tej samej, niezmienianej funkcji oczekiwanej użyteczności.

Pierwsza część zadania

Rozwiązanie: 

Ze szkoły średniej (ale … przedwojennej) wiadomo, jak wygląda równanie afinicznej  prostej stycznej do hiperboli (3.4) przechodzącej przez punkt (\overline{\sigma},\,\overline{E})^{{\text{T}}} leżący na tej hiperboli, konkretnie – obraz portfela szukanego w tej części zadania. Równanie to ma postać

\overline{\sigma}\sigma-4\left(\overline{E}-\frac{9}{8}\right)E\,=\,\text{const}\,,

gdzie podstawiono już znane wartości do [naszego starego] wzoru (3.3) na E_{0}. Znamy więc już wektor prostopadły do tej prostej stycznej,

\begin{bmatrix}\overline{\sigma}\\
\frac{9}{2}-4\overline{E}\end{bmatrix}\,.

W warunkach zadania ten wektor powinien być równoległy do wektora łączącego środek rodziny okręgów (0,\, 5)^{{\text{T}}} z punktem (\overline{\sigma},\,\overline{E})^{{\text{T}}}, tzn. do wektora

\begin{bmatrix}\overline{\sigma}\\
\overline{E}-5\end{bmatrix}\,.

Wobec równych i niezerowych pierwszych składowych obu wektorów, równe muszą też być ich drugie składowe,

\frac{9}{2}-4\overline{E}\,=\,\overline{E}-5\,,

skąd \overline{E}=\frac{19}{10}, więc x=\left(\frac{9}{10},\,\frac{1}{10}\right)^{{\text{T}}}. Widzimy, że ten portfel nie używa krótkiej sprzedaży (jest portfelem Markowitza).

Teraz część druga zadania.

Rozwiązanie: 

Jeżeli portfel (1,\, 0)^{{\text{T}}} jest optymalny względem tej samej funkcji oczekiwanej użyteczności, natomiast inny jest teraz współczynnik korelacji \rho – to właśnie on jest teraz niewiadomą, zaś wiadome są \overline{\sigma}=\sigma _{1}=2 oraz \overline{E}=\mu _{1}=2. Równanie prostej stycznej do pocisku Markowitza w punkcie (2,\, 2)^{{\text{T}}} ma więc teraz postać

2\sigma-(5-4\rho)(2-E_{0})E\,=\,\text{const}\,,

gdzie E_{0}=\frac{6-6\rho}{5-4\rho} zgodnie z (3.3). Stąd jeden z wektorów prostopadłych do tej prostej to

\begin{bmatrix}2\\
(5-4\rho)\left(\frac{6-6\rho}{5-4\rho}-2\right)\end{bmatrix}.

W zadaniu postuluje się, by ten wektor był równoległy do wektora wodzącego idącego od środka okręgów – krzywych obojętności do punktu styczności (2,\, 2)^{{\text{T}}},

\begin{bmatrix}2\\
-3\end{bmatrix},

co daje równianie

(5-4\rho)\left(\frac{6-6\rho}{5-4\rho}-2\right)\,=\,-3\,,

albo \rho=\frac{1}{2}. Współczynnik korelacji zwiększyliśmy od wyjściowej wartości \frac{1}{4} do \frac{1}{2} i w tym czasie portfel optymalny w nowym sensie przesunął się do samego krańca odcinka \Delta^{2}.

Część trzecia zadania.

Rozwiązanie: 

Cały czas przedwojenna szkoła średnia: równanie afinicznej prostej stycznej do hiperboli (3.4) przechodzącej przez punkt (\overline{\sigma},\,\overline{E})^{{\text{T}}} – obraz portfela optymalnego w tej części zadania, ma postać

\overline{\sigma}\sigma-(5-4\rho)\left(\frac{12}{5}-\frac{6-6\rho}{5-4\rho}\right)E\,=\,\text{const}

(patrz znowu wzór (3.3)). Stąd wektor prostopadły do tej prostej stycznej to

\begin{bmatrix}\overline{\sigma}\\
6-6\rho-\frac{12}{5}(5-4\rho)\end{bmatrix}\,.

W warunkach zadania ten wektor powinien być równoległy do wektora łączącego środek rodziny okręgów (0,\, 5)^{{\text{T}}} z punktem styczności \left(\overline{\sigma},\,\frac{12}{5}\right)^{{\text{T}}}, tzn. do wektora

\begin{bmatrix}\overline{\sigma}\\
-\frac{13}{5}\end{bmatrix}\,.

Skoro \overline{\sigma}\ne 0, drugie składowe tych wektorów są równe,

-\frac{13}{5}\,=\, 6-6\rho-\frac{12}{5}(5-4\rho)\,,

skąd \rho=\frac{17}{18}. Współczynnik korelacji wzrósł dramatycznie (od wartości \frac{1}{2}) i w tym czasie portfel optymalny w nowym sensie przesunął się bardzo znacznie poza odcinek portfeli Markowitza.

Jako pewien test, czy ten nowy obszar zastosowań twierdzenia K-KT został już dobrze opanowany, spróbujmy wspólnymi siłami poszukać portfela Markowitza w modelu z parametrami

\Sigma=\begin{bmatrix}1&1&2\\
1&4&6\\
2&6&16\end{bmatrix},\quad\mu=\begin{bmatrix}2\\
4\\
5\end{bmatrix}

optymalnego ze względu na (skądś) znaną funkcję oczekiwanej użyteczności \mathcal{U}(\sigma,\, E)=33E-2E^{2}-2\sigma^{2}. No i na koniec policzyć też, ile ta maksymalna oczekiwana użyteczność wynosi: 50, 75, 100 ?

Mają to być oczekiwane użyteczności portfeli, a więc wprowadzamy funkcję wklęsłą i różniczkowalną F(x)=33\,\mu^{{\text{T}}}x-2\big(\mu^{{\text{T}}}x\big)^{2}-2\, x^{{\text{T}}}\Sigma\, x i pamiętamy o ograniczeniu równościowym e^{{\text{T}}}x=1 oraz o standardowych ograniczeniach nierównościowych w Markowitzu x_{i}\ge 0, i=1,\, 2,\, 3.

Szukamy zatem – właśnie technologia K-KT – takiego(ch) portfela(i) x, dla którego(ch) istnieje \lambda\in\mathbb{R} taka, że \nabla F(x)+\lambda e\le 0 w sensie wektorowym oraz spełniony jest warunek komplementarności x^{{\text{T}}}\big(\nabla F(x)+\lambda e\big)=0.

\nabla F(x)+\lambda e\:=\: 33\begin{bmatrix}2\\
4\\
5\end{bmatrix}-4\Big(\begin{bmatrix}2&4&5\end{bmatrix}\begin{bmatrix}x_{1}\\
x_{2}\\
x_{3}\end{bmatrix}\Big)\begin{bmatrix}2\\
4\\
5\end{bmatrix}-4\begin{bmatrix}1&1&2\\
1&4&6\\
2&6&16\end{bmatrix}\begin{bmatrix}x_{1}\\
x_{2}\\
x_{3}\end{bmatrix}+\lambda\begin{bmatrix}1\\
1\\
1\end{bmatrix}\:=\:\begin{bmatrix}66-20x_{1}-36x_{2}-48x_{3}+\lambda\\
132-36x_{1}-80x_{2}-104x_{3}+\lambda\\
165-48x_{1}-104x_{2}-164x_{3}+\lambda\end{bmatrix}. (13.5)

Szukać będziemy etapami.

Etap 0. x_{1}>0,\  x_{2}>0,\  x_{3}>0. Warunek komplementarności oznacza teraz wszystkie ”=” zamiast ”\le”, co, wobec rachunku (13.5) i łącznie z ograniczeniem równościowym oznacza

\begin{bmatrix}20&36&48&-1\\
36&80&104&-1\\
48&104&164&-1\\
1&1&1&0\end{bmatrix}\begin{bmatrix}x_{1}\\
x_{2}\\
x_{3}\\
\lambda\end{bmatrix}=\begin{bmatrix}66\\
132\\
165\\
1\end{bmatrix}.

Rozwiązaniem jest (x_{1},\, x_{2},\, x_{3},\,\lambda)=\left(-\frac{19}{24},\,\frac{65}{36},\,-\frac{1}{72},\,-\frac{35}{2}\right), a więc Etap 0 na pewno nie da nam rozwiązania.

Etap 1.1. x_{1}=0,\  x_{2}>0,\  x_{3}>0. Tym razem, znowu używając (13.5), warunek komplementarności prowadzi do układu równań

\begin{bmatrix}80&104&-1\\
104&164&-1\\
1&1&0\end{bmatrix}\begin{bmatrix}x_{2}\\
x_{3}\\
\lambda\end{bmatrix}=\begin{bmatrix}132\\
165\\
1\end{bmatrix},

i dalej do (x_{2},\, x_{3},\,\lambda)=\left(\frac{3}{4},\,\frac{1}{4},\,-46\right). To już stwarza nadzieję na rozwiązanie, choć musimy jeszcze sprawdzić nierówność
(\nabla F(x)+\lambda e)_{1}\le 0, tzn. nierówność 66-36x_{2}-48x_{3}+\lambda\le 0.

Jest ona spełniona, 66-36\cdot\frac{3}{4}-48\cdot\frac{1}{4}-46=-19\le 0, więc twierdzenie K-KT właśnie dało nam szukane rozwiązanie x=\left(0,\,\frac{3}{4},\,\frac{1}{4}\right)^{{\text{T}}}.

Liczymy (niemalże) w pamięci, że E(x)=\frac{17}{4} oraz \sigma^{2}(x)=\frac{11}{2}. Oczekiwana użyteczność portfela x, maksymalna w aspekcie M, to  \mathcal{U}\big(\sigma(x),\, E(x)\big)=33\cdot\frac{17}{4}-2\left(\frac{17}{4}\right)^{2}-2\cdot\frac{11}{2}=93.125.

Wreszcie, jako ostateczny test w zakresie teorii użyteczności, polecamy szczególnie Zadanie 2 w następującym przykładowym zestawie trzech zadań z analizy portfelowej (oferującym też jeszcze pytanie dodatkowe).

Przykład 13.3

We wszystkich dotychczasowych przykładach krzywe obojętności były łukami okręgów, co mogło zachęcać przy szukaniu rozwiązań do alternatywnego sięgania po czystą geometrię analityczną. W zestawie zadań tuż poniżej (Rysunek 13.2, Zadanie 2) krzywe obojętności są łukami elips. Taka okoliczność nie wyklucza stosowania geometrii analitycznej, lecz wyraźnie zwiększa pokusę sięgnięcia po nasze główne narzędzie, czyli twierdzenie K-KT.

\par
Rys. 13.2. Pierwszy arkusz kolokwium uzupełniającego w dniu 19.I.2010.

[W wersji pdf pierwszy arkusz przeskakuje na następną stronę, zaś drugi – na jeszcze następną.]

\par
Rys. 13.3. Drugi arkusz kolokwium uzupełniającego w dniu 19.I.2010.

(W tym kolokwium trochę inny niż 18.XII.2009 był rozkład punktów za zadania, lecz też do zdobycia było ich łącznie 40, oraz dodatkowo 8 w bonusie za pytanie dodatkowe.)

Przerywamy już tę (za) długo trwającą dygresję o teorii użyteczności; mogła ona trwać jeszcze dłużej, jeśli po drodze rozwiązywało się zadania.

Wracamy do sprawy najważniejszej, czyli do maksymalizowania współczynnika Sharpe'a w aspekcie M, no i do algorytmu, który ma to robić ,,za nas”.
Dużą część naszej dotychczasowej wiedzy puścimy w ruch w trakcie dyskusji jednej konkretnej sytuacji. Mianowicie

jednym z dobrze rozpoznanych, jeśli chodzi o łamaną wierzchołkową Ł, jest przykład

\Sigma=\begin{pmatrix}1&1&0\\
1&3&0\\
0&0&2\end{pmatrix},\quad\mu=\begin{pmatrix}3\\
4\\
5\end{pmatrix}, (13.6)

który wystąpił na egzaminie w VI. 2006 i – w innym kontekście – także na kolokwium w XII. 2007, no i także już w tym bieżącym wykładzie (w Przykładzie 13.2, w kontekście teorii użyteczności). Łamana Ł wygląda w nim następująco:

[w wersji pdf Rysunek 13.4 przeskakuje aż dwie strony dalej!]

\par
Rys. 13.4. Łamana wierzchołkowa i portfel \widetilde{x}_{{\text{op}}} (optymalny względem \mu _{0}=\frac{11}{3}) na niej.

Zaproponujemy tutaj portfel \widetilde{x}_{{\text{op}}}, nie znając jeszcze konkretnej wartości \mu _{0}, której on odpowiada. \mu _{0} poznamy chwilę później, używając już posiadanej wiedzy.
Niech \widetilde{x}_{{\text{op}}} będzie środkiem `najwyższego' boku Ł, \widetilde{x}_{{\text{op}}}=\begin{pmatrix}0\\
\frac{1}{7}\\
\frac{6}{7}\end{pmatrix},  \mathcal{M}(\widetilde{x}_{{\text{op}}})=\begin{pmatrix}\frac{5}{7}\sqrt{3}\\
\frac{34}{7}\end{pmatrix}. Ten punkt leży na granicy efektywnej w odpowiednim modelu Markowitza (granica efektywna w aspekcie M tu zaczyna się dokładnie tam, gdzie zaczyna się aktywna w modelu Markowitza część pocisku Markowitza). Styczna do granicy efektywnej w \mathcal{M}(\widetilde{x}_{{\text{op}}}) przecina pionową oś \overrightarrow{OE} na wysokości \mu _{0},

\mu _{0}=\frac{\alpha _{{23}}-\frac{34}{7}\beta _{{23}}}{\beta _{{23}}-\frac{34}{7}\gamma _{{23}}},

gdzie \alpha _{{23}},\,\beta _{{23}} i \gamma _{{23}} są z teorii Blacka przy \text{IN}=\{ 2,\, 3\}. Dla tego modelu liczy się je niemalże w pamięci i wtedy

\mu _{0}=\frac{\frac{107}{6}-\frac{34}{7}\cdot\frac{23}{6}}{\frac{23}{6}-\frac{34}{7}\cdot\frac{5}{6}}=\frac{11}{3}

(przypadkowo też wysokość przełączenia się granicy minimalnej z pocisku Markowitza na obraz boku \overline{e_{1}\, e_{3}}). Teraz już wiemy, że portfel \widetilde{x}_{{\text{op}}} jest optymalny w tym modelu Markowitza ze względu na stopę bezryzykowną \mu _{0}=\frac{11}{3}.
Te słowa rzucają też snop światła na Rysunek 13.1 i dotąd tajemnicze rozwiązanie A problemu zaproponowanego w Przykładzie 13.2 (tamten rysunek jest ukryty w rozwiązaniu; trzeba w nie wejść, by go zobaczyć).

Zobaczmy, jak w tej sytuacji pracuje algorytm podany na Wykładzie XI.

Etap \emptyset to [w pierwszej fazie, przed sprawdzaniem ostrych nierówności], z warunku komplementarności, poszukiwanie portfela x_{{\text{op}}} optymalnego w Blacku (13.6) ze względu na tę samą \mu _{0}=\frac{11}{3}. Otóż ten portfel nie jest Markowitza. Istotnie, portfel \Big(0,\,\frac{2}{7},\,\frac{5}{7}\Big)^{{\text{T}}} na przecięciu boku \overline{e_{2}\, e_{3}} i prostej krytycznej Blacka dla danych (13.6) jest optymalny w takim modelu Blacka ze względu na

\frac{\frac{107}{6}-\frac{33}{7}\cdot\frac{23}{6}}{\frac{23}{6}-\frac{33}{7}\cdot\frac{5}{6}}=\frac{5}{2}<\frac{11}{3},

a więc E(x_{{\text{op}}})>\frac{33}{7} i portfel x_{{\text{op}}} leży na prostej krytycznej poza sympleksem \Delta^{3}.45Jest ćwiczeniem sprawdzającym znaleźć ten portfel x_{{\text{op}}}, patrz też Rysunek 13.4.

Etap \text{OUT}=\{ 1\} to szukanie y=(0,\, y_{2},\, y_{3})^{{\text{T}}}, y_{2},\,\, y_{3}>0 i

\begin{cases}(\Sigma y-\mu+\mu _{0}e)_{1}\ge 0\,,\\
(\Sigma y-\mu+\mu _{0}e)_{2}=0\,,\\
(\Sigma y-\mu+\mu _{0}e)_{3}=0\,,\end{cases}

co daje y_{2}=\frac{1}{9}, y_{3}=\frac{6}{9}, zaś nierówność na pierwszej składowej \frac{1}{9}+\frac{6}{9}-3+\frac{11}{3}\ge 0 jest spełniona.
Algorytm kończy się więc na tym etapie, dając po normalizacji \frac{y}{e^{{\text{T}}}y}=(0,\,\frac{1}{7},\,\frac{6}{7})^{{\text{T}}}=\widetilde{x}_{{\text{op}}} zgodnie z oczekiwaniami.

Nie jest to koniec naszych przykładów szukania portfeli optymalnych w aspekcie M. Takie portfele pojawią się jeszcze w następnym Wykładzie XIV.

Tymczasem jednak niecierpiące zwłoki są zręby ważnej teorii, sięgające wstecz do roku 1965 (praca O. L. Mangasariana [18]) niezbędne do tego, co wymienione w tytule tu poniżej.

Uzasadnienie algorytmicznej metody przedstawionej w Wykładzie XI.

Na samym początku potrzebny jest nam mały rozbieg – musimy cofnąć się do różniczkowalnych funkcji wypukłych i wklęsłych wielu zmiennych. Ten temat jest niestety traktowany trochę po macoszemu w kursie AM II (zresztą tam, jak wiadomo, prawie na nic nie starcza czasu). Jeśli f\colon\underset{\underset{\mathbb{R}^{k}}{\cap}}{G}\longrightarrow\mathbb{R}, G otwarty wypukły, jest różniczkowalna, wtedy

\text{$f$ \, jest wypukła}\quad\Longleftrightarrow\quad f(y)\ge f(x)+\nabla f(x)\cdot(y-x)\quad\text{dla}\quad x,\, y\in G\,.

Także w wersji ostrej, czy ścisłej,

\text{$f$ \, jest ściśle wypukła}\quad\Longleftrightarrow\quad f(y)>f(x)+\nabla f(x)\cdot(y-x)\quad\text{dla}\quad x,\, y\in G,\  x\ne y\,.

Analogiczna, z nierównościami w przeciwnych kierunkach, jest charakteryzacja funkcji wklęsłych różniczkowalnych.
(Tej wiedzy zwykle nie uzyskuje się w kursie AM II, lecz dopiero na zajęciach z Optymalizacji. Tymczasem chodzi tu o zupełnie podstawowe intuicje geometryczne związane z funkcjami wklęsłymi/wypukłymi wielu zmiennych w ich punktach różniczkowalności – o podpieranie z góry/dołu wykresów takich funkcji przez afiniczne  przestrzenie styczne do tych wykresów.)

To przypomnienie stanowi motywację i punkt wyjścia do zdefiniowania ogólniejszych własności różniczkowalnych funkcji wielu zmiennych, niż wklęsłość/wypukłość.46na poziomie definicji, sama wklęsłość/wypukłość funkcji nie wymaga różniczkowalności

Definicja 13.1 ([18])
  • \bullet Powiemy, że f  j. w. jest pseudo-wklęsła gdy

    \nabla f(x)\cdot(y-x)\le 0\Longrightarrow f(y)\le f(x)\quad\text{dla}\quad x,\, y\in G\,.
  • \bullet f  j. w. jest pseudo-wypukła gdy

    \nabla f(x)\cdot(y-x)\ge 0\Longrightarrow f(y)\ge f(x)\quad\text{dla}\quad x,\, y\in G\,.

Obserwacja. 13.1  Funkcja różniczkowalna wklęsła (wypukła) jest także pseudo-wklęsła (pseudo-wypukła).

Wynika to od razu z Definicji 13.1, po wykorzystaniu przypomnianych chwilę wcześniej charakteryzacji funkcji wklęsłych i wypukłych różniczkowalnych.

Uwaga 13.1

Na odwrót nie, bo np funkcja \mathbb{R}\ni x\overset{f}{\longmapsto}x+x^{3}\in\mathbb{R} nie jest ani wklęsła, ani wypukła, natomiast jest ona zarówno pseudo-wklęsła, jak i pseudo-wypukła.
Istotnie, f^{{\prime}}(x)(y-x)=(1+3x^{2})(y-x), natomiast f(y)-f(x)=(1+x^{2}+xy+y^{2})(y-x) i pierwsze czynniki w tych wyrażeniach iloczynowych są zawsze dodatnie.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.