2. Wykład II, 9.X.2009

Co wiemy na temat rzeczywistych rozkładów zmiennych stóp zwrotu?

Najczęściej nie wiemy nic konkretnego na temat rozkładów zmiennych stóp zwrotu z akcji spółek notowanych na giełdzie. Markowitz był tego świadom od samego początku. Na stronie 82 w swoim podstawowym artykule [19] pisał

… Perhaps there are ways, by combining statistical techniques and the judgment of experts, to form reasonable probability beliefs (\mu _{i},\,\sigma _{{ij}}). We could use these beliefs to compute the attainable efficient combinations of (E,\, V). The investor, being informed of what (E,\, V) combinations were attainable, could state which he desired. We could then find the portfolio which gave this desired combination.
(Początkową część tego cytatu czytelnik znajdzie też dalej w tych wykładach – na Rysunku 7.2 w Wykładzie VII, gdzie strona 82 została trochę ucięta przy skanowaniu.)

Natomiast całą pracę [19] kończył Markowitz takimi oto uwagami, rozwijającymi i ukonkretniającymi te wcześniejsze.1To quasi-powtórzenie pokazuje, jaką wagę przykładał on do zagadnienia znalezienia właściwych parametrów w analizie portfelowej.

To use the E-V rule in the selection of securities we must have procedures for finding reasonable \mu _{i} and \sigma _{{ij}}. These procedures, I believe, should combine statistical techniques and the judgment of practical men. My feeling is that the statistical computations should be used to arrive at a tentative set of \mu _{i} and \sigma _{{ij}}. Judgment should then be used in increasing or decreasing some of these \mu _{i} and \sigma _{{ij}} on the basis of factors or nuances not taken into account by the formal computations. Using this revised set of \mu _{i} and \sigma _{{ij}}, the set of efficient E,\, V combinations could be computed, the investor could select the combination he preferred, and the portfolio which gave rise to this E,\, V combination could be found.
One suggestion as to tentative \mu _{i} and \sigma _{{ij}} is to use the observed \mu _{i}, \sigma _{{ij}} for some period of the past. I believe that better methods, which take into account more information, can be found. I believe that what is needed is essentially a ,,probabilistic” reformulation of security analysis. I will not pursue this subject here, for this is ,,another story”. It is a story of which I have read only the first page of the first chapter.

Zgodnie z sugestią Markowitza zawartą w drugim akapicie powyższego cytatu, estymujemy zatem podstawowe parametry takich zmiennych stóp zwrotu, używając estymatorów z jednakowymi (mówi się też: jednorodnymi) wagami, jak w przykładach w Wykładzie I.

Realnie zmienne losowe w analizie portfelowej mogą mieć najrozmaitsze rozkłady. Oto pewna para  takich rozkładów, pojawiająca się w obecnie już klasycznym przykładzie ,,5 stanów giełdy” (pochodzącym z dawniejszych wykładów [13] profesora Krzyżewskiego na Wydziale MIM UW; przykładzie wtedy przesuniętym na ćwiczenia, a teraz analizowanym tutaj aż do Rysunku 2.1 włącznie, z niespodziewanym nawrotem do niego jeszcze w Przykładzie 3.3 w Wykładzie III):

stan prawdopodobieństwo wystąpienia R_{{\text{A}}} R_{{\text{B}}}
hossa 0.2 40\% 30\%
wzrost 0.3 20\% 20\%
stabilizacja 0.1 10\% 10\%
spadek 0.3 -10\% -20\%
bessa 0.1 -30\% -20\%

Wartości zmiennych losowych R_{{\text{A}}} i R_{{\text{B}}} to stopy wzrostu (które mogą też być ujemne) notowań spółek A i B w zaproponowanych tu możliwych stanach giełdy, w ustalonym okresie inwestycyjnym.

Na podstawie tak podanych danych surowych tworzymy tabelę rozkładu łącznego zestawu zmiennych (R_{{\text{A}}},\, R_{{\text{B}}}), albo, jak niektórzy wolą powiedzieć, tabelę rozkładu zmiennej losowej dwuwymiarowej.

Następnie obliczamy podstawowe parametry rozkładów zmiennych R_{{\text{A}}} i R_{{\text{B}}} (tj rozkładów brzegowych wspomnianej zmiennej losowej dwuwymiarowej):

\mathbb{E}(R_{{\text{A}}})=0.09,\ \mathbb{E}(R_{{\text{B}}})=0.05,\ \sigma^{2}(R_{{\text{A}}})=0.0489,\ \sigma^{2}(R_{{\text{B}}})=0.0445\,,
\text{cov}(R_{{\text{A}}},\, R_{{\text{B}}})=0.0445,\ \rho _{{\text{AB}}}\ (=\text{cor}(R_{{\text{A}}},\, R_{{\text{B}}}))=0.9539\,,
\sigma(R_{{\text{A}}})=0.22113,\ \sigma(R_{{\text{B}}})=0.21095\,.
Uwaga 2.1

W dwóch przykładach w Wykładzie I mogliśmy tylko policzyć estymatory tych parametrów dla zmiennych stóp zwrotu R_{{\text{X}}},\, R_{{\text{Y}}} oraz R_{{\text{A}}},\, R_{{\text{B}}}; rozkładów tamtych zmiennych nie znaliśmy. Dzięki estymatorom policzonym dla pierwszej pary tamtych zmiennych mogliśmy m. in. dopracować się wykresu podanego na Rysunku 1.2 w Wykładzie I.

Teraz zmienne losowe znamy dokładnie. Postawmy pytanie, jak w przykładzie ,,5 stanów giełdy” wygląda analogiczny do tamtego wykres na płaszczyźnie \mathbb{R}^{2}(\sigma,\, E) ?

\par
Rys. 2.1. Związek między ryzykiem i wartością oczekiwaną w przykładzie ,,5 stanów giełdy”.

(Dla nas na tym wykresie ważny jest tylko zaznaczony łuk hiperboli. Znaczenie odcinka prostej widocznego poniżej łuku hiperboli znane jest tylko studentowi – autorowi wykresu.)

Wprowadzimy teraz cały zestaw oznaczeń ogólnie przyjętych w teorii Markowitza [19, 21, 22] – tzw. Markowitz setup:

  • Ilość spółek notowanych na giełdzie oznaczamy k.

  • Zmienne losowe – stopy zwrotu z notowań tych spółek w ustalonym okresie inwestycyjnym oznaczamy R_{1},\, R_{2},\dots,\, R_{k}. Są to zmienne losowe na tej samej (bliżej nie precyzowanej, por. powyższy długi cytat z pracy Markowitza) przestrzeni probabilistycznej, przyjmujące wartości z [-1,\,+\infty), o których zawsze będziemy zakładać, że ich wartości oczekiwane \mathbb{E}(R_{i}) oraz wariancje \sigma^{2}(R_{i}), i=1,\, 2,\dots,\, k, są wszystkie skończone.

  • Będziemy pisali krótko: \mathbb{E}(R_{i})=\mu _{i}, \sigma(R_{i})=\sigma _{i}, \sigma _{{ij}}=\text{cov}(R_{i},\, R_{j})=\rho _{{ij}}\sigma _{i}\sigma _{j}, gdzie \rho _{{ij}}=\text{cor}(R_{i},\, R_{j}) dla 1\le i\ne j\le k.

  • Wektor wartości oczekiwanych \mu _{i} oznaczamy \mu=[\mu _{i}]_{{i=1}}^{k}, zaś wektor zmiennych losowych R_{i} oznaczamy R=[R_{i}]_{{i=1}}^{k}.

  • Będziemy mówić, że wektorowa zmienna losowa R ma wektorową wartość oczekiwaną \mathbb{E}(R)=\mu. Wektor odchyleń standardowych będziemy (czasem) oznaczać \sigma=[\sigma _{i}]_{{i=1}}^{k}.

  • Wreszcie macierz kowariancji wektorowej zmiennej losowej R=(R_{1},\, R_{2},\dots,\, R_{k})^{{\text{T}}} oznaczamy

    \Sigma=\left[\begin{array}[]{cccc}\sigma _{1}^{{\, 2}}&&&\\
&\sigma _{2}^{{\, 2}}&\sigma _{{ij}}&\\
&\sigma _{{ij}}&\ddots&\\
&&&\sigma _{k}^{{\, 2}}\end{array}\right]=\left[\begin{array}[]{cccc}\sigma _{1}^{{\, 2}}&&&\\
&\sigma _{2}^{{\, 2}}&\rho _{{ij}}\sigma _{i}\sigma _{j}&\\
&\rho _{{ij}}\sigma _{i}\sigma _{j}&\ddots&\\
&&&\sigma _{k}^{{\, 2}}\end{array}\right].
  • Teoria, którą będziemy poznawać na tych wykładach, nie jest (o ile ktoś miałby jeszcze co do tego wątpliwości) oderwana od życia. Oto – dla ilustracji tej tezy – treść ulotki banku ING BSK z roku 2009, reklamującej pewien nowy produkt banku:   ,, Na wysokość wypłaty na koniec programu wpływa wzrost wartości portfela inwestycyjnego. Strategia inwestycyjna została oparta na innowacyjnym modelu matematycznym, który zdobył nagrodę Nobla (Markowitz Efficient Frontier Theory). Jego unikalność polega na tym, że generuje stabilne dochody zarówno na rynkach wzrostowych, jak i spadkowych.”

  • W Wykładzie I (Rysunek 1.1) dowiedzieliśmy się, jak fundusz wielkiego inwestora Warrena Buffetta ,,bije” (w długim i trudnym okresie czasu 2006 - 2010 obejmującym kryzys finansowy lat 2008-9) amerykańską giełdę. W naszym kraju też zdarzają się godne uwagi osiągnięcia na podobnym polu. Dokładniej, w pierwszej połowie roku 2010, w V Mistrzostwach Polski Inwestorów, zwycięzca w kategorii akcje (pan Andrzej Laskowski z Redy) zwiększył wartość swojego portfela aż o 78\%.

Obserwacja.2.1

\Sigma=\mathbb{E}\big((R-\mu)(R-\mu)^{{\text{T}}}\big)\,.

Dowód wynika wprost z wcześniej podanych (i znanych już z wykładu RP 1) definicji.

Przykład 2.1

W przykładzie ,,5 stanów giełdy”, wobec obliczeń zrobionych już wcześniej, wektor \mu i macierz \Sigma to

\mu=\left(\begin{array}[]{c}0.09\\
0.05\end{array}\right),\qquad\Sigma=\left(\begin{array}[]{cc}0.0489&0.0445\\
0.0445&0.0445\end{array}\right).

Przypomnienie. Kryterium Sylvestera, poznane na I roku na wykładach z GALu, wyjaśnia, kiedy macierz \Sigma rzeczywista i symetryczna wymiaru k\times k jest dodatnio określona:

\Sigma>0\Longleftrightarrow\Sigma\begin{pmatrix}1&2&\dots&p\\
1&2&\dots&p\end{pmatrix}>0\ \ \text{dla}\ \  p=1,\, 2,\dots,\, k\,,

gdzie \Sigma\begin{pmatrix}i_{1}&i_{2}&\dots&i_{p}\\
j_{1}&j_{2}&\dots&j_{p}\end{pmatrix} to minor p\times p w macierzy \Sigma używający wierszy o numerach i_{1},\, i_{2},\dots,\, i_{p} oraz kolumn o numerach j_{1},\, j_{2},\dots,\, j_{p} (używamy tu oznaczeń ze zbyt mało w Polsce znanego podręcznika z teorii macierzy i algebry liniowej [6]). Minory \Sigma\begin{pmatrix}1&2&\dots&p\\
1&2&\dots&p\end{pmatrix} w kryterium Sylvestera to minory główne  macierzy \Sigma.

Znane jest też podobne kryterium na temat nieujemnej określoności macierzy, aczkolwiek nie wchodzi ono do standardowego kursu GALu. Mianowicie, dla macierzy \Sigma, kwadratowej k\times k rzeczywistej symetrycznej,

\Sigma\ge 0\Longleftrightarrow\Sigma\begin{pmatrix}i_{1}&i_{2}&\dots&i_{p}\\
i_{1}&i_{2}&\dots&i_{p}\end{pmatrix}\ge 0\ \ \text{dla}\ \  1\le i_{1}<i_{2}<\dots<i_{p}\le k\,,

przy wszystkich p=1,\, 2,\dots,\, k. Minory \Sigma\begin{pmatrix}i_{1}&i_{2}&\dots&i_{p}\\
i_{1}&i_{2}&\dots&i_{p}\end{pmatrix} to minory centralne  macierzy \Sigma.

To nowe kryterium jest w istocie dość szybkim wnioskiem z kryterium Sylvestera – patrz [6], strona 270. Kluczowe miejsce w rozumowaniu, aczkolwiek piękne, jest tam jednak zredagowane niezmiernie lakonicznie. Dla wygody czytelnika, poniżej przytaczamy właściwy fragment wspomnianej strony z [6].

\par
Rys. 2.2. Dowód twierdzenia charakteryzującego macierze symetryczne nieujemnie określone.

(W rozwinięciu \epsilon^{p}+\dots minora centralnego A_{{\epsilon}}\begin{pmatrix}i_{1}&i_{2}&\dots&i_{p}\\
i_{1}&i_{2}&\dots&i_{p}\end{pmatrix} występują wyrazy z nieujemnymi  współczynnikami przy potęgach \epsilon^{{p-1}},\dots,\,\epsilon^{1},\, 1 — dlaczego?)

W tej chwili mamy już język, lecz jest on jeszcze dla nas martwą literą. Jak Markowitz koduje, czy modeluje, swoje portfele? Wskazówki dostarcza już Wykład 1, gdzie co prawda występują tylko dwie spółki, zaś portfele opisywane są punktami x=\left(\begin{array}[]{c}x_{1}\\
x_{2}\end{array}\right) leżącymi na prostej x_{1}+x_{2}=1 w pierwszej ćwiartce (czyli spełniającymi warunki x_{1}\ge 0 i x_{2}\ge 0). Ze swojego kapitału L, inwestor przeznaczał tam x_{1}L na zakup akcji pierwszej spółki (i kupował tych akcji \frac{x_{1}L}{C_{{1,\text{pocz}}}}) oraz x_{2}L na zakup akcji drugiej spółki (których kupował \frac{x_{2}L}{C_{{2,\text{pocz}}}}).

Teraz, gdy dostępne są akcje spółek o numerach 1,\, 2,\dots,\, k, inwestor dzieli swój kapitał L na części

x_{1}L+x_{2}L+\cdots+x_{k}L=L\,,

gdzie oczywiście x_{1},\, x_{2},\dots,\, x_{k}\ge 0 oraz x_{1}+x_{2}+\cdots+x_{k}=1. Następnie, dla i=1,\, 2,\dots,\, k, za kwotę x_{i}L kupuje on akcje spółki numer i.
Możliwe portfele inwestora są więc teraz opisywane punktami

x=\left(\begin{array}[]{c}x_{1}\\
x_{2}\\
\vdots\\
x_{k}\end{array}\right)\in\mathbb{R}^{k}

takimi, że x_{1}+x_{2}\cdots+x_{k}=1 oraz x_{1},\, x_{2},\dots,\, x_{k}\ge 0.

Zbiór wszystkich takich punktów oznaczamy symbolem \Delta^{k}, \Delta^{k}\subset\mathbb{R}^{k}. Jest to tzw. sympleks standardowy  w \mathbb{R}^{k} [w wersji pdf Rysunek 2.3 wypada dopiero na następnej stronie]:

\par
Rys. 2.3. Sympleksy standardowe \Delta^{k} dla k=2,\, 3,\, 4.

W Wykładzie I widzieliśmy, że zainwestowanie własnego kapitału w akcje spółek A i B, opisane (czy zakodowane) portfelem (x_{1},\, x_{2})^{{\text{T}}}\in\Delta^{2} ma stopę zwrotu (lub, krócej: taki portfel ma stopę zwrotu) x_{1}R_{{\text{A}}}+x_{2}R_{{\text{B}}}.2To w dalszym ciągu jest zmienna losowa! Czy analogicznie jest gdy inwestuje się kapitał w akcje k spółek? Tzn czy w dalszym ciągu ma miejsce odpowiedniość

\Delta^{k}\ni x\ \longleftrightarrow\ \text{ zmienna losowa }\  x_{1}R_{1}+x_{2}R_{2}+\cdots+x_{k}R_{k}=x^{{\text{T}}}R (2.1)

wiążąca dany portfel Markowitza ze zmienną losową stojącą po prawej stronie w (2.1) jako jego stopą zwrotu ?

Tak jest w istocie. Jeżeli przez L oznaczymy kapitał inwestora, wtedy x_{i}\cdot L będzie kwotą przeznaczoną przez niego na zakup akcji spółki numer i. Jeśli C_{{i,\,\text{pocz}}} i C_{{i,\,\text{kon}}} oznaczają notowania akcji i-tej spółki odpowiednio na początku i na końcu okresu inwestycyjnego (pamiętamy, że ta druga wielkość jest zmienną losową) oraz \frac{x_{i}\cdot L}{C_{{i,\,\text{pocz}}}} jest ilością nabytych przez inwestora akcji i-tej spółki, wtedy jego portfel x=(x_{1},\dots,\, x_{k})^{{\text{T}}} ma łącznie stopę zwrotu

\displaystyle\frac{\sum _{{i=1}}^{k}C_{{i,\,\text{kon}}}\cdot\frac{x_{i}\cdot L}{C_{{i,\,\text{pocz}}}}-L}{L} \displaystyle=\,\frac{\sum _{{i=1}}^{k}C_{{i,\,\text{kon}}}\cdot\frac{x_{i}\cdot L}{C_{{i,\,\text{pocz}}}}-\sum _{{i=1}}^{k}C_{{i,\,\text{pocz}}}\frac{x_{i}\cdot L}{C_{{i,\,\text{pocz}}}}}{L}\,=\,\sum _{{i=1}}^{k}x_{i}\cdot\frac{C_{{i,\,\text{kon}}}-C_{{i,\,\text{pocz}}}}{C_{{i,\,\text{pocz}}}}
\displaystyle=\,\sum _{{i=1}}^{k}x_{i}R_{i}\,.

To spostrzeżenie motywuje następującą

Definicja 2.1

Dla każdego portfela Markowitza x\in\Delta^{k}

  • (i) Wartością oczekiwaną portfela x, oznaczaną E(x), nazywamy wartość oczekiwaną zmiennej stopy zwrotu przy inwestowaniu w ten portfel, czyli zmiennej losowej stojącej po prawej stronie w (2.1): E(x)=\mathbb{E}(x^{{\text{T}}}R).

  • (ii) Odchyleniem standardowym (względnie wariancją) portfela x, oznaczanym \sigma(x) ( \sigma^{2}(x) ), nazywamy odchylenie standardowe (wariancję) zmiennej losowej x^{{\text{T}}}R: \sigma(x)=\sigma(x^{{\text{T}}}R) ( \sigma^{2}(x)=\sigma^{2}(x^{{\text{T}}}R) ).

Obserwacja.2.2

  • (i) E(x)=x^{{\text{T}}}\mu  dla  x\in\Delta^{k}.

  • (ii) \sigma^{2}(x)=x^{{\text{T}}}\Sigma\, x  dla  x\in\Delta^{k}.

  • (iii) Macierz \Sigma jest nieujemnie określona  i  \sigma(x)=\sqrt{x^{{\text{T}}}\Sigma\, x}  dla  x\in\Delta^{k}.

  • (i) E(x)=\mathbb{E}(x^{{\text{T}}}R)=x^{{\text{T}}}\mathbb{E}(R)=x^{{\text{T}}}\mu,

  • (ii) \sigma^{2}(x)=\sigma^{2}(x^{{\text{T}}}R)=\mathbb{E}(x^{{\text{T}}}R-\mathbb{E}(x^{{\text{T}}}R))^{2}=\mathbb{E}(x^{{\text{T}}}(R-\mu))^{2}\overset{!}{=}\mathbb{E}\Big(x^{{\text{T}}}(R-\mu)\big(x^{{\text{T}}}(R-\mu)\big)^{{\text{T}}}\Big)=\mathbb{E}\Big(x^{{\text{T}}}(R-\mu)(R-\mu)^{{\text{T}}}x\Big)=x^{{\text{T}}}\mathbb{E}\Big((R-\mu)(R-\mu)^{{\text{T}}}\Big)x\overset{\textbf{Obs.\, 2.1}}{=}x^{{\text{T}}}\Sigma\, x.

  • (iii) Dowolnie ustalamy y\in\mathbb{R}^{k} i rozważamy zmienną losową y_{1}R_{1}+y_{2}R_{2}+\cdots+y_{k}R_{k} niezwiązaną ściśle z analizą portfelową. Powtarzając rachunki z dowodu (ii) (w którym nie wykorzystaliśmy założenia x\in\Delta^{k}),

    0\,\le\,\sigma^{2}(y^{{\text{T}}}R)\,=\, y^{{\text{T}}}\Sigma\, y\,,

    zaś wzór na \sigma(x) dla x\in\Delta^{k} wynika z już udowodnionej części (ii).

W teorii Markowitza kluczową rolę odgrywa odwzorowanie Markowitza \mathcal{M}:

\Delta^{k}\ni x\longmapsto\mathcal{M}(x)=\left(\begin{array}[]{c}\sigma(x)\\
E(x)\end{array}\right)=\left(\begin{array}[]{c}\sqrt{x^{{\text{T}}}\Sigma\, x}\\
\mu^{{\text{T}}}x\end{array}\right)\in\mathbb{R}^{2}(\sigma,\, E).

Często używane też jest zmodyfikowane odwzorowanie Markowitza \widetilde{\mathcal{M}}:

\Delta^{k}\ni x\longmapsto\widetilde{\mathcal{M}}(x)=\left(\begin{array}[]{c}\sigma^{2}(x)\\
E(x)\end{array}\right)=\left(\begin{array}[]{c}x^{{\text{T}}}\Sigma\, x\\
\mu^{{\text{T}}}x\end{array}\right)\in\mathbb{R}^{2}(\sigma^{2},\, E).
Uwaga 2.2
  • a) W oryginalnych pracach Markowitza (i tylko Markowitza) kolejność zmiennych jest odwrócona: E jest odkładana na osi odciętych, natomiast \sigma (względnie \sigma^{2}) – na osi rzędnych. Oczywiście sam Markowitz nie nazywał tak tych odwzorowań. Mówił on tylko o `attainable (E,\, V) combinations' – patrz np strona 82 w [19]. Powyższe nazwy i sam symbol \mathcal{M} wprowadził, być może nie jako jedyny na świecie, Krzyżewski w [13].

  • b) W późniejszej części teorii, którą poznaje się na wykładach z analizy portfelowej, odwzorowania \mathcal{M} i \widetilde{\mathcal{M}} będą miały o wiele większą dziedzinę

    H=\{ x=(x_{1},\dots,\, x_{k})^{{\text{T}}}\in\mathbb{R}^{k}\colon x_{1}+\cdots+x_{k}=1\}\,. (2.2)

    Będzie to więc hiperpłaszczyzna afinicznie rozpięta przez sympleks standardowy \Delta^{k} (oczywiście \Delta^{k}\subset H). Okaże się przy tym, że odwzorowania \mathcal{M} i \widetilde{\mathcal{M}} idące z H zachowują swoje wzory definicyjne z podejścia Markowitza! Patrząc na to z innej strony, tylko przez jakiś czas zajmować się będziemy wyłącznie portfelami Markowitza leżącymi w sympleksach standardowych \Delta^{k} i (tym samym) mającymi wszystkie współrzędne nieujemne.

  • c) Obraz \mathcal{M}(\Delta^{k}) będziemy nazywali zbiorem osiągalnym (niektórzy mówią też: zbiór możliwości) w teorii Markowitza. Podobnie, \mathcal{M}(H) będzie zbiorem osiągalnym w tej sygnalizowanej w b) szerszej teorii, która później włączy w siebie teorię Markowitza.

Ćwiczenie 2.1

Uzasadnić, że punkt (1,2,3)^{{\text{T}}}\in\mathbb{R}^{3} i pięć innych punktów powstających z niego przez wszelkie możliwe permutacje współrzędnych, leżą wszystkie na jednej płaszczyźnie (inaczej mówiąc: wymienione punkty są współpłaszczyznowe).

Ćwiczenie 2.2 (nie takie natychmiastowe)

Na płaszczyźnie H\subset\mathbb{R}^{3} zdefiniowanej w (2.2) przy k=3 rozważamy prostą a_{1}x_{1}+a_{2}x_{2}+a_{3}x_{3}=b oraz prostą a_{1}x_{1}+a_{2}x_{2}+a_{3}x_{3}=b^{{\prime}}; nie wszystkie współczynniki a_{i} są sobie równe. Wyznaczyć odległość tych prostych jako podzbiorów przestrzeni \mathbb{R}^{3} wyposażonej w metrykę euklidesową.

Rozwiązanie: 

Ta odległość jest niemniejsza (najczęściej większa) niż odległość

\frac{|b^{{\prime}}-b|}{\sqrt{a_{1}^{{\, 2}}+a_{2}^{{\, 2}}+a_{3}^{{\, 2}}}}

odpowiednich płaszczyzn w \mathbb{R}^{3}.

Jaki wektor wyznacza kierunek obu tych prostych? Oczywiście iloczyn wektorowy

\begin{pmatrix}1\\
1\\
1\end{pmatrix}\times\begin{pmatrix}a_{1}\\
a_{2}\\
a_{3}\end{pmatrix}\,=\,\begin{pmatrix}a_{3}-a_{2}\\
a_{1}-a_{3}\\
a_{2}-a_{1}\end{pmatrix}.

Z kolei, jaki wektor jest równoległy do H i prostopadły do obu tych prostych? Oczywiście

v\,=\,\begin{pmatrix}a_{3}-a_{2}\\
a_{1}-a_{3}\\
a_{2}-a_{1}\end{pmatrix}\times\begin{pmatrix}1\\
1\\
1\end{pmatrix}\,=\,\begin{pmatrix}2a_{1}-a_{2}-a_{3}\\
-a_{1}+2a_{2}-a_{3}\\
-a_{1}-a_{2}+2a_{3}\end{pmatrix}.

Za chwilę przyda się też jego długość ||v||=\sqrt{3}\sqrt{(a_{1}-a_{2})^{2}+(a_{2}-a_{3})^{2}+(a_{3}-a_{1})^{2}}.

Ile tego wektora przenosi pierwszą prostą z zadania na drugą? Taka wielokrotność t\, v,  że  (a_{1}\  a_{2}\  a_{3})\, t\, v=b^{{\prime}}-b, czyli w postaci rozwiniętej

(a_{1}\  a_{2}\  a_{3})\, t\begin{pmatrix}2a_{1}-a_{2}-a_{3}\\
-a_{1}+2a_{2}-a_{3}\\
-a_{1}-a_{2}+2a_{3}\end{pmatrix}\,=\, b^{{\prime}}-b\,.

Stąd po krótkim rachunku

t=\frac{3(b^{{\prime}}-b)}{||v||^{2}}

(długość wektora v jest już wyznaczona wcześniej). Tak więc szukana odległość prostych to

||t\, v||=\frac{3|b^{{\prime}}-b|}{||v||^{2}}||v||\,=\,\frac{3|b^{{\prime}}-b|}{||v||}\,=\,\frac{\sqrt{3}|b^{{\prime}}-b|}{\sqrt{(a_{1}-a_{2})^{2}+(a_{2}-a_{3})^{2}+(a_{3}-a_{1})^{2}}}\,.
Ćwiczenie 2.3

Kiedy odległość prostych z Ćwiczenia 2.2 (wycinanych na H przez płaszczyzny o podanych równaniach) jest równa odległości samych płaszczyzn a_{1}x_{1}+a_{2}x_{2}+a_{3}x_{3}=b  i  a_{1}x_{1}+a_{2}x_{2}+a_{3}x_{3}=b^{{\prime}} ?

Wskazówka: 

Okazuje się, że aby tak było, współczynniki a_{1},\, a_{2},\, a_{3} winny spełniać pewne równanie.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.