Zagadnienia

9. Metoda Hamiltona w optyce geometrycznej

W roku 1828 William Rowan Hamilton opublikował fundamentalną pracę nadającą optyce geometrycznej nowe nieoczekiwane sformułowanie związane z geometrią symplektyczną. Poprzednio bieg promieni świetlnych opisywany był za pomocą równań Eulera, wynikających z wariacyjnej zasady minimalizującej ”długość optyczną” przebywanej drogi. Dopiero 20 lat później zauważył Hamilton, że to samo postępowanie, wykorzystujące tym razem wariacyjną zasadę najmniejszego działania, umożliwia także w mechanice uzyskanie nowego, znacznie bardziej geometrycznego opisu, niż ten, za pomocą równań Eulera - Legendre'a. Postępując za Hamiltonem, omówimy kolejno transformację Legendre'a - kluczowe narzędzie w metodzie Hamiltona. Następnie pokażemy, jak uzyskuje się za jej pomocą nowy opis w optyce geometrycznej. Na koniec wrócimy do mechaniki.

9.1. Transformacja Legendre'a

W całym tym paragrafie dla przestrzeni liniowej X przez X^{*} będziemy oznaczać przestrzeń form liniowych na X. Zaczniemy od sytuacji jednowymiarowej. Niech f:[a,b]\rightarrow\bf{R} będzie dwukrotnie różniczkowalna i niech f^{{\prime\prime}}>0 na [a,b]. Rozważmy przekształcenie

\alpha:[a,b]\ni x\rightarrow f^{{\prime}}(x)=p\in{\bf R}^{*}\simeq{\bf R}.

Ponieważ {f^{{\prime}}} jest ciągła i rosnąca, obrazem [a,b] na mocy własności Darboux jest przedział \big[f^{{\prime}}(a),f^{{\prime}}(b)\big] oraz na \big[f^{{\prime}}(a),f^{{\prime}}(b)\big] jest określone przekształcenie \beta odwrotne do \alpha.

Stwierdzenie 9.1

Istnieje g:\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]\rightarrow{\bf R} taka, że \beta(p)=g^{{\prime}}(p) dla p\ni[f'(a), f'(b)]. Funkcję g nazwiemy transformatą Legendre`a funkcji f i napiszemy g=\widehat{f}.

Stwierdzenie 9.2

Ponieważ funkcja f i g są obecne w naszych rozważaniach jedynie za pośrednictwem swoich pochodnych, obie są wyznaczone z dokładnością do stałej. Wygodnie będzie więc przyjąć umowę, że f(0)=g(0)=0.

Dla (x,p)\ni\big[a,b\big]\times\big[f^{{\prime}}(a),f^{{\prime}}(b)\big] rozważmy funkcję

H(x,p)=xp-f(x) (9.1)

Ustalając p_{0} oznaczmy h_{{p_{0}}}(x)=H(p_{0},x)=xp_{0}-f(x). Wtedy
h^{{\prime}}_{{p_{0}}}(x)=p_{0}-f^{{\prime}}(x) a ponieważ h^{{\prime}}_{{p_{0}}}(b)<0<h^{{\prime}}_{{p_{0}}}(a) oraz h^{{\prime}}_{{p_{0}}} jest malejąca i ciągła, istnieje dokładnie jeden punkt x_{{p_{0}}} taki, że h^{{\prime}}p_{0}=0 tj. że f^{{\prime}}(x_{{p_{0}}})=p_{0} Przekształcenie

\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]\in p\rightarrow x_{p}\ni\big[a,b\big]

jest oczywiście odwrotne do

\big[a,b\big]\in x\rightarrow f^{{\prime}}(x)\in\big[f^{{\prime}}(a),f^{{\prime}}(b)\big],

i jako odwrotne do różniczkowalnego o niezerowej pochodnej, samo jest różniczkowalne.Podamy jego opis analityczny.

Określmy

g(p)=H(x_{p},p)=px_{p}-f(x_{p}) (9.2)

wtedy

g:[f^{{\prime}}(a),f^{{\prime}}(b)]\rightarrow\bf{R}

jest różniczkowalne oraz

g^{{\prime}}(p)=\frac{d}{dp}\big(px_{p}-f(x_{p})\big)=x_{p}+px^{{\prime}}_{p}-f^{{\prime}}(x_{p})\cdot x^{{\prime}}_{p}=x_{p}

bo f^{{\prime}}(x_{p})=p.

Wniosek 9.1

Transformacja Legendre'a jest inwolucją t.j. \widehat{\widehat{f}}=f.

Wyznaczyć transformatę Legendre'a następujących funkcji: \textrm{(a)}f(x)=ax^{2}
\textrm{(b)}f(x)=\frac{x^{\alpha}}{\alpha}

Rozwiązanie: 
\textrm{(a)}H(x,p)=xp-ax^{2}\textrm{zatem}\frac{\partial H}{\partial x}=p-2ax

i wobec tego

\displaystyle{\widehat{f}(p)=H(x_{p},p)=\frac{p}{2a}\cdot p-a\frac{p}{4a^{2}}=\frac{p^{2}}{4a}}
\textrm{(}b)H(x,p)=xp-\frac{x^{\alpha}}{\alpha}\textrm{więc}\frac{\partial H}{\partial x}=p-x^{{\alpha-1}}\textrm{zatem}x_{p}=\displaystyle{p^{{\frac{1}{\alpha-1}}}}

wobec tego

\widehat{f}(p)=H(x_{p},p)=\displaystyle{p^{\frac{1}{\alpha-1}}\cdot p-\frac{p^{\frac{\alpha}{\alpha-1}}}{\alpha}=\Big(1-\frac{1}{\alpha}\Big)\cdot p^{{\frac{\alpha}{\alpha-1}}}=\frac{p^{\beta}}{\beta}}

gdzie \displaystyle{\frac{1}{\alpha}+\frac{1}{\beta}}=1.

Stwierdzenie 9.3

(Nierówność Younga ). Niech g=\widehat{f} wtedy

px\leq f(x)+g(p) (9.3)

Dla każdego p punkt x_{p} jest punktem maksimum funkcji h_{p}(x)=xp-f(x), t.j.

g(p)=px_{p}-f(x_{p})\geq px-f(x),

skąd wynika (9.3).

Sytuacja n-wymiarowa.

W następującym tekście przyjmiemy konwencję, że wartość różniczki funkcji f w punkcie x na wektorze \zeta jest zapisywana jako d_{x}f(\zeta). Niech f bedzie określona i ma ciągłe pochodne do rzędu 2 na otwartym zbiorze \Omega\subset{\bf R}^{n}. Niech ponadto d_{x}^{2}f>0 dla x\in\Omega. Przyjmujemy tutaj podejście wiążące kolejne różniczki ze wzorem Taylora i traktujące d_{n}f jako odwzorowanie n- liniowe tam występujące. W szczególności

d_{x}^{2}f=\Big(\frac{\partial _{2}f}{\partial x_{j},\partial x_{i}}(x)\Big)_{{i,j}}^{n} (9.4)

oznacza wtedy macierz formy kwadratowej a napis d_{x}^{2}f>0 oznacza, że forma ta jest dodatnio określona. Rozważmy przekształcenie: \Omega\rightarrow d_{x}f\in\Big({\bf R}^{n}\Big)^{*}.

Stwierdzenie 9.4

Jeżeli \Omega jest otwarty a f jest klasy C^{2} oraz d_{x}^{2}f>0 dla x\in\Omega, to także zbiór \Lambda=\big\{ d_{x}f:x\in\Omega\big\} jest otwarty.

Różniczka d_{x}^{2}f może być także interpretowana jako pierwsza różniczka w punkcie x odwzorowania \alpha:\Omega\in x\rightarrow d_{x}f\in\big({\bf R}^{n}\big)^{*} Ponieważ warunek d_{x}^{2}f>0 implikuje, że macierz d_{x}^{2}f jest nieosobliwa, odwzorowanie \alpha jest otwarte i w szczególności \Lambda jest zbiorem otwartym.

Stwierdzenie 9.5

Przy założeniach i notacji Stwierdzenia 9.4. przekształcenie \alpha:\Omega\rightarrow\Lambda jest różnowartościowe. Przekształcenie do niego odwrotne jest podobnej postaci t.j. przy kanonicznym utożsamieniu {\bf R}^{n} z \big({\bf R}^{n}\big)^{{**}} i traktowaniu \Omega jako podzbioru \big(\bf{R}^{n}\big)^{{**}}, istnieje funkcja g:\Lambda\rightarrow\bf{R} taka, że \beta(p)\simeq\alpha^{{-1}}(p)=d_{p}g.

Funkcję g nazywamy transformatą Legendre'a funkcji f.

Pokażemy najpierw, że funkcja \alpha jest różnowartościowa. Niech x_{1},x_{2}\in\Omega i niech \Psi(t)=\alpha\big(x_{1}+t(x_{2}-x_{1})\big). Wtedy \Psi^{{{}^{{\prime\prime}}}}(t) jest równa wartości formy kwadratowej \displaystyle{d_{{\big(x_{1}+t(x_{2}-x_{1})\big)}}^{2}f} na argumencie (x_{2}-x_{1}) a zatem jest dodatnia. Oznacza to, że funkcja \Psi^{{\prime}}(t) jest rosnąca. Ale \Psi^{{\prime}}(0)=d_{{x_{1}}}f(x_{2}-x_{1}) natomiast \Psi^{{\prime}}(t)=d_{{x_{2}}}f(x_{2}-x_{1}) a ponieważ \Psi^{{\prime}}(0)\neq\Psi^{{\prime}}(1) zatem d_{{x_{1}}}f\neq d_{{x_{2}}}f.

Pokażemy następnie, że istnieje g:\Lambda\rightarrow\bf{R} klasy C^{2} taka, że d_{p}^{2}>0 oraz, że \alpha^{{-1}}(p)=d_{p}g.
Rozumowanie przebiega podobnie, jak w dowodzie Stwierdzenia 9.4.
Dla (x,p)\in\Omega x \Lambda rozważamy funkcję

H(x,p)=<x,p>-f(x)

gdzie <x,p> oznacza wartość formy liniowej p\in\big({\bf R}^{n}\big)^{*} na wektorze x\in{\bf R}^{n}. W części pierwszej tego dowodu pokazaliśmy, że dla każdego p\in\Lambda istnieje dokładnie jeden x_{p}\in\Omega taki, że d_{{x_{p}}}f=p. Określmy

g(p)=H(x_{p},p)=<x_{p},p>-f(x_{p})

wtedy odworowanie \beta:p\rightarrow x_{p} jako odwrotne do \alpha:x\rightarrow d_{x}f=p ma wszędzie różniczkę nieosobliwą na mocy twierdzenia o funkcji odwrotnej. Pisząc g(p)=\langle\beta(p),p\rangle-f\circ\beta(p) i uwzględniając, że d_{{\beta _{(}p)}}f=d_{{x_{p}}}f=p mamy wtedy

d_{p}g(\zeta)=\langle d_{p}\beta(\zeta),p\rangle+\langle\beta(p),\zeta\rangle-d_{{\beta _{(}p)}}\circ d_{p}\beta(\zeta)=
=\langle d_{p}\beta(\zeta),p\rangle+\langle x_{p}\zeta\rangle-\langle p,d_{p}\beta(\zeta)\rangle=\langle x_{p},\zeta\rangle

co należało wykazać. Pokażemy wreszcie, że d_{p}^{2}g>0.

Traktując d_{p}^{2}g jako różniczkę odwzorowania p\rightarrow d_{p}g odwrotnego do x\rightarrow d_{x}f, którego różniczką jest d_{x}^{2}f widzimy, że teza wynika z obserwacji, że dla macierzy symetrycznej i dodatnio określonej, macierz odwrotna jest także symetryczna i dodatnio określona.

Ćwiczenie 9.1

Wyznaczyć transformatę Legendre'a funkcji:

F(x_{1},...x_{n})=\displaystyle{\sum _{{i=1}}^{{n}}a_{i}\cdot x_{i}^{2}a_{i}>0}

wtedy

H(x_{1},...x_{n},p_{1},...p_{n})=\displaystyle{\sum _{{i=1}}^{n}x_{i}p_{i}-\sum _{{i=1}}^{n}a_{i}\cdot x_{i}^{2}}
\frac{\partial H}{\partial x_{i}}=p_{i}-2a_{i}x_{i}\textrm{zatem}x_{{p_{i}}}=\frac{p_{i}}{2a_{i}}

i otrzymujemy

\widehat{F}(p_{1},...p_{n})=\displaystyle{\sum _{{i=1}}^{{n}}\frac{p_{i}^{2}}{2a_{i}}-\sum _{{i=1}}^{{n}}a_{i}\cdot\frac{p_{i}^{2}}{4a_{i}^{2}}=\sum _{{i=1}}^{{n}}\frac{p_{i}^{2}}{4a_{i}}}

9.2. Optyka geometryczna.

Optyka geometryczna nie wnika w fizyczną naturę światła lecz przyjmuje jako aksjomat, że droga promienia światlnego jest taką krzywą, która minimalizuje tzw. długość optyczną. Ta zasada wariacyjna, której precyzyjne sformułowanie podamy w dalszej części wykładu, ma związek z zasadą Fermata, mówiącą, że światło biegnąc od punktu do punktu wybiera drogę o najkrótszym czasie przejścia. Schemat przyjęty w optyce geometrycznej przedstawia się następująco:

Brak opisu

Rozważmy ”oś optyczną” \overrightarrow{0z}, którą wyobrazimy sobie jako prostą poziomą, leżącą w płaszczyźnie rysunku. Prostopadle do niej umieścimy dwie płaszczyzny A i B. Są one równoległe do dwóch pozostałych osi kartezjańskiego układu prostokątnego: poziomej osi \overrightarrow{0x_{1}} i pionowej osi \overrightarrow{0x_{2}}.

Przestrzeń między tymi płaszczyznami nazwiemy systemem optycznym. Jest ona scharakteryzowana za pomocą funkcji n(x_{1},x_{2},z) - ”gęstości optycznej środowiska”, przez które przebiega promień świetlny. Będziemy dalej zakładać, że tory promieni świetlnych są krzywymi rzutującymi się dyfeomorficznie na oś optyczną t.j, że dopuszczają opis \gamma(z)=\big(x_{1}(z),x_{2}(z),z\big). Gęstość optyczna kształtuje tor następującą zasadą Fermata: promień świetlny opuszczający płaszczyznę A w punkcie \big(x_{1}(z_{0}),x_{2}(z_{0})\big) i w kierunku wyznaczonym przez \big(\dot{x}_{1}(z_{0}),\dot{x}_{2}(z_{0})\big) a następnie docierający do płaszczyzny B z analogicznymi współrzędnymi \big(x_{1}(z_{1}),x_{2}(z_{2}),\dot{x}_{1}(z_{1}),\dot{x}_{2}(z_{1})\big) robi to tak, że minimalizuje ”długość optyczną”

\mathcal{L}(\gamma)=\int _{{z_{0}}}^{{z_{1}}}n(x_{1},x_{2},z)ds=\int _{{z_{0}}}^{{z_{1}}}n(x_{1},x_{2},z)\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}\  dz (9.5)

gdzie \dot{x}_{1} oznacza \displaystyle{\frac{dx_{1}}{dz}(z)} a \dot{x}_{2} oznacza \displaystyle{\frac{dx_{2}}{dz}(z)} Mamy zatem zagadnienie wariacyjne z funkcją Lagrange'a

L(x_{1},x_{2},\dot{x}_{1},\dot{x}_{2},z)=n(x_{1},x_{2},z)\cdot\ \sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}} (9.6)

Wynik Hamiltona mówi, że po właściwej zmianie współrzędnych krzywe całkowe równań Eulera dla (9.5) są krzywymi całkowym ”gradientu symplektycznego”' funkcji \widehat{L}. Omówimy kolejno dokonywaną zamianę współrzędnych, której istotą jest transformata Legendre'a oraz wyprowadzimy równania Hamiltona, odkładając geometryczną interpretację tej sytuacji do następnego wykładu.

9.3. Legendre'owska zamiana współrzędnych.

Lemat 9.1

Dla ustalonych z,x_{1},x_{2} funkcja (9.6) spełnia względem zmiennych \dot{x}_{1},\dot{x}_{2} warunek:

\displaystyle{d^{2}_{{(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})}}L(\triangle\dot{x}_{1},\triangle\dot{x}_{2})}>0.

Istotnie, otrzymujemy ( dla zwięzłości będziemy pisać n zamiast n(x_{1},x_{2},z)

\frac{\partial L}{\partial\dot{x}_{1}}=\displaystyle{\frac{n\dot{x}_{1}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}};\displaystyle\frac{\partial L}{\partial\dot{x}_{2}}=\displaystyle{\frac{n\dot{x}_{2}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}}
\frac{\partial^{2}L}{\partial\dot{x}_{1}^{2}}=n\cdot\big(1+\dot{x}_{2}^{2}\big)\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}};\frac{\partial^{2}L}{\partial\dot{x}_{2}^{2}}=n\cdot\big(1+\dot{x}_{1}^{2}\big)\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}
\frac{\partial^{2}L}{\partial\dot{x}_{2}\partial\dot{x}_{1}}=-n\dot{x}_{1}\dot{x}_{2}\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}

zatem druga różniczka L jest formą kwadratową o postaci:

d^{2}_{{(z,x.y,\dot{x},\dot{y})}}\big(\triangle\dot{x}_{1},\triangle\dot{x}_{2}\big)=n\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}\big[(1+\dot{x}_{2}^{2})(\triangle\dot{x}_{1})^{2}-2\dot{x}_{1}\dot{x}_{2}\triangle\dot{x}_{1}\triangle\dot{x}_{2}+(1+\dot{x}_{1}^{2})(\triangle\dot{x}_{2})^{2}\big]

ale dla

(\dot{x}_{1},\dot{x}_{2})\neq(0,0)

mamy

n\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}\big[\big(\dot{x}_{2}\triangle\dot{x}_{1}-\dot{x}_{1}\triangle\dot{x}_{2}\big)^{2}+\triangle\dot{x}_{1}^{2}+\triangle\dot{x}_{2}^{2}\big]>0.

Na mocy Lematu 9.1, ustalając zmienne z,x_{1},x_{2}, możemy stosować Stwierdzenie 9.1 do funkcji:

\displaystyle{f_{{(z,x_{1},x_{2})}}}(\dot{x}_{1},\dot{x}_{2})=L(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})

określając odwzorowanie

\alpha _{{(z,x_{1},x_{2})}}:(\dot{x}_{1},\dot{x}_{2})\rightarrow\Big(\frac{\partial L}{\partial\dot{x}_{1}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})\frac{\partial L}{\partial\dot{x}_{2}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})\Big)=(p_{1},p_{2}) (9.7)

i odwzorowanie odwrotne

\beta _{{(z,x_{1},x_{2})}}:(p_{1},p_{2})\rightarrow\Big(\frac{\partial\widehat{f}_{{(z,x_{1},x_{2},p_{1},p_{2})}}}{\partial{p}_{1}},\frac{\partial\widehat{f}_{{(z,x_{1},x_{2},p_{1},p_{2})}}}{\partial{p}_{2}}\Big)=(\dot{x}_{1},\dot{x}_{2}) (9.8)

W dalszym ciągu, dla oszczędności miejsca, będziemy zapisywać

(p_{1},p_{2})=\big(\frac{\partial L}{\partial\dot{x}_{1}},\frac{\partial L}{\partial\dot{x}_{2}}\big)\textrm{oraz}\ (\dot{x}_{1},\dot{x}_{2})=\big(\frac{\partial\widehat{L}}{\partial\dot{p}_{1}},\frac{\partial\widehat{L}}{\partial\dot{p}_{2}}\big)

9.4. Wyprowadzenie równań Hamiltona

Napiszmy układ równań Eulera dla funkcjonału (9.5)

\frac{\partial L}{\partial x_{i}}-\frac{d}{dz}\ \frac{\partial L}{\partial\dot{x}_{i}}=0i=1,2 (9.9)

i zastąpmy w nim \displaystyle{\frac{\partial L}{\partial\dot{x_{i}}}} przez nową zmienną p_{i} (zgodnie z 9.7). Oznaczając \displaystyle{\frac{dp_{i}}{dz}} przez \dot{p}_{i} i=1,2 możemy zapisać wtedy (9.9) w postaci:

\dot{p}_{i}=\frac{\partial L}{\partial x_{i}}i=1,2. (9.10)

Otrzymujemy w ten sposób pierwsze dwa równania. Ponieważ \displaystyle{\frac{\partial L}{\partial x_{i}}} zależą od x_{1},x_{2},\dot{x}_{1},\dot{x}_{2}, chcąc zastąpić \dot{x}_{1},\dot{x}_{2} przez p_{1},p_{2} możemy skorzystać z odwrotnej transformacji Legendre'a (9.8) dodając do (9.10) warunki

\dot{x}_{i}=\frac{\partial\widehat{L}_{{(z,x_{1},x_{2})}}}{\partial\dot{p}_{i}}. (9.11)

To, że układ warunków (9.10) i (9.11) daje układ czterech równań określających funkcje x_{i}(z) i p_{i}(z) wynika z następującego lematu.

Lemat 9.2

Niech dla ustalonych z,x_{1},x_{2} funkcja \widehat{L}(z,x_{1},x_{2},p_{1},p_{2}) oznacza transformatę Legendre'a funkcji f_{{(z,x_{1},x_{2})}}(\dot{x}_{1},\dot{x}_{2}).

Wtedy

\frac{dL}{dx_{i}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})=-\frac{d\widehat{L}}{dx_{i}}(z,x_{1},x_{2},p_{1},p_{2}) (9.12)

Funkcje L oraz \widehat{L} związane są warunkiem

\widehat{L}(z,x_{1},x_{2},{p}_{1},{p}_{2})=p_{1}\dot{x}_{1}+p_{2}\dot{x}_{2}-L(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2}). (9.13)

gdzie (p_{1},p_{2})=\alpha(\dot{x}_{1},\dot{x}_{2}) przy ustalonych (z,x_{1},x_{2}).

Obliczając \frac{\partial}{\partial x_{i}} dla lewej strony (9.13) otrzymamy

\frac{\partial\widehat{L}}{\partial x_{i}}+\frac{\partial\widehat{L}}{\partial p_{i}}\ \frac{\partial p_{1}}{\partial x_{i}}+\frac{\partial\widehat{L}}{\partial p_{2}}\ \frac{\partial p_{2}}{\partial x_{i}}i=1,2.

Dla prawej strony 9.13 otrzymamy wyrażenie

\frac{\partial p_{1}}{\partial x_{i}}\dot{x}_{i}+\frac{\partial p_{2}}{\partial x_{i}}\dot{x}_{2}-\frac{\partial L}{\partial x_{i}}i=1,2.

Ale

\displaystyle{\frac{\partial\widehat{L}}{\partial p_{j}}}\cdot\displaystyle{\frac{\partial p_{j}}{\partial x_{i}}}=\dot{x}_{j}\cdot\displaystyle{\frac{\partial p_{j}}{\partial x_{i}}}i,j=1,2

skąd wynika (9.12).

Na mocy lematu (9.4.) możemy więc przekształcić równanie (9.10), otrzymując ostateczny układ równań Hamiltona

\qquad{\displaystyle{\dot{p}_{i}=-\frac{\partial\widehat{L}}{\partial x_{i}}}i=1,2\atop\displaystyle{\dot{x}_{i}=\frac{\partial\widehat{L}}{\partial p_{i}}i=1,2}.} (9.14)

Wobec tego trudność przejścia od opisu wariacyjnego z funkcją Lagrange'a L do opisu (9.14) polega na znalezieniu transformaty Legendre'a \widehat{L} funkcji L. Oczywiście cała procedura opiera się na założeniu, że przy ustalonych z,x_{1},x_{2} funkcja L jest funkcją wypukłą ze względu na zmienne \dot{x}_{1} i \dot{x}_{2}.

Pokażemy teraz, jak wygląda \widehat{L} dla funkcji Lagrange'a

L\big(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2}\big)=n(z,x_{1},x_{2})\cdot\sqrt{1++\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}

W dalszym ciągu, dla zwięzłości, będziemy pisać n zamiast n(z,x_{1},x_{2}). Wtedy (por. dowód lematu 9.1)

p_{i}=\frac{\partial L}{\partial\dot{x}_{i}}=\frac{n\dot{x}_{i}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}i=1,2

skąd

\dot{x}_{i}=\frac{p_{i}}{n}\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}

Zauważmy, że zachodzi tożsamość

n^{2}-p_{1}^{2}-p_{2}^{2}=\frac{{n}^{2}}{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}

a więc

\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}=\frac{n}{\sqrt{n^{2}-p_{1}^{2}-p_{2}^{2}}}

i ostatecznie

\widehat{L}(p_{1},p_{2})=p_{1}\dot{x}_{1}+p_{2}\dot{x}_{2}-L(\dot{x}_{1},\dot{x}_{2})=\frac{p_{1}^{2}+p_{2}^{2}}{\sqrt{n^{2}-p_{1}^{2}-p_{2}^{2}}}-n\sqrt{1+\frac{p_{1}^{2}+p_{2}^{2}}{n^{2}-p_{1}^{2}-p_{2}^{2}}}=
=-\sqrt{n^{2}-p_{1}^{2}-p_{2}^{2}}

Podsumowując:

Stwierdzenie 9.6

Krzywe przebiegu promieni świetlnych

z\rightarrow\big(x_{1}(z),x_{2}(z),\dot{x}(z),\dot{x}_{2}(z)\big)

opisane przez zasadę wariacyjną 9.5 z funkcją Lagrange'a

L(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})=n(z,x_{1},x_{2})\sqrt{1++\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}

po zamianie zmiennych

(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})\rightarrow(z,x_{1},x_{2},p_{1},p_{2})

gdzie

p_{i}=\frac{\partial L}{\partial\dot{x}_{i}}=\frac{n(z,x_{1},x_{2})\cdot\dot{x}_{i}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}

przechodzą na krzywe całkowe układu 9.14, gdzie

\widehat{L}(z,x_{1},x_{2},p_{1},p_{2})=-\sqrt{n(z,x_{1},x_{2})-p_{1}^{2}-p_{2}^{2}}.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.