Zagadnienia

9.1 Transformacja Legendre'a
9.2 Optyka geometryczna.
9.3 Legendre'owska zamiana współrzędnych.
9.4 Wyprowadzenie równań Hamiltona

9. Metoda Hamiltona w optyce geometrycznej

W roku 1828 William Rowan Hamilton opublikował fundamentalną pracę nadającą optyce geometrycznej nowe nieoczekiwane sformułowanie związane z geometrią symplektyczną. Poprzednio bieg promieni świetlnych opisywany był za pomocą równań Eulera, wynikających z wariacyjnej zasady minimalizującej ”długość optyczną” przebywanej drogi. Dopiero 20 lat później zauważył Hamilton, że to samo postępowanie, wykorzystujące tym razem wariacyjną zasadę najmniejszego działania, umożliwia także w mechanice uzyskanie nowego, znacznie bardziej geometrycznego opisu, niż ten, za pomocą równań Eulera - Legendre'a. Postępując za Hamiltonem, omówimy kolejno transformację Legendre'a - kluczowe narzędzie w metodzie Hamiltona. Następnie pokażemy, jak uzyskuje się za jej pomocą nowy opis w optyce geometrycznej. Na koniec wrócimy do mechaniki.

9.1. Transformacja Legendre'a

W całym tym paragrafie dla przestrzeni liniowej $X$ przez $X^{*}$ będziemy oznaczać przestrzeń form liniowych na $X.$ Zaczniemy od sytuacji jednowymiarowej. Niech $f:[a,b]\rightarrow\bf{R}$ będzie dwukrotnie różniczkowalna i niech $f^{{\prime\prime}}>0$ na $[a,b].$ Rozważmy przekształcenie

$\alpha:[a,b]\ni x\rightarrow f^{{\prime}}(x)=p\in{\bf R}^{*}\simeq{\bf R}.$

Ponieważ ${f^{{\prime}}}$ jest ciągła i rosnąca, obrazem $[a,b]$ na mocy własności Darboux jest przedział $\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]$ oraz na $\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]$ jest określone przekształcenie $\beta$ odwrotne do $\alpha.$

Stwierdzenie 9.1

Istnieje $g:\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]\rightarrow{\bf R}$ taka, że $\beta(p)=g^{{\prime}}(p)$ dla $p\ni$ [f'(a), f'(b)]. Funkcję $g$ nazwiemy transformatą Legendre`a funkcji $f$ i napiszemy $g=\widehat{f}$ .

Stwierdzenie 9.2

Ponieważ funkcja $f$ i $g$ są obecne w naszych rozważaniach jedynie za pośrednictwem swoich pochodnych, obie są wyznaczone z dokładnością do stałej. Wygodnie będzie więc przyjąć umowę, że $f(0)=g(0)=0.$

Dla $(x,p)\ni\big[a,b\big]\times\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]$ rozważmy funkcję

$H(x,p)=xp-f(x)$

(9.1)

Ustalając $p_{0}$ oznaczmy $h_{{p_{0}}}(x)=H(p_{0},x)=xp_{0}-f(x).$ Wtedy
$h^{{\prime}}_{{p_{0}}}(x)=p_{0}-f^{{\prime}}(x)$ a ponieważ $h^{{\prime}}_{{p_{0}}}(b)<0<h^{{\prime}}_{{p_{0}}}(a)$ oraz $h^{{\prime}}_{{p_{0}}}$ jest malejąca i ciągła, istnieje dokładnie jeden punkt $x_{{p_{0}}}$ taki, że $h^{{\prime}}p_{0}=0$ tj. że $f^{{\prime}}(x_{{p_{0}}})=p_{0}$ Przekształcenie

$\big[f^{{\prime}}(a),f^{{\prime}}(b)\big]\in p\rightarrow x_{p}\ni\big[a,b\big]$

jest oczywiście odwrotne do

$\big[a,b\big]\in x\rightarrow f^{{\prime}}(x)\in\big[f^{{\prime}}(a),f^{{\prime}}(b)\big],$

i jako odwrotne do różniczkowalnego o niezerowej pochodnej, samo jest różniczkowalne.Podamy jego opis analityczny.

Określmy

$g(p)=H(x_{p},p)=px_{p}-f(x_{p})$

(9.2)

wtedy

$g:[f^{{\prime}}(a),f^{{\prime}}(b)]\rightarrow\bf{R}$

jest różniczkowalne oraz

$g^{{\prime}}(p)=\frac{d}{dp}\big(px_{p}-f(x_{p})\big)=x_{p}+px^{{\prime}}_{p}-f^{{\prime}}(x_{p})\cdot x^{{\prime}}_{p}=x_{p}$

bo $f^{{\prime}}(x_{p})=p.$

∎

Wniosek 9.1

Transformacja Legendre'a jest inwolucją t.j. $\widehat{\widehat{f}}=f.$

Wyznaczyć transformatę Legendre'a następujących funkcji: $\textrm{(a)}f(x)=ax^{2}$
$\textrm{(b)}f(x)=\frac{x^{\alpha}}{\alpha}$

Rozwiązanie:

$\textrm{(a)}H(x,p)=xp-ax^{2}\textrm{zatem}\frac{\partial H}{\partial x}=p-2ax$

i wobec tego

$\displaystyle{\widehat{f}(p)=H(x_{p},p)=\frac{p}{2a}\cdot p-a\frac{p}{4a^{2}}=\frac{p^{2}}{4a}}$

$\textrm{(}b)H(x,p)=xp-\frac{x^{\alpha}}{\alpha}\textrm{więc}\frac{\partial H}{\partial x}=p-x^{{\alpha-1}}\textrm{zatem}x_{p}=\displaystyle{p^{{\frac{1}{\alpha-1}}}}$

wobec tego

$\widehat{f}(p)=H(x_{p},p)=\displaystyle{p^{\frac{1}{\alpha-1}}\cdot p-\frac{p^{\frac{\alpha}{\alpha-1}}}{\alpha}=\Big(1-\frac{1}{\alpha}\Big)\cdot p^{{\frac{\alpha}{\alpha-1}}}=\frac{p^{\beta}}{\beta}}$

gdzie $\displaystyle{\frac{1}{\alpha}+\frac{1}{\beta}}=1.$

Stwierdzenie 9.3

(Nierówność Younga ). Niech $g=\widehat{f}$ wtedy

$px\leq f(x)+g(p)$

(9.3)

Dla każdego $p$ punkt $x_{p}$ jest punktem maksimum funkcji $h_{p}(x)=xp-f(x),$ t.j.

$g(p)=px_{p}-f(x_{p})\geq px-f(x),$

skąd wynika (9.3).

∎

Sytuacja n-wymiarowa.

W następującym tekście przyjmiemy konwencję, że wartość różniczki funkcji $f$ w punkcie $x$ na wektorze $\zeta$ jest zapisywana jako $d_{x}f(\zeta).$ Niech $f$ bedzie określona i ma ciągłe pochodne do rzędu 2 na otwartym zbiorze $\Omega\subset{\bf R}^{n}.$ Niech ponadto $d_{x}^{2}f>0$ dla $x\in\Omega.$ Przyjmujemy tutaj podejście wiążące kolejne różniczki ze wzorem Taylora i traktujące $d_{n}f$ jako odwzorowanie n- liniowe tam występujące. W szczególności

$d_{x}^{2}f=\Big(\frac{\partial _{2}f}{\partial x_{j},\partial x_{i}}(x)\Big)_{{i,j}}^{n}$

(9.4)

oznacza wtedy macierz formy kwadratowej a napis $d_{x}^{2}f>0$ oznacza, że forma ta jest dodatnio określona. Rozważmy przekształcenie: $\Omega\rightarrow d_{x}f\in\Big({\bf R}^{n}\Big)^{*}.$

Stwierdzenie 9.4

Jeżeli $\Omega$ jest otwarty a $f$ jest klasy $C^{2}$ oraz $d_{x}^{2}f>0$ dla $x\in\Omega,$ to także zbiór $\Lambda=\big\{ d_{x}f:x\in\Omega\big\}$ jest otwarty.

Różniczka $d_{x}^{2}f$ może być także interpretowana jako pierwsza różniczka w punkcie $x$ odwzorowania $\alpha:\Omega\in x\rightarrow d_{x}f\in\big({\bf R}^{n}\big)^{*}$ Ponieważ warunek $d_{x}^{2}f>0$ implikuje, że macierz $d_{x}^{2}f$ jest nieosobliwa, odwzorowanie $\alpha$ jest otwarte i w szczególności $\Lambda$ jest zbiorem otwartym.

∎

Stwierdzenie 9.5

Przy założeniach i notacji Stwierdzenia 9.4. przekształcenie $\alpha:\Omega\rightarrow\Lambda$ jest różnowartościowe. Przekształcenie do niego odwrotne jest podobnej postaci t.j. przy kanonicznym utożsamieniu ${\bf R}^{n}$ z $\big({\bf R}^{n}\big)^{{**}}$ i traktowaniu $\Omega$ jako podzbioru $\big(\bf{R}^{n}\big)^{{**}},$ istnieje funkcja $g:\Lambda\rightarrow\bf{R}$ taka, że $\beta(p)\simeq\alpha^{{-1}}(p)=d_{p}g.$

Funkcję $g$ nazywamy transformatą Legendre'a funkcji $f.$

Pokażemy najpierw, że funkcja $\alpha$ jest różnowartościowa. Niech $x_{1},x_{2}\in\Omega$ i niech $\Psi(t)=\alpha\big(x_{1}+t(x_{2}-x_{1})\big).$ Wtedy $\Psi^{{{}^{{\prime\prime}}}}(t)$ jest równa wartości formy kwadratowej $\displaystyle{d_{{\big(x_{1}+t(x_{2}-x_{1})\big)}}^{2}f}$ na argumencie $(x_{2}-x_{1})$ a zatem jest dodatnia. Oznacza to, że funkcja $\Psi^{{\prime}}(t)$ jest rosnąca. Ale $\Psi^{{\prime}}(0)=d_{{x_{1}}}f(x_{2}-x_{1})$ natomiast $\Psi^{{\prime}}(t)=d_{{x_{2}}}f(x_{2}-x_{1})$ a ponieważ $\Psi^{{\prime}}(0)\neq\Psi^{{\prime}}(1)$ zatem $d_{{x_{1}}}f\neq d_{{x_{2}}}f.$

Pokażemy następnie, że istnieje $g:\Lambda\rightarrow\bf{R}$ klasy $C^{2}$ taka, że $d_{p}^{2}>0$ oraz, że $\alpha^{{-1}}(p)=d_{p}g.$
Rozumowanie przebiega podobnie, jak w dowodzie Stwierdzenia 9.4.
Dla $(x,p)\in\Omega$ x $\Lambda$ rozważamy funkcję

$H(x,p)=<x,p>-f(x)$

gdzie $<x,p>$ oznacza wartość formy liniowej $p\in\big({\bf R}^{n}\big)^{*}$ na wektorze $x\in{\bf R}^{n}.$ W części pierwszej tego dowodu pokazaliśmy, że dla każdego $p\in\Lambda$ istnieje dokładnie jeden $x_{p}\in\Omega$ taki, że $d_{{x_{p}}}f=p.$ Określmy

$g(p)=H(x_{p},p)=<x_{p},p>-f(x_{p})$

wtedy odworowanie $\beta:p\rightarrow x_{p}$ jako odwrotne do $\alpha:x\rightarrow d_{x}f=p$ ma wszędzie różniczkę nieosobliwą na mocy twierdzenia o funkcji odwrotnej. Pisząc $g(p)=\langle\beta(p),p\rangle-f\circ\beta(p)$ i uwzględniając, że $d_{{\beta _{(}p)}}f=d_{{x_{p}}}f=p$ mamy wtedy

$d_{p}g(\zeta)=\langle d_{p}\beta(\zeta),p\rangle+\langle\beta(p),\zeta\rangle-d_{{\beta _{(}p)}}\circ d_{p}\beta(\zeta)=$

$=\langle d_{p}\beta(\zeta),p\rangle+\langle x_{p}\zeta\rangle-\langle p,d_{p}\beta(\zeta)\rangle=\langle x_{p},\zeta\rangle$

co należało wykazać. Pokażemy wreszcie, że $d_{p}^{2}g>0.$

Traktując $d_{p}^{2}g$ jako różniczkę odwzorowania $p\rightarrow d_{p}g$ odwrotnego do $x\rightarrow d_{x}f,$ którego różniczką jest $d_{x}^{2}f$ widzimy, że teza wynika z obserwacji, że dla macierzy symetrycznej i dodatnio określonej, macierz odwrotna jest także symetryczna i dodatnio określona.

∎

Ćwiczenie 9.1

Wyznaczyć transformatę Legendre'a funkcji:

$F(x_{1},...x_{n})=\displaystyle{\sum _{{i=1}}^{{n}}a_{i}\cdot x_{i}^{2}a_{i}>0}$

wtedy

$H(x_{1},...x_{n},p_{1},...p_{n})=\displaystyle{\sum _{{i=1}}^{n}x_{i}p_{i}-\sum _{{i=1}}^{n}a_{i}\cdot x_{i}^{2}}$

$\frac{\partial H}{\partial x_{i}}=p_{i}-2a_{i}x_{i}\textrm{zatem}x_{{p_{i}}}=\frac{p_{i}}{2a_{i}}$

i otrzymujemy

$\widehat{F}(p_{1},...p_{n})=\displaystyle{\sum _{{i=1}}^{{n}}\frac{p_{i}^{2}}{2a_{i}}-\sum _{{i=1}}^{{n}}a_{i}\cdot\frac{p_{i}^{2}}{4a_{i}^{2}}=\sum _{{i=1}}^{{n}}\frac{p_{i}^{2}}{4a_{i}}}$

9.2. Optyka geometryczna.

Optyka geometryczna nie wnika w fizyczną naturę światła lecz przyjmuje jako aksjomat, że droga promienia światlnego jest taką krzywą, która minimalizuje tzw. długość optyczną. Ta zasada wariacyjna, której precyzyjne sformułowanie podamy w dalszej części wykładu, ma związek z zasadą Fermata, mówiącą, że światło biegnąc od punktu do punktu wybiera drogę o najkrótszym czasie przejścia. Schemat przyjęty w optyce geometrycznej przedstawia się następująco:

Rozważmy ”oś optyczną” $\overrightarrow{0z},$ którą wyobrazimy sobie jako prostą poziomą, leżącą w płaszczyźnie rysunku. Prostopadle do niej umieścimy dwie płaszczyzny A i B. Są one równoległe do dwóch pozostałych osi kartezjańskiego układu prostokątnego: poziomej osi $\overrightarrow{0x_{1}}$ i pionowej osi $\overrightarrow{0x_{2}}.$

Przestrzeń między tymi płaszczyznami nazwiemy systemem optycznym. Jest ona scharakteryzowana za pomocą funkcji $n(x_{1},x_{2},z)$ - ”gęstości optycznej środowiska”, przez które przebiega promień świetlny. Będziemy dalej zakładać, że tory promieni świetlnych są krzywymi rzutującymi się dyfeomorficznie na oś optyczną t.j, że dopuszczają opis $\gamma(z)=\big(x_{1}(z),x_{2}(z),z\big).$ Gęstość optyczna kształtuje tor następującą zasadą Fermata: promień świetlny opuszczający płaszczyznę A w punkcie $\big(x_{1}(z_{0}),x_{2}(z_{0})\big)$ i w kierunku wyznaczonym przez $\big(\dot{x}_{1}(z_{0}),\dot{x}_{2}(z_{0})\big)$ a następnie docierający do płaszczyzny $B$ z analogicznymi współrzędnymi $\big(x_{1}(z_{1}),x_{2}(z_{2}),\dot{x}_{1}(z_{1}),\dot{x}_{2}(z_{1})\big)$ robi to tak, że minimalizuje ”długość optyczną”

$\mathcal{L}(\gamma)=\int _{{z_{0}}}^{{z_{1}}}n(x_{1},x_{2},z)ds=\int _{{z_{0}}}^{{z_{1}}}n(x_{1},x_{2},z)\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}\ dz$

(9.5)

gdzie $\dot{x}_{1}$ oznacza $\displaystyle{\frac{dx_{1}}{dz}(z)}$ a $\dot{x}_{2}$ oznacza $\displaystyle{\frac{dx_{2}}{dz}(z)}$ Mamy zatem zagadnienie wariacyjne z funkcją Lagrange'a

$L(x_{1},x_{2},\dot{x}_{1},\dot{x}_{2},z)=n(x_{1},x_{2},z)\cdot\ \sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}$

(9.6)

Wynik Hamiltona mówi, że po właściwej zmianie współrzędnych krzywe całkowe równań Eulera dla (9.5) są krzywymi całkowym ”gradientu symplektycznego”' funkcji $\widehat{L}.$ Omówimy kolejno dokonywaną zamianę współrzędnych, której istotą jest transformata Legendre'a oraz wyprowadzimy równania Hamiltona, odkładając geometryczną interpretację tej sytuacji do następnego wykładu.

9.3. Legendre'owska zamiana współrzędnych.

Lemat 9.1

Dla ustalonych $z,x_{1},x_{2}$ funkcja (9.6) spełnia względem zmiennych $\dot{x}_{1},\dot{x}_{2}$ warunek:

$\displaystyle{d^{2}_{{(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})}}L(\triangle\dot{x}_{1},\triangle\dot{x}_{2})}>0.$

Istotnie, otrzymujemy ( dla zwięzłości będziemy pisać $n$ zamiast $n(x_{1},x_{2},z)$

$\frac{\partial L}{\partial\dot{x}_{1}}=\displaystyle{\frac{n\dot{x}_{1}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}};\displaystyle\frac{\partial L}{\partial\dot{x}_{2}}=\displaystyle{\frac{n\dot{x}_{2}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}}$

$\frac{\partial^{2}L}{\partial\dot{x}_{1}^{2}}=n\cdot\big(1+\dot{x}_{2}^{2}\big)\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}};\frac{\partial^{2}L}{\partial\dot{x}_{2}^{2}}=n\cdot\big(1+\dot{x}_{1}^{2}\big)\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}$

$\frac{\partial^{2}L}{\partial\dot{x}_{2}\partial\dot{x}_{1}}=-n\dot{x}_{1}\dot{x}_{2}\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}$

zatem druga różniczka $L$ jest formą kwadratową o postaci:

$d^{2}_{{(z,x.y,\dot{x},\dot{y})}}\big(\triangle\dot{x}_{1},\triangle\dot{x}_{2}\big)=n\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}\big[(1+\dot{x}_{2}^{2})(\triangle\dot{x}_{1})^{2}-2\dot{x}_{1}\dot{x}_{2}\triangle\dot{x}_{1}\triangle\dot{x}_{2}+(1+\dot{x}_{1}^{2})(\triangle\dot{x}_{2})^{2}\big]$

ale dla

$(\dot{x}_{1},\dot{x}_{2})\neq(0,0)$

mamy

$n\big(1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}\big)^{{-3/2}}\big[\big(\dot{x}_{2}\triangle\dot{x}_{1}-\dot{x}_{1}\triangle\dot{x}_{2}\big)^{2}+\triangle\dot{x}_{1}^{2}+\triangle\dot{x}_{2}^{2}\big]>0.$

Na mocy Lematu 9.1, ustalając zmienne $z,x_{1},x_{2},$ możemy stosować Stwierdzenie 9.1 do funkcji:

$\displaystyle{f_{{(z,x_{1},x_{2})}}}(\dot{x}_{1},\dot{x}_{2})=L(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})$

określając odwzorowanie

$\alpha _{{(z,x_{1},x_{2})}}:(\dot{x}_{1},\dot{x}_{2})\rightarrow\Big(\frac{\partial L}{\partial\dot{x}_{1}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})\frac{\partial L}{\partial\dot{x}_{2}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})\Big)=(p_{1},p_{2})$

(9.7)

i odwzorowanie odwrotne

$\beta _{{(z,x_{1},x_{2})}}:(p_{1},p_{2})\rightarrow\Big(\frac{\partial\widehat{f}_{{(z,x_{1},x_{2},p_{1},p_{2})}}}{\partial{p}_{1}},\frac{\partial\widehat{f}_{{(z,x_{1},x_{2},p_{1},p_{2})}}}{\partial{p}_{2}}\Big)=(\dot{x}_{1},\dot{x}_{2})$

(9.8)

W dalszym ciągu, dla oszczędności miejsca, będziemy zapisywać

$(p_{1},p_{2})=\big(\frac{\partial L}{\partial\dot{x}_{1}},\frac{\partial L}{\partial\dot{x}_{2}}\big)\textrm{oraz}\ (\dot{x}_{1},\dot{x}_{2})=\big(\frac{\partial\widehat{L}}{\partial\dot{p}_{1}},\frac{\partial\widehat{L}}{\partial\dot{p}_{2}}\big)$

9.4. Wyprowadzenie równań Hamiltona

Napiszmy układ równań Eulera dla funkcjonału (9.5)

$\frac{\partial L}{\partial x_{i}}-\frac{d}{dz}\ \frac{\partial L}{\partial\dot{x}_{i}}=0i=1,2$

(9.9)

i zastąpmy w nim $\displaystyle{\frac{\partial L}{\partial\dot{x_{i}}}}$ przez nową zmienną $p_{i}$ (zgodnie z 9.7). Oznaczając $\displaystyle{\frac{dp_{i}}{dz}}$ przez $\dot{p}_{i}$ $i=1,2$ możemy zapisać wtedy (9.9) w postaci:

$\dot{p}_{i}=\frac{\partial L}{\partial x_{i}}i=1,2.$

(9.10)

Otrzymujemy w ten sposób pierwsze dwa równania. Ponieważ $\displaystyle{\frac{\partial L}{\partial x_{i}}}$ zależą od $x_{1},x_{2},\dot{x}_{1},\dot{x}_{2},$ chcąc zastąpić $\dot{x}_{1},\dot{x}_{2}$ przez $p_{1},p_{2}$ możemy skorzystać z odwrotnej transformacji Legendre'a (9.8) dodając do (9.10) warunki

$\dot{x}_{i}=\frac{\partial\widehat{L}_{{(z,x_{1},x_{2})}}}{\partial\dot{p}_{i}}.$

(9.11)

To, że układ warunków (9.10) i (9.11) daje układ czterech równań określających funkcje $x_{i}(z)$ i $p_{i}(z)$ wynika z następującego lematu.

Lemat 9.2

Niech dla ustalonych $z,x_{1},x_{2}$ funkcja $\widehat{L}(z,x_{1},x_{2},p_{1},p_{2})$ oznacza transformatę Legendre'a funkcji $f_{{(z,x_{1},x_{2})}}(\dot{x}_{1},\dot{x}_{2}).$

Wtedy

$\frac{dL}{dx_{i}}(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2})=-\frac{d\widehat{L}}{dx_{i}}(z,x_{1},x_{2},p_{1},p_{2})$

(9.12)

Funkcje $L$ oraz $\widehat{L}$ związane są warunkiem

$\widehat{L}(z,x_{1},x_{2},{p}_{1},{p}_{2})=p_{1}\dot{x}_{1}+p_{2}\dot{x}_{2}-L(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2}).$

(9.13)

gdzie $(p_{1},p_{2})=\alpha(\dot{x}_{1},\dot{x}_{2})$ przy ustalonych $(z,x_{1},x_{2}).$

Obliczając $\frac{\partial}{\partial x_{i}}$ dla lewej strony (9.13) otrzymamy

$\frac{\partial\widehat{L}}{\partial x_{i}}+\frac{\partial\widehat{L}}{\partial p_{i}}\ \frac{\partial p_{1}}{\partial x_{i}}+\frac{\partial\widehat{L}}{\partial p_{2}}\ \frac{\partial p_{2}}{\partial x_{i}}i=1,2.$

Dla prawej strony 9.13 otrzymamy wyrażenie

$\frac{\partial p_{1}}{\partial x_{i}}\dot{x}_{i}+\frac{\partial p_{2}}{\partial x_{i}}\dot{x}_{2}-\frac{\partial L}{\partial x_{i}}i=1,2.$

Ale

$\displaystyle{\frac{\partial\widehat{L}}{\partial p_{j}}}\cdot\displaystyle{\frac{\partial p_{j}}{\partial x_{i}}}=\dot{x}_{j}\cdot\displaystyle{\frac{\partial p_{j}}{\partial x_{i}}}i,j=1,2$

skąd wynika (9.12).

∎

Na mocy lematu (9.4.) możemy więc przekształcić równanie (9.10), otrzymując ostateczny układ równań Hamiltona

$\qquad{\displaystyle{\dot{p}_{i}=-\frac{\partial\widehat{L}}{\partial x_{i}}}i=1,2\atop\displaystyle{\dot{x}_{i}=\frac{\partial\widehat{L}}{\partial p_{i}}i=1,2}.}$

(9.14)

Wobec tego trudność przejścia od opisu wariacyjnego z funkcją Lagrange'a $L$ do opisu (9.14) polega na znalezieniu transformaty Legendre'a $\widehat{L}$ funkcji $L.$ Oczywiście cała procedura opiera się na założeniu, że przy ustalonych $z,x_{1},x_{2}$ funkcja $L$ jest funkcją wypukłą ze względu na zmienne $\dot{x}_{1}$ i $\dot{x}_{2}.$

Pokażemy teraz, jak wygląda $\widehat{L}$ dla funkcji Lagrange'a

$L\big(z,x_{1},x_{2},\dot{x}_{1},\dot{x}_{2}\big)=n(z,x_{1},x_{2})\cdot\sqrt{1++\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}$

W dalszym ciągu, dla zwięzłości, będziemy pisać $n$ zamiast $n(z,x_{1},x_{2}).$ Wtedy (por. dowód lematu 9.1)

$p_{i}=\frac{\partial L}{\partial\dot{x}_{i}}=\frac{n\dot{x}_{i}}{\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}}i=1,2$

skąd

$\dot{x}_{i}=\frac{p_{i}}{n}\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}$

Zauważmy, że zachodzi tożsamość

$n^{2}-p_{1}^{2}-p_{2}^{2}=\frac{{n}^{2}}{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}$

a więc

$\sqrt{1+\dot{x}_{1}^{2}+\dot{x}_{2}^{2}}=\frac{n}{\sqrt{n^{2}-p_{1}^{2}-p_{2}^{2}}}$

i ostatecznie

$\widehat{L}(p_{1},p_{2})=p_{1}\dot{x}_{1}+p_{2}\dot{x}_{2}-L(\dot{x}_{1},\dot{x}_{2})=\frac{p_{1}^{2}+p_{2}^{2}}{\sqrt{n^{2}-p_{1}^{2}-p_{2}^{2}}}-n\sqrt{1+\frac{p_{1}^{2}+p_{2}^{2}}{n^{2}-p_{1}^{2}-p_{2}^{2}}}=$