W roku 1828 William Rowan Hamilton opublikował fundamentalną pracę nadającą optyce geometrycznej nowe nieoczekiwane sformułowanie związane z geometrią symplektyczną. Poprzednio bieg promieni świetlnych opisywany był za pomocą równań Eulera, wynikających z wariacyjnej zasady minimalizującej ”długość optyczną” przebywanej drogi.
Dopiero 20 lat później zauważył Hamilton, że to samo postępowanie, wykorzystujące tym razem wariacyjną zasadę najmniejszego działania, umożliwia także w mechanice uzyskanie nowego, znacznie bardziej geometrycznego opisu, niż ten, za pomocą równań Eulera - Legendre'a.
Postępując za Hamiltonem, omówimy kolejno transformację Legendre'a - kluczowe narzędzie w metodzie Hamiltona. Następnie pokażemy, jak uzyskuje się za jej pomocą nowy opis w optyce geometrycznej. Na koniec wrócimy do mechaniki.
9.1. Transformacja Legendre'a
W całym tym paragrafie dla przestrzeni liniowej X przez X* będziemy oznaczać przestrzeń form liniowych na X.
Zaczniemy od sytuacji jednowymiarowej. Niech f:a,b→R będzie dwukrotnie różniczkowalna i niech f′′>0 na a,b. Rozważmy przekształcenie
Ponieważ f′ jest ciągła i rosnąca, obrazem a,b na mocy własności Darboux jest przedział f′a,f′b oraz na f′a,f′b jest określone przekształcenie β odwrotne do α.
Stwierdzenie 9.1
Istnieje g:f′a,f′b→R taka, że βp=g′p dla p∋[f'(a), f'(b)]. Funkcję g nazwiemy transformatą Legendre`a funkcji f i napiszemy g=f^.
Stwierdzenie 9.2
Ponieważ funkcja f i g są obecne w naszych rozważaniach jedynie za pośrednictwem swoich pochodnych, obie są wyznaczone z dokładnością do stałej. Wygodnie będzie więc przyjąć umowę, że f0=g0=0.
Dla x,p∋a,b×f′a,f′b rozważmy funkcję
Ustalając p0 oznaczmy hp0x=Hp0,x=xp0-fx. Wtedy
hp0′x=p0-f′x a ponieważ hp0′b<0<hp0′a
oraz hp0′ jest malejąca i ciągła, istnieje dokładnie jeden punkt xp0 taki, że h′p0=0 tj. że f′xp0=p0
Przekształcenie
jest oczywiście odwrotne do
i jako odwrotne do różniczkowalnego o niezerowej pochodnej, samo jest różniczkowalne.Podamy jego opis analityczny.
Określmy
|
gp=Hxp,p=pxp-fxp |
| (9.2) |
wtedy
jest różniczkowalne oraz
|
g′p=ddppxp-fxp=xp+pxp′-f′xp⋅xp′=xp |
|
bo f′xp=p.
∎
Wniosek 9.1
Transformacja Legendre'a jest inwolucją t.j. f^^=f.
Wyznaczyć transformatę Legendre'a następujących funkcji:
(a)fx=ax2
(b)fx=xαα
Rozwiązanie:
|
(a)Hx,p=xp-ax2zatem∂H∂x=p-2ax |
|
i wobec tego
|
f^p=Hxp,p=p2a⋅p-ap4a2=p24a |
|
|
(b)H(x,p)=xp-xααwięc∂H∂x=p-xα-1zatemxp=p1α-1 |
|
wobec tego
|
f^p=Hxp,p=p1α-1⋅p-pαα-1α=1-1α⋅pαα-1=pββ |
|
gdzie 1α+1β=1.
Stwierdzenie 9.3
(Nierówność Younga ). Niech g=f^ wtedy
Dla każdego p punkt xp jest punktem maksimum funkcji hpx=xp-fx, t.j.
skąd wynika (9.3).
∎
W następującym tekście przyjmiemy konwencję, że wartość różniczki funkcji f w punkcie x na wektorze ζ jest zapisywana jako dxfζ.
Niech f bedzie określona i ma ciągłe pochodne do rzędu 2 na otwartym zbiorze Ω⊂Rn. Niech ponadto dx2f>0 dla x∈Ω. Przyjmujemy tutaj podejście wiążące kolejne różniczki ze wzorem Taylora i traktujące dnf jako odwzorowanie n- liniowe tam występujące. W szczególności
|
dx2f=∂2f∂xj,∂xixi,jn |
| (9.4) |
oznacza wtedy macierz formy kwadratowej a napis dx2f>0 oznacza, że forma ta jest dodatnio określona.
Rozważmy przekształcenie: Ω→dxf∈Rn*.
Stwierdzenie 9.4
Jeżeli Ω jest otwarty a f jest klasy C2 oraz dx2f>0 dla x∈Ω, to także zbiór Λ=dxf:x∈Ω jest otwarty.
Różniczka dx2f może być także interpretowana jako pierwsza różniczka w punkcie x odwzorowania α:Ω∈x→dxf∈Rn* Ponieważ warunek dx2f>0 implikuje, że macierz dx2f jest nieosobliwa, odwzorowanie α jest otwarte i w szczególności Λ jest zbiorem otwartym.
∎
Stwierdzenie 9.5
Przy założeniach i notacji Stwierdzenia 9.4. przekształcenie α:Ω→Λ jest różnowartościowe. Przekształcenie do niego odwrotne jest podobnej postaci t.j. przy kanonicznym utożsamieniu Rn z Rn*A* i traktowaniu Ω jako podzbioru Rn*A*, istnieje funkcja g:Λ→R taka, że βp≃α-1p=dpg.
Funkcję g nazywamy transformatą Legendre'a funkcji f.
Pokażemy najpierw, że funkcja α jest różnowartościowa. Niech x1,x2∈Ω i niech Ψt=αx1+tx2-x1.
Wtedy Ψ′′t jest równa wartości formy kwadratowej dx1+tx2-x12f na argumencie x2-x1 a zatem jest dodatnia. Oznacza to, że funkcja Ψ′t jest rosnąca. Ale Ψ′0=dx1fx2-x1 natomiast Ψ′t=dx2fx2-x1 a ponieważ Ψ′0≠Ψ′1 zatem dx1f≠dx2f.
Pokażemy następnie, że istnieje g:Λ→R klasy C2 taka, że dp2>0 oraz, że α-1p=dpg.
Rozumowanie przebiega podobnie, jak w dowodzie Stwierdzenia 9.4.
Dla x,p∈Ω x Λ rozważamy funkcję
gdzie <x,p> oznacza wartość formy liniowej p∈Rn* na wektorze x∈Rn. W części pierwszej tego dowodu pokazaliśmy, że dla każdego p∈Λ istnieje dokładnie jeden xp∈Ω taki, że dxpf=p. Określmy
|
g(p)=H(xp,p)=<xp,p>-f(xp) |
|
wtedy odworowanie β:p→xp jako odwrotne do α:x→dxf=p ma wszędzie różniczkę nieosobliwą na mocy twierdzenia o funkcji odwrotnej.
Pisząc gp=βp,p-f∘βp i uwzględniając, że dβ(p)f=dxpf=p mamy wtedy
|
dpgζ=dpβζ,p+βp,ζ-dβ(p)∘dpβζ= |
|
|
=〈dpβ(ζ),p〉+〈xpζ〉-〈p,dpβ(ζ)〉=〈xp,ζ〉 |
|
co należało wykazać.
Pokażemy wreszcie, że dp2g>0.
Traktując dp2g jako różniczkę odwzorowania p→dpg odwrotnego do x→dxf, którego różniczką jest dx2f widzimy, że teza wynika z obserwacji, że dla macierzy symetrycznej i dodatnio określonej, macierz odwrotna jest także symetryczna i dodatnio określona.
∎
Ćwiczenie 9.1
Wyznaczyć transformatę Legendre'a funkcji:
|
Fx1,…xn=∑i=1nai⋅xi2ai>0 |
|
wtedy
|
Hx1,…xn,p1,…pn=∑i=1nxipi-∑i=1nai⋅xi2 |
|
|
∂H∂xi=pi-2aixizatemxpi=pi2ai |
|
i otrzymujemy
|
F^p1,…pn=∑i=1npi22ai-∑i=1nai⋅pi24ai2=∑i=1npi24ai |
|
9.2. Optyka geometryczna.
Optyka geometryczna nie wnika w fizyczną naturę światła lecz przyjmuje jako aksjomat, że droga promienia światlnego jest taką krzywą, która minimalizuje tzw. długość optyczną. Ta zasada wariacyjna, której precyzyjne sformułowanie podamy w dalszej części wykładu, ma związek z zasadą Fermata, mówiącą, że światło biegnąc od punktu do punktu wybiera drogę o najkrótszym czasie przejścia.
Schemat przyjęty w optyce geometrycznej przedstawia się następująco:
Rozważmy ”oś optyczną” 0z→, którą wyobrazimy sobie jako prostą poziomą, leżącą w płaszczyźnie rysunku. Prostopadle do niej umieścimy dwie płaszczyzny A i B. Są one równoległe do dwóch pozostałych osi kartezjańskiego układu prostokątnego: poziomej osi 0x1→ i pionowej osi 0x2→.
Przestrzeń między tymi płaszczyznami nazwiemy systemem optycznym. Jest ona scharakteryzowana za pomocą funkcji nx1,x2,z - ”gęstości optycznej środowiska”, przez które przebiega promień świetlny. Będziemy dalej zakładać, że tory promieni świetlnych są krzywymi rzutującymi się dyfeomorficznie na oś optyczną t.j, że dopuszczają opis γz=x1z,x2z,z. Gęstość optyczna kształtuje tor następującą zasadą Fermata:
promień świetlny opuszczający płaszczyznę A w punkcie x1z0,x2z0 i w kierunku wyznaczonym przez x˙1z0,x˙2z0 a następnie docierający do płaszczyzny B z analogicznymi współrzędnymi x1z1,x2z2,x˙1z1,x˙2z1 robi to tak, że minimalizuje ”długość optyczną”
|
Lγ=∫z0z1nx1,x2,zds=∫z0z1nx1,x2,z1+x˙12+x˙22dz |
| (9.5) |
gdzie x˙1 oznacza dx1dzz a x˙2 oznacza dx2dzz
Mamy zatem zagadnienie wariacyjne z funkcją Lagrange'a
|
Lx1,x2,x˙1,x˙2,z=nx1,x2,z⋅1+x˙12+x˙22 |
| (9.6) |
Wynik Hamiltona mówi, że po właściwej zmianie współrzędnych krzywe całkowe równań Eulera dla (9.5) są krzywymi całkowym ”gradientu symplektycznego”' funkcji L^.
Omówimy kolejno dokonywaną zamianę współrzędnych, której istotą jest transformata Legendre'a oraz wyprowadzimy równania Hamiltona, odkładając geometryczną interpretację tej sytuacji do następnego wykładu.
9.3. Legendre'owska zamiana współrzędnych.
Lemat 9.1
Dla ustalonych z,x1,x2 funkcja (9.6) spełnia względem zmiennych x˙1,x˙2 warunek:
|
dz,x1,x2,x˙1,x˙22L△x˙1,△x˙2>0. |
|
Istotnie, otrzymujemy ( dla zwięzłości będziemy pisać n zamiast nx1,x2,z
|
∂L∂x˙1=nx˙11+x˙12+x˙22;∂L∂x˙2=nx˙21+x˙12+x˙22 |
|
|
∂2L∂x˙12=n⋅1+x˙221+x˙12+x˙22-3/2;∂2L∂x˙22=n⋅1+x˙121+x˙12+x˙22-3/2 |
|
|
∂2L∂x˙2∂x˙1=-nx˙1x˙21+x˙12+x˙22-3/2 |
|
zatem druga różniczka L jest formą kwadratową o postaci:
|
d(z,x.y,x˙,y˙)2△x˙1,△x˙2=n1+x˙12+x˙22-3/21+x˙22△x˙12-2x˙1x˙2△x˙1△x˙2+1+x˙12△x˙22 |
|
ale
dla
mamy
|
n1+x˙12+x˙22-3/2x˙2△x˙1-x˙1△x˙22+△x˙12+△x˙22>0. |
|
Na mocy Lematu 9.1, ustalając zmienne z,x1,x2, możemy stosować Stwierdzenie 9.1 do funkcji:
|
fz,x1,x2x˙1,x˙2=Lz,x1,x2,x˙1,x˙2 |
|
określając odwzorowanie
|
αz,x1,x2:x˙1,x˙2→∂L∂x˙1z,x1,x2,x˙1,x˙2∂L∂x˙2z,x1,x2,x˙1,x˙2=p1,p2 |
| (9.7) |
|
βz,x1,x2:p1,p2→∂f^z,x1,x2,p1,p2∂p1,∂f^z,x1,x2,p1,p2∂p2=x˙1,x˙2 |
| (9.8) |
W dalszym ciągu, dla oszczędności miejsca, będziemy zapisywać
|
p1,p2=∂L∂x˙1,∂L∂x˙2orazx˙1,x˙2=∂L^∂p˙1,∂L^∂p˙2 |
|
9.4. Wyprowadzenie równań Hamiltona
Napiszmy układ równań Eulera dla funkcjonału (9.5)
|
∂L∂xi-ddz∂L∂x˙i=0i=1,2 |
| (9.9) |
i zastąpmy w nim ∂L∂xi˙ przez nową zmienną pi (zgodnie z 9.7). Oznaczając dpidz przez p˙i i=1,2 możemy zapisać wtedy (9.9) w postaci:
|
p˙i=∂L∂xii=1,2. |
| (9.10) |
Otrzymujemy w ten sposób pierwsze dwa równania. Ponieważ ∂L∂xi zależą od x1,x2,x˙1,x˙2, chcąc zastąpić x˙1,x˙2 przez p1,p2 możemy skorzystać z odwrotnej transformacji Legendre'a (9.8) dodając do (9.10) warunki
|
x˙i=∂L^z,x1,x2∂p˙i. |
| (9.11) |
To, że układ warunków (9.10) i (9.11) daje układ czterech równań określających funkcje xiz i piz wynika z następującego lematu.
Lemat 9.2
Niech dla ustalonych z,x1,x2 funkcja L^z,x1,x2,p1,p2 oznacza transformatę Legendre'a funkcji fz,x1,x2x˙1,x˙2.
|
dLdxiz,x1,x2,x˙1,x˙2=-dL^dxiz,x1,x2,p1,p2 |
| (9.12) |
Funkcje L oraz L^ związane są warunkiem
|
L^z,x1,x2,p1,p2=p1x˙1+p2x˙2-Lz,x1,x2,x˙1,x˙2. |
| (9.13) |
gdzie p1,p2=αx˙1,x˙2 przy ustalonych z,x1,x2.
Obliczając ∂∂xi dla lewej strony (9.13) otrzymamy
|
∂L^∂xi+∂L^∂pi∂p1∂xi+∂L^∂p2∂p2∂xii=1,2. |
|
Dla prawej strony 9.13 otrzymamy wyrażenie
|
∂p1∂xix˙i+∂p2∂xix˙2-∂L∂xii=1,2. |
|
Ale
|
∂L^∂pj⋅∂pj∂xi=x˙j⋅∂pj∂xii,j=1,2 |
|
skąd wynika (9.12).
∎
Na mocy lematu (9.4.) możemy więc przekształcić równanie (9.10), otrzymując ostateczny układ równań Hamiltona
|
p˙i=-∂L^∂xii=1,2x˙i=∂L^∂pii=1,2. |
| (9.14) |
Wobec tego trudność przejścia od opisu wariacyjnego z funkcją Lagrange'a L do opisu (9.14) polega na znalezieniu transformaty Legendre'a L^ funkcji L. Oczywiście cała procedura opiera się na założeniu, że przy ustalonych z,x1,x2 funkcja L jest funkcją wypukłą ze względu na zmienne x˙1 i x˙2.
Pokażemy teraz, jak wygląda L^ dla funkcji Lagrange'a
|
Lz,x1,x2,x˙1,x˙2=nz,x1,x2⋅1++x˙12+x˙22 |
|
W dalszym ciągu, dla zwięzłości, będziemy pisać n zamiast nz,x1,x2. Wtedy (por. dowód lematu 9.1)
|
pi=∂L∂x˙i=nx˙i1+x˙12+x˙22i=1,2 |
|
skąd
Zauważmy, że zachodzi tożsamość
a więc
i ostatecznie
|
L^p1,p2=p1x˙1+p2x˙2-Lx˙1,x˙2=p12+p22n2-p12-p22-n1+p12+p22n2-p12-p22= |
|
Podsumowując:
Stwierdzenie 9.6
Krzywe przebiegu promieni świetlnych
opisane przez zasadę wariacyjną 9.5 z funkcją Lagrange'a
|
Lz,x1,x2,x˙1,x˙2=nz,x1,x21++x˙12+x˙22 |
|
po zamianie zmiennych
|
z,x1,x2,x˙1,x˙2→z,x1,x2,p1,p2 |
|
gdzie
|
pi=∂L∂x˙i=nz,x1,x2⋅x˙i1+x˙12+x˙22 |
|
przechodzą na krzywe całkowe układu 9.14, gdzie
|
L^z,x1,x2,p1,p2=-nz,x1,x2-p12-p22. |
|