Zagadnienia

9.1 Transformacja Legendre'a
9.2 Optyka geometryczna.
9.3 Legendre'owska zamiana współrzędnych.
9.4 Wyprowadzenie równań Hamiltona

9. Metoda Hamiltona w optyce geometrycznej

W roku 1828 William Rowan Hamilton opublikował fundamentalną pracę nadającą optyce geometrycznej nowe nieoczekiwane sformułowanie związane z geometrią symplektyczną. Poprzednio bieg promieni świetlnych opisywany był za pomocą równań Eulera, wynikających z wariacyjnej zasady minimalizującej ”długość optyczną” przebywanej drogi. Dopiero 20 lat później zauważył Hamilton, że to samo postępowanie, wykorzystujące tym razem wariacyjną zasadę najmniejszego działania, umożliwia także w mechanice uzyskanie nowego, znacznie bardziej geometrycznego opisu, niż ten, za pomocą równań Eulera - Legendre'a. Postępując za Hamiltonem, omówimy kolejno transformację Legendre'a - kluczowe narzędzie w metodzie Hamiltona. Następnie pokażemy, jak uzyskuje się za jej pomocą nowy opis w optyce geometrycznej. Na koniec wrócimy do mechaniki.

9.1. Transformacja Legendre'a

W całym tym paragrafie dla przestrzeni liniowej X przez X* będziemy oznaczać przestrzeń form liniowych na X. Zaczniemy od sytuacji jednowymiarowej. Niech f:a,b→R będzie dwukrotnie różniczkowalna i niech f′′>0 na a,b. Rozważmy przekształcenie

α:a,b∋x→f′⁢x=p∈R*≃R.

Ponieważ f′ jest ciągła i rosnąca, obrazem a,b na mocy własności Darboux jest przedział f′⁢a,f′⁢b oraz na f′⁢a,f′⁢b jest określone przekształcenie β odwrotne do α.

Stwierdzenie 9.1

Istnieje g:f′⁢a,f′⁢b→R taka, że β⁢p=g′⁢p dla p∋[f'(a), f'(b)]. Funkcję g nazwiemy transformatą Legendre`a funkcji f i napiszemy g=f^.

Stwierdzenie 9.2

Ponieważ funkcja f i g są obecne w naszych rozważaniach jedynie za pośrednictwem swoich pochodnych, obie są wyznaczone z dokładnością do stałej. Wygodnie będzie więc przyjąć umowę, że f⁢0=g⁢0=0.

Dla x,p∋a,b×f′⁢a,f′⁢b rozważmy funkcję

H⁢x,p=x⁢p-f⁢x

(9.1)

Ustalając p0 oznaczmy hp0⁢x=H⁢p0,x=x⁢p0-f⁢x. Wtedy
hp0′⁢x=p0-f′⁢x a ponieważ hp0′⁢b<0<hp0′⁢a oraz hp0′ jest malejąca i ciągła, istnieje dokładnie jeden punkt xp0 taki, że h′⁢p0=0 tj. że f′⁢xp0=p0 Przekształcenie

f′⁢a,f′⁢b∈p→xp∋a,b

jest oczywiście odwrotne do

a,b∈x→f′⁢x∈f′⁢a,f′⁢b,

i jako odwrotne do różniczkowalnego o niezerowej pochodnej, samo jest różniczkowalne.Podamy jego opis analityczny.

Określmy

g⁢p=H⁢xp,p=p⁢xp-f⁢xp

(9.2)

wtedy

g:f′⁢a,f′⁢b→R

jest różniczkowalne oraz

g′⁢p=dd⁢p⁢p⁢xp-f⁢xp=xp+p⁢xp′-f′⁢xp⋅xp′=xp

bo f′⁢xp=p.

∎

Wniosek 9.1

Transformacja Legendre'a jest inwolucją t.j. f^^=f.

Wyznaczyć transformatę Legendre'a następujących funkcji: (a)⁢f⁢x=a⁢x2
(b)⁢f⁢x=xαα

Rozwiązanie:

(a)⁢H⁢x,p=x⁢p-a⁢x2⁢zatem⁢∂⁡H∂⁡x=p-2⁢a⁢x

i wobec tego

f^⁢p=H⁢xp,p=p2⁢a⋅p-a⁢p4⁢a2=p24⁢a

(b)H(x,p)=xp-xααwięc∂⁡H∂⁡x=p-xα-1zatemxp=p1α-1

wobec tego

f^⁢p=H⁢xp,p=p1α-1⋅p-pαα-1α=1-1α⋅pαα-1=pββ

gdzie 1α+1β=1.

Stwierdzenie 9.3

(Nierówność Younga ). Niech g=f^ wtedy

p⁢x≤f⁢x+g⁢p

(9.3)

Dla każdego p punkt xp jest punktem maksimum funkcji hp⁢x=x⁢p-f⁢x, t.j.

g⁢p=p⁢xp-f⁢xp≥p⁢x-f⁢x,

skąd wynika (9.3).

∎

Sytuacja n-wymiarowa.

W następującym tekście przyjmiemy konwencję, że wartość różniczki funkcji f w punkcie x na wektorze ζ jest zapisywana jako dx⁢f⁢ζ. Niech f bedzie określona i ma ciągłe pochodne do rzędu 2 na otwartym zbiorze Ω⊂Rn. Niech ponadto dx2⁢f>0 dla x∈Ω. Przyjmujemy tutaj podejście wiążące kolejne różniczki ze wzorem Taylora i traktujące dn⁢f jako odwzorowanie n- liniowe tam występujące. W szczególności

dx2⁢f=∂2⁡f∂⁡xj,∂⁡xi⁢xi,jn

(9.4)

oznacza wtedy macierz formy kwadratowej a napis dx2⁢f>0 oznacza, że forma ta jest dodatnio określona. Rozważmy przekształcenie: Ω→dx⁢f∈Rn*.

Stwierdzenie 9.4

Jeżeli Ω jest otwarty a f jest klasy C2 oraz dx2⁢f>0 dla x∈Ω, to także zbiór Λ=dx⁢f:x∈Ω jest otwarty.

Różniczka dx2⁢f może być także interpretowana jako pierwsza różniczka w punkcie x odwzorowania α:Ω∈x→dx⁢f∈Rn* Ponieważ warunek dx2⁢f>0 implikuje, że macierz dx2⁢f jest nieosobliwa, odwzorowanie α jest otwarte i w szczególności Λ jest zbiorem otwartym.

∎

Stwierdzenie 9.5

Przy założeniach i notacji Stwierdzenia 9.4. przekształcenie α:Ω→Λ jest różnowartościowe. Przekształcenie do niego odwrotne jest podobnej postaci t.j. przy kanonicznym utożsamieniu Rn z Rn*A* i traktowaniu Ω jako podzbioru Rn*A*, istnieje funkcja g:Λ→R taka, że β⁢p≃α-1⁢p=dp⁢g.

Funkcję g nazywamy transformatą Legendre'a funkcji f.

Pokażemy najpierw, że funkcja α jest różnowartościowa. Niech x1,x2∈Ω i niech Ψ⁢t=α⁢x1+t⁢x2-x1. Wtedy Ψ′′⁢t jest równa wartości formy kwadratowej dx1+t⁢x2-x12⁢f na argumencie x2-x1 a zatem jest dodatnia. Oznacza to, że funkcja Ψ′⁢t jest rosnąca. Ale Ψ′⁢0=dx1⁢f⁢x2-x1 natomiast Ψ′⁢t=dx2⁢f⁢x2-x1 a ponieważ Ψ′⁢0≠Ψ′⁢1 zatem dx1⁢f≠dx2⁢f.

Pokażemy następnie, że istnieje g:Λ→R klasy C2 taka, że dp2>0 oraz, że α-1⁢p=dp⁢g.
Rozumowanie przebiega podobnie, jak w dowodzie Stwierdzenia 9.4.
Dla x,p∈Ω x Λ rozważamy funkcję

H(x,p)=<x,p>-f(x)

gdzie <x,p> oznacza wartość formy liniowej p∈Rn* na wektorze x∈Rn. W części pierwszej tego dowodu pokazaliśmy, że dla każdego p∈Λ istnieje dokładnie jeden xp∈Ω taki, że dxp⁢f=p. Określmy

g(p)=H(xp,p)=<xp,p>-f(xp)

wtedy odworowanie β:p→xp jako odwrotne do α:x→dx⁢f=p ma wszędzie różniczkę nieosobliwą na mocy twierdzenia o funkcji odwrotnej. Pisząc g⁢p=β⁢p,p-f∘β⁢p i uwzględniając, że dβ(p)⁢f=dxp⁢f=p mamy wtedy

dp⁢g⁢ζ=dp⁢β⁢ζ,p+β⁢p,ζ-dβ(p)∘dp⁢β⁢ζ=

=〈dpβ(ζ),p〉+〈xpζ〉-〈p,dpβ(ζ)〉=〈xp,ζ〉

co należało wykazać. Pokażemy wreszcie, że dp2⁢g>0.

Traktując dp2⁢g jako różniczkę odwzorowania p→dp⁢g odwrotnego do x→dx⁢f, którego różniczką jest dx2⁢f widzimy, że teza wynika z obserwacji, że dla macierzy symetrycznej i dodatnio określonej, macierz odwrotna jest także symetryczna i dodatnio określona.

∎

Ćwiczenie 9.1

Wyznaczyć transformatę Legendre'a funkcji:

F⁢x1,…⁢xn=∑i=1nai⋅xi2⁢ai>0

wtedy

H⁢x1,…⁢xn,p1,…⁢pn=∑i=1nxi⁢pi-∑i=1nai⋅xi2

∂⁡H∂⁡xi=pi-2⁢ai⁢xi⁢zatem⁢xpi=pi2⁢ai

i otrzymujemy

F^⁢p1,…⁢pn=∑i=1npi22⁢ai-∑i=1nai⋅pi24⁢ai2=∑i=1npi24⁢ai

9.2. Optyka geometryczna.

Optyka geometryczna nie wnika w fizyczną naturę światła lecz przyjmuje jako aksjomat, że droga promienia światlnego jest taką krzywą, która minimalizuje tzw. długość optyczną. Ta zasada wariacyjna, której precyzyjne sformułowanie podamy w dalszej części wykładu, ma związek z zasadą Fermata, mówiącą, że światło biegnąc od punktu do punktu wybiera drogę o najkrótszym czasie przejścia. Schemat przyjęty w optyce geometrycznej przedstawia się następująco:

Rozważmy ”oś optyczną” 0⁢z→, którą wyobrazimy sobie jako prostą poziomą, leżącą w płaszczyźnie rysunku. Prostopadle do niej umieścimy dwie płaszczyzny A i B. Są one równoległe do dwóch pozostałych osi kartezjańskiego układu prostokątnego: poziomej osi 0⁢x1→ i pionowej osi 0⁢x2→.

Przestrzeń między tymi płaszczyznami nazwiemy systemem optycznym. Jest ona scharakteryzowana za pomocą funkcji n⁢x1,x2,z - ”gęstości optycznej środowiska”, przez które przebiega promień świetlny. Będziemy dalej zakładać, że tory promieni świetlnych są krzywymi rzutującymi się dyfeomorficznie na oś optyczną t.j, że dopuszczają opis γ⁢z=x1⁢z,x2⁢z,z. Gęstość optyczna kształtuje tor następującą zasadą Fermata: promień świetlny opuszczający płaszczyznę A w punkcie x1⁢z0,x2⁢z0 i w kierunku wyznaczonym przez x˙1⁢z0,x˙2⁢z0 a następnie docierający do płaszczyzny B z analogicznymi współrzędnymi x1⁢z1,x2⁢z2,x˙1⁢z1,x˙2⁢z1 robi to tak, że minimalizuje ”długość optyczną”

L⁢γ=∫z0z1n⁢x1,x2,z⁢d⁢s=∫z0z1n⁢x1,x2,z⁢1+x˙12+x˙22⁢⁢d⁢z

(9.5)

gdzie x˙1 oznacza d⁢x1d⁢z⁢z a x˙2 oznacza d⁢x2d⁢z⁢z Mamy zatem zagadnienie wariacyjne z funkcją Lagrange'a

L⁢x1,x2,x˙1,x˙2,z=n⁢x1,x2,z⋅⁢1+x˙12+x˙22

(9.6)

Wynik Hamiltona mówi, że po właściwej zmianie współrzędnych krzywe całkowe równań Eulera dla (9.5) są krzywymi całkowym ”gradientu symplektycznego”' funkcji L^. Omówimy kolejno dokonywaną zamianę współrzędnych, której istotą jest transformata Legendre'a oraz wyprowadzimy równania Hamiltona, odkładając geometryczną interpretację tej sytuacji do następnego wykładu.

9.3. Legendre'owska zamiana współrzędnych.

Lemat 9.1

Dla ustalonych z,x1,x2 funkcja (9.6) spełnia względem zmiennych x˙1,x˙2 warunek:

dz,x1,x2,x˙1,x˙22⁢L⁢△⁢x˙1,△⁢x˙2>0.

Istotnie, otrzymujemy ( dla zwięzłości będziemy pisać n zamiast n⁢x1,x2,z

∂⁡L∂⁡x˙1=n⁢x˙11+x˙12+x˙22;∂⁡L∂⁡x˙2=n⁢x˙21+x˙12+x˙22

∂2⁡L∂⁡x˙12=n⋅1+x˙22⁢1+x˙12+x˙22-3/2;∂2⁡L∂⁡x˙22=n⋅1+x˙12⁢1+x˙12+x˙22-3/2

∂2⁡L∂⁡x˙2⁢∂⁡x˙1=-n⁢x˙1⁢x˙2⁢1+x˙12+x˙22-3/2

zatem druga różniczka L jest formą kwadratową o postaci:

d(z,x.y,x˙,y˙)2⁢△⁢x˙1,△⁢x˙2=n⁢1+x˙12+x˙22-3/2⁢1+x˙22⁢△⁢x˙12-2⁢x˙1⁢x˙2⁢△⁢x˙1⁢△⁢x˙2+1+x˙12⁢△⁢x˙22

ale dla

x˙1,x˙2≠0,0

mamy

n⁢1+x˙12+x˙22-3/2⁢x˙2⁢△⁢x˙1-x˙1⁢△⁢x˙22+△⁢x˙12+△⁢x˙22>0.

Na mocy Lematu 9.1, ustalając zmienne z,x1,x2, możemy stosować Stwierdzenie 9.1 do funkcji:

fz,x1,x2⁢x˙1,x˙2=L⁢z,x1,x2,x˙1,x˙2

określając odwzorowanie

αz,x1,x2:x˙1,x˙2→∂⁡L∂⁡x˙1⁢z,x1,x2,x˙1,x˙2⁢∂⁡L∂⁡x˙2⁢z,x1,x2,x˙1,x˙2=p1,p2

(9.7)

i odwzorowanie odwrotne

βz,x1,x2:p1,p2→∂⁡f^z,x1,x2,p1,p2∂⁡p1,∂⁡f^z,x1,x2,p1,p2∂⁡p2=x˙1,x˙2

(9.8)

W dalszym ciągu, dla oszczędności miejsca, będziemy zapisywać

p1,p2=∂⁡L∂⁡x˙1,∂⁡L∂⁡x˙2⁢oraz⁢⁢x˙1,x˙2=∂⁡L^∂⁡p˙1,∂⁡L^∂⁡p˙2

9.4. Wyprowadzenie równań Hamiltona

Napiszmy układ równań Eulera dla funkcjonału (9.5)

∂⁡L∂⁡xi-dd⁢z⁢⁢∂⁡L∂⁡x˙i=0⁢i=1,2

(9.9)

i zastąpmy w nim ∂⁡L∂⁡xi˙ przez nową zmienną pi (zgodnie z 9.7). Oznaczając d⁢pid⁢z przez p˙i i=1,2 możemy zapisać wtedy (9.9) w postaci:

p˙i=∂⁡L∂⁡xi⁢i=1,2.

(9.10)

Otrzymujemy w ten sposób pierwsze dwa równania. Ponieważ ∂⁡L∂⁡xi zależą od x1,x2,x˙1,x˙2, chcąc zastąpić x˙1,x˙2 przez p1,p2 możemy skorzystać z odwrotnej transformacji Legendre'a (9.8) dodając do (9.10) warunki

x˙i=∂⁡L^z,x1,x2∂⁡p˙i.

(9.11)

To, że układ warunków (9.10) i (9.11) daje układ czterech równań określających funkcje xi⁢z i pi⁢z wynika z następującego lematu.

Lemat 9.2

Niech dla ustalonych z,x1,x2 funkcja L^⁢z,x1,x2,p1,p2 oznacza transformatę Legendre'a funkcji fz,x1,x2⁢x˙1,x˙2.

Wtedy

d⁢Ld⁢xi⁢z,x1,x2,x˙1,x˙2=-d⁢L^d⁢xi⁢z,x1,x2,p1,p2

(9.12)

Funkcje L oraz L^ związane są warunkiem

L^⁢z,x1,x2,p1,p2=p1⁢x˙1+p2⁢x˙2-L⁢z,x1,x2,x˙1,x˙2.

(9.13)

gdzie p1,p2=α⁢x˙1,x˙2 przy ustalonych z,x1,x2.

Obliczając ∂∂⁡xi dla lewej strony (9.13) otrzymamy

∂⁡L^∂⁡xi+∂⁡L^∂⁡pi⁢⁢∂⁡p1∂⁡xi+∂⁡L^∂⁡p2⁢⁢∂⁡p2∂⁡xi⁢i=1,2.

Dla prawej strony 9.13 otrzymamy wyrażenie

∂⁡p1∂⁡xi⁢x˙i+∂⁡p2∂⁡xi⁢x˙2-∂⁡L∂⁡xi⁢i=1,2.

Ale

∂⁡L^∂⁡pj⋅∂⁡pj∂⁡xi=x˙j⋅∂⁡pj∂⁡xi⁢i,j=1,2

skąd wynika (9.12).

∎

Na mocy lematu (9.4.) możemy więc przekształcić równanie (9.10), otrzymując ostateczny układ równań Hamiltona

⁢p˙i=-∂⁡L^∂⁡xi⁢i=1,2x˙i=∂⁡L^∂⁡pi⁢i=1,2.

(9.14)

Wobec tego trudność przejścia od opisu wariacyjnego z funkcją Lagrange'a L do opisu (9.14) polega na znalezieniu transformaty Legendre'a L^ funkcji L. Oczywiście cała procedura opiera się na założeniu, że przy ustalonych z,x1,x2 funkcja L jest funkcją wypukłą ze względu na zmienne x˙1 i x˙2.

Pokażemy teraz, jak wygląda L^ dla funkcji Lagrange'a

L⁢z,x1,x2,x˙1,x˙2=n⁢z,x1,x2⋅1++x˙12+x˙22

W dalszym ciągu, dla zwięzłości, będziemy pisać n zamiast n⁢z,x1,x2. Wtedy (por. dowód lematu 9.1)

pi=∂⁡L∂⁡x˙i=n⁢x˙i1+x˙12+x˙22⁢i=1,2

skąd

x˙i=pin⁢1+x˙12+x˙22

Zauważmy, że zachodzi tożsamość

n2-p12-p22=n21+x˙12+x˙22

a więc

1+x˙12+x˙22=nn2-p12-p22

i ostatecznie

L^⁢p1,p2=p1⁢x˙1+p2⁢x˙2-L⁢x˙1,x˙2=p12+p22n2-p12-p22-n⁢1+p12+p22n2-p12-p22=

=-n2-p12-p22

Podsumowując:

Stwierdzenie 9.6

Krzywe przebiegu promieni świetlnych

z→x1⁢z,x2⁢z,x˙⁢z,x˙2⁢z

opisane przez zasadę wariacyjną 9.5 z funkcją Lagrange'a

L⁢z,x1,x2,x˙1,x˙2=n⁢z,x1,x2⁢1++x˙12+x˙22

po zamianie zmiennych

z,x1,x2,x˙1,x˙2→z,x1,x2,p1,p2

gdzie

pi=∂⁡L∂⁡x˙i=n⁢z,x1,x2⋅x˙i1+x˙12+x˙22

przechodzą na krzywe całkowe układu 9.14, gdzie

L^⁢z,x1,x2,p1,p2=-n⁢z,x1,x2-p12-p22.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Matematyczne metody mechaniki