Zagadnienia

9. Metoda Hamiltona w optyce geometrycznej

W roku 1828 William Rowan Hamilton opublikował fundamentalną pracę nadającą optyce geometrycznej nowe nieoczekiwane sformułowanie związane z geometrią symplektyczną. Poprzednio bieg promieni świetlnych opisywany był za pomocą równań Eulera, wynikających z wariacyjnej zasady minimalizującej ”długość optyczną” przebywanej drogi. Dopiero 20 lat później zauważył Hamilton, że to samo postępowanie, wykorzystujące tym razem wariacyjną zasadę najmniejszego działania, umożliwia także w mechanice uzyskanie nowego, znacznie bardziej geometrycznego opisu, niż ten, za pomocą równań Eulera - Legendre'a. Postępując za Hamiltonem, omówimy kolejno transformację Legendre'a - kluczowe narzędzie w metodzie Hamiltona. Następnie pokażemy, jak uzyskuje się za jej pomocą nowy opis w optyce geometrycznej. Na koniec wrócimy do mechaniki.

9.1. Transformacja Legendre'a

W całym tym paragrafie dla przestrzeni liniowej X przez X* będziemy oznaczać przestrzeń form liniowych na X. Zaczniemy od sytuacji jednowymiarowej. Niech f:a,bR będzie dwukrotnie różniczkowalna i niech f′′>0 na a,b. Rozważmy przekształcenie

α:a,bxfx=pR*R.

Ponieważ f jest ciągła i rosnąca, obrazem a,b na mocy własności Darboux jest przedział fa,fb oraz na fa,fb jest określone przekształcenie β odwrotne do α.

Stwierdzenie 9.1

Istnieje g:fa,fbR taka, że βp=gp dla p[f'(a), f'(b)]. Funkcję g nazwiemy transformatą Legendre`a funkcji f i napiszemy g=f^.

Stwierdzenie 9.2

Ponieważ funkcja f i g są obecne w naszych rozważaniach jedynie za pośrednictwem swoich pochodnych, obie są wyznaczone z dokładnością do stałej. Wygodnie będzie więc przyjąć umowę, że f0=g0=0.

Dla x,pa,b×fa,fb rozważmy funkcję

Hx,p=xp-fx (9.1)

Ustalając p0 oznaczmy hp0x=Hp0,x=xp0-fx. Wtedy
hp0x=p0-fx a ponieważ hp0b<0<hp0a oraz hp0 jest malejąca i ciągła, istnieje dokładnie jeden punkt xp0 taki, że hp0=0 tj. że fxp0=p0 Przekształcenie

fa,fbpxpa,b

jest oczywiście odwrotne do

a,bxfxfa,fb,

i jako odwrotne do różniczkowalnego o niezerowej pochodnej, samo jest różniczkowalne.Podamy jego opis analityczny.

Określmy

gp=Hxp,p=pxp-fxp (9.2)

wtedy

g:fa,fbR

jest różniczkowalne oraz

gp=ddppxp-fxp=xp+pxp-fxpxp=xp

bo fxp=p.

Wniosek 9.1

Transformacja Legendre'a jest inwolucją t.j. f^^=f.

Wyznaczyć transformatę Legendre'a następujących funkcji: (a)fx=ax2
(b)fx=xαα

Rozwiązanie: 
(a)Hx,p=xp-ax2zatemHx=p-2ax

i wobec tego

f^p=Hxp,p=p2ap-ap4a2=p24a
(b)H(x,p)=xp-xααwięcHx=p-xα-1zatemxp=p1α-1

wobec tego

f^p=Hxp,p=p1α-1p-pαα-1α=1-1αpαα-1=pββ

gdzie 1α+1β=1.

Stwierdzenie 9.3

(Nierówność Younga ). Niech g=f^ wtedy

pxfx+gp (9.3)

Dla każdego p punkt xp jest punktem maksimum funkcji hpx=xp-fx, t.j.

gp=pxp-fxppx-fx,

skąd wynika (9.3).

Sytuacja n-wymiarowa.

W następującym tekście przyjmiemy konwencję, że wartość różniczki funkcji f w punkcie x na wektorze ζ jest zapisywana jako dxfζ. Niech f bedzie określona i ma ciągłe pochodne do rzędu 2 na otwartym zbiorze ΩRn. Niech ponadto dx2f>0 dla xΩ. Przyjmujemy tutaj podejście wiążące kolejne różniczki ze wzorem Taylora i traktujące dnf jako odwzorowanie n- liniowe tam występujące. W szczególności

dx2f=2fxj,xixi,jn (9.4)

oznacza wtedy macierz formy kwadratowej a napis dx2f>0 oznacza, że forma ta jest dodatnio określona. Rozważmy przekształcenie: ΩdxfRn*.

Stwierdzenie 9.4

Jeżeli Ω jest otwarty a f jest klasy C2 oraz dx2f>0 dla xΩ, to także zbiór Λ=dxf:xΩ jest otwarty.

Różniczka dx2f może być także interpretowana jako pierwsza różniczka w punkcie x odwzorowania α:ΩxdxfRn* Ponieważ warunek dx2f>0 implikuje, że macierz dx2f jest nieosobliwa, odwzorowanie α jest otwarte i w szczególności Λ jest zbiorem otwartym.

Stwierdzenie 9.5

Przy założeniach i notacji Stwierdzenia 9.4. przekształcenie α:ΩΛ jest różnowartościowe. Przekształcenie do niego odwrotne jest podobnej postaci t.j. przy kanonicznym utożsamieniu Rn z Rn*A* i traktowaniu Ω jako podzbioru Rn*A*, istnieje funkcja g:ΛR taka, że βpα-1p=dpg.

Funkcję g nazywamy transformatą Legendre'a funkcji f.

Pokażemy najpierw, że funkcja α jest różnowartościowa. Niech x1,x2Ω i niech Ψt=αx1+tx2-x1. Wtedy Ψ′′t jest równa wartości formy kwadratowej dx1+tx2-x12f na argumencie x2-x1 a zatem jest dodatnia. Oznacza to, że funkcja Ψt jest rosnąca. Ale Ψ0=dx1fx2-x1 natomiast Ψt=dx2fx2-x1 a ponieważ Ψ0Ψ1 zatem dx1fdx2f.

Pokażemy następnie, że istnieje g:ΛR klasy C2 taka, że dp2>0 oraz, że α-1p=dpg.
Rozumowanie przebiega podobnie, jak w dowodzie Stwierdzenia 9.4.
Dla x,pΩ x Λ rozważamy funkcję

H(x,p)=<x,p>-f(x)

gdzie <x,p> oznacza wartość formy liniowej pRn* na wektorze xRn. W części pierwszej tego dowodu pokazaliśmy, że dla każdego pΛ istnieje dokładnie jeden xpΩ taki, że dxpf=p. Określmy

g(p)=H(xp,p)=<xp,p>-f(xp)

wtedy odworowanie β:pxp jako odwrotne do α:xdxf=p ma wszędzie różniczkę nieosobliwą na mocy twierdzenia o funkcji odwrotnej. Pisząc gp=βp,p-fβp i uwzględniając, że dβ(p)f=dxpf=p mamy wtedy

dpgζ=dpβζ,p+βp,ζ-dβ(p)dpβζ=
=dpβ(ζ),p+xpζ-p,dpβ(ζ)=xp,ζ

co należało wykazać. Pokażemy wreszcie, że dp2g>0.

Traktując dp2g jako różniczkę odwzorowania pdpg odwrotnego do xdxf, którego różniczką jest dx2f widzimy, że teza wynika z obserwacji, że dla macierzy symetrycznej i dodatnio określonej, macierz odwrotna jest także symetryczna i dodatnio określona.

Ćwiczenie 9.1

Wyznaczyć transformatę Legendre'a funkcji:

Fx1,xn=i=1naixi2ai>0

wtedy

Hx1,xn,p1,pn=i=1nxipi-i=1naixi2
Hxi=pi-2aixizatemxpi=pi2ai

i otrzymujemy

F^p1,pn=i=1npi22ai-i=1naipi24ai2=i=1npi24ai

9.2. Optyka geometryczna.

Optyka geometryczna nie wnika w fizyczną naturę światła lecz przyjmuje jako aksjomat, że droga promienia światlnego jest taką krzywą, która minimalizuje tzw. długość optyczną. Ta zasada wariacyjna, której precyzyjne sformułowanie podamy w dalszej części wykładu, ma związek z zasadą Fermata, mówiącą, że światło biegnąc od punktu do punktu wybiera drogę o najkrótszym czasie przejścia. Schemat przyjęty w optyce geometrycznej przedstawia się następująco:

Brak opisu

Rozważmy ”oś optyczną” 0z, którą wyobrazimy sobie jako prostą poziomą, leżącą w płaszczyźnie rysunku. Prostopadle do niej umieścimy dwie płaszczyzny A i B. Są one równoległe do dwóch pozostałych osi kartezjańskiego układu prostokątnego: poziomej osi 0x1 i pionowej osi 0x2.

Przestrzeń między tymi płaszczyznami nazwiemy systemem optycznym. Jest ona scharakteryzowana za pomocą funkcji nx1,x2,z - ”gęstości optycznej środowiska”, przez które przebiega promień świetlny. Będziemy dalej zakładać, że tory promieni świetlnych są krzywymi rzutującymi się dyfeomorficznie na oś optyczną t.j, że dopuszczają opis γz=x1z,x2z,z. Gęstość optyczna kształtuje tor następującą zasadą Fermata: promień świetlny opuszczający płaszczyznę A w punkcie x1z0,x2z0 i w kierunku wyznaczonym przez x˙1z0,x˙2z0 a następnie docierający do płaszczyzny B z analogicznymi współrzędnymi x1z1,x2z2,x˙1z1,x˙2z1 robi to tak, że minimalizuje ”długość optyczną”

Lγ=z0z1nx1,x2,zds=z0z1nx1,x2,z1+x˙12+x˙22dz (9.5)

gdzie x˙1 oznacza dx1dzz a x˙2 oznacza dx2dzz Mamy zatem zagadnienie wariacyjne z funkcją Lagrange'a

Lx1,x2,x˙1,x˙2,z=nx1,x2,z1+x˙12+x˙22 (9.6)

Wynik Hamiltona mówi, że po właściwej zmianie współrzędnych krzywe całkowe równań Eulera dla (9.5) są krzywymi całkowym ”gradientu symplektycznego”' funkcji L^. Omówimy kolejno dokonywaną zamianę współrzędnych, której istotą jest transformata Legendre'a oraz wyprowadzimy równania Hamiltona, odkładając geometryczną interpretację tej sytuacji do następnego wykładu.

9.3. Legendre'owska zamiana współrzędnych.

Lemat 9.1

Dla ustalonych z,x1,x2 funkcja (9.6) spełnia względem zmiennych x˙1,x˙2 warunek:

dz,x1,x2,x˙1,x˙22Lx˙1,x˙2>0.

Istotnie, otrzymujemy ( dla zwięzłości będziemy pisać n zamiast nx1,x2,z

Lx˙1=nx˙11+x˙12+x˙22;Lx˙2=nx˙21+x˙12+x˙22
2Lx˙12=n1+x˙221+x˙12+x˙22-3/2;2Lx˙22=n1+x˙121+x˙12+x˙22-3/2
2Lx˙2x˙1=-nx˙1x˙21+x˙12+x˙22-3/2

zatem druga różniczka L jest formą kwadratową o postaci:

d(z,x.y,x˙,y˙)2x˙1,x˙2=n1+x˙12+x˙22-3/21+x˙22x˙12-2x˙1x˙2x˙1x˙2+1+x˙12x˙22

ale dla

x˙1,x˙20,0

mamy

n1+x˙12+x˙22-3/2x˙2x˙1-x˙1x˙22+x˙12+x˙22>0.

Na mocy Lematu 9.1, ustalając zmienne z,x1,x2, możemy stosować Stwierdzenie 9.1 do funkcji:

fz,x1,x2x˙1,x˙2=Lz,x1,x2,x˙1,x˙2

określając odwzorowanie

αz,x1,x2:x˙1,x˙2Lx˙1z,x1,x2,x˙1,x˙2Lx˙2z,x1,x2,x˙1,x˙2=p1,p2 (9.7)

i odwzorowanie odwrotne

βz,x1,x2:p1,p2f^z,x1,x2,p1,p2p1,f^z,x1,x2,p1,p2p2=x˙1,x˙2 (9.8)

W dalszym ciągu, dla oszczędności miejsca, będziemy zapisywać

p1,p2=Lx˙1,Lx˙2orazx˙1,x˙2=L^p˙1,L^p˙2

9.4. Wyprowadzenie równań Hamiltona

Napiszmy układ równań Eulera dla funkcjonału (9.5)

Lxi-ddzLx˙i=0i=1,2 (9.9)

i zastąpmy w nim Lxi˙ przez nową zmienną pi (zgodnie z 9.7). Oznaczając dpidz przez p˙i i=1,2 możemy zapisać wtedy (9.9) w postaci:

p˙i=Lxii=1,2. (9.10)

Otrzymujemy w ten sposób pierwsze dwa równania. Ponieważ Lxi zależą od x1,x2,x˙1,x˙2, chcąc zastąpić x˙1,x˙2 przez p1,p2 możemy skorzystać z odwrotnej transformacji Legendre'a (9.8) dodając do (9.10) warunki

x˙i=L^z,x1,x2p˙i. (9.11)

To, że układ warunków (9.10) i (9.11) daje układ czterech równań określających funkcje xiz i piz wynika z następującego lematu.

Lemat 9.2

Niech dla ustalonych z,x1,x2 funkcja L^z,x1,x2,p1,p2 oznacza transformatę Legendre'a funkcji fz,x1,x2x˙1,x˙2.

Wtedy

dLdxiz,x1,x2,x˙1,x˙2=-dL^dxiz,x1,x2,p1,p2 (9.12)

Funkcje L oraz L^ związane są warunkiem

L^z,x1,x2,p1,p2=p1x˙1+p2x˙2-Lz,x1,x2,x˙1,x˙2. (9.13)

gdzie p1,p2=αx˙1,x˙2 przy ustalonych z,x1,x2.

Obliczając xi dla lewej strony (9.13) otrzymamy

L^xi+L^pip1xi+L^p2p2xii=1,2.

Dla prawej strony 9.13 otrzymamy wyrażenie

p1xix˙i+p2xix˙2-Lxii=1,2.

Ale

L^pjpjxi=x˙jpjxii,j=1,2

skąd wynika (9.12).

Na mocy lematu (9.4.) możemy więc przekształcić równanie (9.10), otrzymując ostateczny układ równań Hamiltona

p˙i=-L^xii=1,2x˙i=L^pii=1,2. (9.14)

Wobec tego trudność przejścia od opisu wariacyjnego z funkcją Lagrange'a L do opisu (9.14) polega na znalezieniu transformaty Legendre'a L^ funkcji L. Oczywiście cała procedura opiera się na założeniu, że przy ustalonych z,x1,x2 funkcja L jest funkcją wypukłą ze względu na zmienne x˙1 i x˙2.

Pokażemy teraz, jak wygląda L^ dla funkcji Lagrange'a

Lz,x1,x2,x˙1,x˙2=nz,x1,x21++x˙12+x˙22

W dalszym ciągu, dla zwięzłości, będziemy pisać n zamiast nz,x1,x2. Wtedy (por. dowód lematu 9.1)

pi=Lx˙i=nx˙i1+x˙12+x˙22i=1,2

skąd

x˙i=pin1+x˙12+x˙22

Zauważmy, że zachodzi tożsamość

n2-p12-p22=n21+x˙12+x˙22

a więc

1+x˙12+x˙22=nn2-p12-p22

i ostatecznie

L^p1,p2=p1x˙1+p2x˙2-Lx˙1,x˙2=p12+p22n2-p12-p22-n1+p12+p22n2-p12-p22=
=-n2-p12-p22

Podsumowując:

Stwierdzenie 9.6

Krzywe przebiegu promieni świetlnych

zx1z,x2z,x˙z,x˙2z

opisane przez zasadę wariacyjną 9.5 z funkcją Lagrange'a

Lz,x1,x2,x˙1,x˙2=nz,x1,x21++x˙12+x˙22

po zamianie zmiennych

z,x1,x2,x˙1,x˙2z,x1,x2,p1,p2

gdzie

pi=Lx˙i=nz,x1,x2x˙i1+x˙12+x˙22

przechodzą na krzywe całkowe układu 9.14, gdzie

L^z,x1,x2,p1,p2=-nz,x1,x2-p12-p22.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.