Zagadnienia

7. Rachunek wariacyjny, równania Eulera.

7.1. Wprowadzenie

Przedmiotem rachunku wariacyjnego są warunki ekstremalności funkcji (tradycyjnie nazywanych funkcjonałami), których dziedziną są rodziny obiektów geometrycznych (np. krzywe, powierzchnie) a wartości należą do Rk. Styk prezentowanej w tym wykładzie tematyki z rachunkiem wariacyjnym jest ograniczony do specjalnej sytuacji, którą charakteryzują poniższe założenia:

(A) Dziedziną badanego funkcjonału F jest rodzina W krzywych o wartościach w Rn, określonych na wspólnym przedziale t1,t2R i mających wspólny początek i wspólny koniec. Wszystkie krzywe z W są ustalonej klasy gładkości.
(B) Rozważane funkcjonały mają postać

Fγ=t1t2Lγt,γ˙t,tdt (7.1)

gdzie γW a L:Rn×Rn×RRk jest klasy C2.

(C) Rozważanym problemem jest charakteryzacja punktów stacjonarnych funkcjonału F, tj. takich γ0W, że

dγ0F=0 (7.2)

(zob. Uwaga 7.1).

Użycie określenia funkcjonał dla funkcji F miało zapewne na celu ułatwienie wysłowień, bo argumentami F są także funkcje. Konwencję tę podjęła też powstała później analiza funkcjonalna.

Uwaga 7.1

Warunek (7.2) wymaga komentarza: dziedzina W funkcjonału (7.1) jest podprzestrzenią afiniczną przestrzeni liniowej X, składającej się z wszystkich krzywych tej samej co dla W klasy gładkości, określonych na t1,t2. Istotnie, każdą krzywą γW można jednoznacznie przedstawić w formie γ=γ0+δ, gdzie γ0 jest ustaloną krzywą z W a δY, gdzie Y=γX:γt1=γt2=0 jest podprzestrzenią liniową X. Elementy Y będziemy nazywali wariacjami. Wracając do (7.2) ustalając γ0 możemy krzywe W zapisać w postaci γ=γ0+δ. Zatem Fγ=Fγ0+δ. Wprowadzając Φδ=Fγ0+δ-Fγ0 gdzie teraz Φ jest funkcjonałem na Y, redukujemy pytanie o stacjonarność γ0 dla F do pytania, czy d0Φ=0.

Część rachunku wariacyjnego dotycząca założeń A,B,C przypomina więc fragment klasycznej analizy, dotyczący warunku koniecznego istnienia ekstremum. Sytuacja w rachunku wariacyjnym różni się tym, że dziedzina badanej funkcji jest nieskończenie wymiarowa. Za to same funkcje - ”funkcjonały” - są bardzo specjalnej postaci. Schemat uwarunkowany założeniami A,B,C jest krokiem wstępnym, poza który w zasadzie nie wyjdziemy. Jedynym wyjątkiem jest uogólnienie warunku A do takiego, w którym W jest zbiorem krzywych przyjmujących swoje wartości w podrozmaitościach MR3. Ta sytuacja pojawia się przy badaniu układów z więzami.

7.2. Przykłady zagadnień wariacyjnych.

Niech W będzie rodziną krzywych klasy C1 określonych na [0,1] i przyjmujących wartości w R2. Załóżmy, że wszystkie nasze krzywe zaczynają się w punkcie (0, 1) a kończą w (1,0). Rozpatrzmy na R2 stałe pole wektorowe

Fx,y=0,-1. (7.3)
Problem 7.1

Wśród krzywych rodziny W wskazać taką, żeby ruch po niej bez tarcia i pod wpływem pola F, zaczynający się od prędkości zero trwał możliwie jak najkrócej. Problem ten jest nazywany zagadnieniem krzywej najszybszego spadku (brachistochrony) z greckiego brachistos- najkrótszy, chronos - czas.

Uwaga 7.2

Ponieważ chodzi nam raczej o wprowadzenie do metod rachunku wariacyjnego niż o rozstrzygnięcie ogólnego pytania, ograniczymy się do krzywych, których zbiorem wartości są punkty o postaci x,fx dla x0,1 gdzie funkcja f jest klasy C1, malejąca oraz f0=1 i f1=0. Zatem

γt=fxt. (7.4)

Założymy ponadto, że x0=0, x˙0=0 i x˙t>0 dla t>0. Dowód, że przy rozwiązywaniu Problemu 7.1 można się ograniczyć do krzywych o postaci (7.4) i rosnących funkcji xt, pozostawimy czytelnikowi.

Dyskusja wstępna.

Zauważmy, że siła (7.3) spełnia warunek Fx,y=-gradUx,y przy
Ux,y=y. Zaczniemy od wyprowadzenia wzoru na czas potrzebny do przebycia ustalonej krzywej. Bez założenia, że f jest malejąca, formuła ta mogłaby dać nieskończony czas na przejście, co skomplikowałoby formalnie nasze wywody. Zgodnie z Ćwiczeniem 3.1, w ruchu bez tarcia po zadanej krzywej pod wpływem pola potencjalnego, jest zachowywana energia całkowita E=T+U, gdzie T jest energią kinetyczną o postaci

Tγt=12γ˙2t

(przyjmujemy, że masa poruszającego się punktu wynosi 1). Ponieważ dla krzywej (7.4) zachodzi

γ˙t=x˙t,dfdxxtx˙t (7.5)

otrzymamy:

Et=12x˙2t1+dfdx2xt+fxt (7.6)

Z uwagi na to, że x˙0=0, musi być Et=E0=f1=1 zatem

x˙2t1+dtdx2xt=21-fxt

a ponieważ x˙t0 otrzymamy

dxdt=21-fx1+dfdx2xt12.

Ponieważ chcemy znależć czas przebycia krzywej, napiszmy dla x0

dtdx=1+fx221-fx12

skąd Fγ=t1 otrzymamy w formie

Fγ=12011+fx21-fxdx (7.7)

Tak więc otrzymaliśmy funkcjonał (7.1) z funkcją L:R×RR o postaci

Lγ,γ˙=121+γ˙1-γ

gdzie rolę zmiennej t pełni zmienna x przebiegająca przedział [0,1]. Drugie zadanie ”zagadnienie krzywej łańcuchowej” ma charakter statyczny. Przyjmijmy, że w R2 jest dane pole wektorowe we Fx,y=0,-1 i że w każdym interesującym nas punkcie siła działająca na masę m wynosi mFx,y. Wtedy energia potencjalna punktu o masie m jest Ux,y=my. W polu tym zawieszamy idealnie giętką linę (łańcuch) o stałej liniowej gęstości masy 1 i długości l2. Punktami zawieszenia liny będą -1,0 i 1,0.

Założenie

Przyjmiemy jako założenie, że zwisająca lina przyjmuje kształt, przy którym suma (całka) energii potencjalnych wszystkich jej punktów zwana dalej ”potencjałem sumarycznym” jest możliwie najmniejsza.

Problem 7.2

Opisać krzywą zwisu liny.

Dyskusja wstępna.

Podobnie, jak poprzednio (por. Uwaga 7.2), przyjmiemy, że krzywa zwisu liny opisana jest jako wykres funkcji g należacej do zbioru W funkcji różniczkowalnych o ciągłej pochodnej na przedziale [-1,1] i przyjmujących wartość 0 na końcach przedziału.

Z przedstawionych powyżej założeń wynika, że odcinek ds liny znajdujący się na wysokości gx ma energię potencjalną równą gxds, gdzie

ds=dx2+dy2=1+yx2.

Zatem, ”potencjał sumaryczny” ma postać:

Vg=-11gx1+gx2dx. (7.8)

Tego typu funkcja V nie byłaby oczywiście ograniczona z dołu na W gdyby nie dodatkowy warunek, że długość liny wynosi l. Warunek ten ma postać Φg=l, gdzie

Φg=111+gx2dx. (7.9)

Naszym zadaniem jest więc znalezienie punktów krytycznych funkcjonału V na poziomicy

N=gW:Φg=l

Podobnie, jak przy badaniu ekstremów warunkowych w analizie, rozwiążemy ten problem metodą mnożników Lagrange'a.

Polega ona na rozpatrzeniu rodziny funkcjonałów Fλ, o postaci

Fλg=Vg+λΦg

gdzie parametr λR Dla każdego z tych funkcjonałów szukamy punktów krytycznych leżących na N. Wyjaśnienie tego jest następujące:

Jeżeli dg0Fλ=0 dla g0N, to z uwagi na fakt, że różniczka dg0Φ, ograniczona do przestrzeni stycznej w g0 do N jest zerowa, warunek dg0Fλ=0 pociąga, że dg0V=0 na tejże przestrzeni stycznej. Jednocześnie właściwy dobór λ umożliwia uzyskanie warunku dg0Fλ=0 także na przestrzeni prostopadłej do N w punkcie g0.

Podsumowując: pierwszym krokiem do rozwiązania Problemu 7.2 jest znalezienie należących do N punktów krytycznych funkcjonałów

Fλg=-11gx+λ1+gx2dx (7.10)

Widzimy, więc że funkcjonały Fλ mają postać (7.1), gdzie Lλ:R×R ma postać

Lλγ,γ˙=γ+λ1+γ˙2. (7.11)

7.3. Punkty krytyczne i równania Eulera

Będziemy poszukiwać warunków, przy których krzywa γ0 jest punktem krytycznym funkcjonału

Fγ=t1t2Lγ,γ˙dt (7.12)

Pisząc γ=γ0+δ, redukujemy nasz problem do pytania czy funkcjonał

ϕδ=Fγ0+δ-Fγ0=tt2Lγ0+δ,γ0+δ˙-Lγ0,δ˙0dt (7.13)

ma w punkcie δ0=0Y punkt krytyczny. ( Y jest tutaj przestrzenią liniową wariacji - zob. Uwagę 7.1.)

Wyposażmy Y w w strukturę przestrzeni Banacha, wprowadzając C1 normę:

δC1=t1tt2supδt12+t1tt2supδ˙t2, (7.14)

gdzie ||2 oznacza normę euklidesową w Rn. Zamierzamy zapisać Φδ w postaci

Φδ=d0Φδ+Rδ, (7.15)

gdzie d0Φδ jest ciągłą w normie (7.14) operacją liniową, natomiast R spełnia warunek:

limδC10RδC1δC1=0 (7.16)
Definicja 7.1

Powiemy, że funkcjonał (7.12) jest różniczkowalny w γ0(lub, że (7.13) jest różniczkowalny w 0), jeżeli przestawienie (7.15) z warunkiem (7.16) jest możliwe. Operacja liniowa d0Φ jest wtedy wyznaczona jednoznacznie i nazywa się różniczką Φ w 0 (lub różniczką F w γ0). Powiemy, że γ0 jest punktem krytycznym Φ jeżeli d0Φ=0 (tj. d0Φδ=0 dla każdego δ).

Twierdzenie 7.1

Jeżeli F jest postaci (7.12), gdzie funkcja L jest klasy C2, to dla każdego γ0 istnieje dγ0F. Na to, aby krzywa γ była punktem krytycznym F potrzeba i wystarcza, by spełniała ona układ równań :

Lxj(γ(t),γ˙(t))-ddt(Lγ˙j(γ(t),γ˙(t)))=0j=1,2,..n. (7.17)

Równania powyższe noszą nazwę równań Eulera.

Ustalimy najpierw możliwą postać operacji d0ϕ, występującej w formule (7.15).

Oznaczmy zmienne, od których zależy L jako x=x1,,xn,v1,,vn. Wtedy zgodnie ze wzorem Taylora dla przyrostu x=x1,,xn,v1,,vn zachodzi

Lx+x-Lx=i=1nLxixxi+Lvivivi+R2x

gdzie

R2xx20 (7.18)

gdy x2 dąży do zera, a ||2 jest normą euklidesową w R2n.

Podstawiając xi=γit,v1=γ˙it oraz xi=δit,vi=δ˙it przy ustalonym t i dla i=1,2..,n oraz wycałkowując po t otrzymamy, zgodnie z (7.13):

Φδ=t1t2i=1nLxiγt,γ˙tδit+Lviγt,γ˙tδ˙itdt+t1t2R2δt,δ˙tdt (7.19)

Część pierwsza, po prawej stronie równości (7.19) zależy liniowo od δt i przyjmujemy ją jako d0Φ. Także odpowiednio przyjmujemy

Rδ=t1t2R2δt,δ˙tdt. (7.20)

Mamy wtedy

|d0Φ(δ)|i=1n(supt1tt2Lxi(γ(t),γ˙(t))+supt1tt2Lxi(γ(t),γ˙(t)))||δ||C1M||δ||C1

gdzie M jest stałą zależną Φ. Zatem d0Φ jest ciągłym funkcjonałem liniowym. Pokażemy, że reszta R spełnia warunek (7.16). Zauważmy najpierw, że dla każdego ustalonego t

|δ1(t),,δn(t),δ˙1(t),δ˙n(t)|22n||δ||C1.

Więc na mocy (7.14), (7.18) i (7.20) otrzymamy:

RδδC2nt1t2R2δt,δ˙t|δ1(t),,δn(t),δ˙1(t),δ˙n(t)|2dt0,

przy δC10.
Przejdźmy do wyprowadzenia równań (7.17). Warunek d0Φ=0 oznacza, że dla każdego δY zachodzi:

0=d0Φδ=t1t2i=1nLxiγt,γ˙tδit+Lviγt,γ˙tδ˙itdt

Całkując przez części drugie człony składników sumy oraz uwzględniając, że δit1=δit2=0 otrzymamy:

t1t2(i=1nLxi(γ(t),γ˙(t))-ddtLv1(γ(t),γ˙(t))δi(t)dt=0. (7.21)

Przyjmując jako δt kolejno krzywe o postaci 0,j-1,δjt,0..0, gdzie δj może być dowolną funkcją różniczkowalną taką, że z δjt1=δjt2=0, otrzymamy n niezależnych warunków

t1t2(Lxj(γ(t),γ˙(t))-ddtLvj(γ(t),γ˙(t))δj(t)dt=0. (7.22)

j=1,2,,n.

Nietrudne rozumowanie pokazuje, że j-ty warunek (7.22) jest równoważny j-temu równaniu Eulera. Odwrotnie: spełnienie równań Eulera daje równania (7.22) a te przez wysumowanie warunek (7.21), z którego wynika z kolei, że d0Φ=0.

Uwaga 7.3

Chcąc uniknąć wprowadzania zmiennych x1,xn oraz v1,vn zapisuje się równania, utożsamiając xi z γi oraz vi z γ˙i w postaci (7.17).

7.4. Przykłady równań Eulera.

Na zakończenie napiszemy równania Eulera dla zagadnienia brachistochrony i zagadnienia krzywej łańcuchowej.

Przykład 7.1

Równanie Eulera dla zagadnienia brachistochomy.

Mamy znaleźć funkcję f argumentu x , który pełni rolę zmiennej t w równianiach Eulera (zobacz sformułowanie Twierdzenia 7.1). Będziemy pisać f zamiast γ oraz f˙ zamiast γ˙. Nasza funkcja Lagrange'a ma zatem postać:

Lf,f˙=1+f˙21-f12.

Wtedy

Lff,f˙=121+f˙21-f-121+f˙21-f2

oraz

Lf˙f,f˙=1+f˙21-f-12f˙1-f.

Równanie Eulera

Lf-ddxLf˙=0

przyjmie więc postać

121+dfdx21-f-121+dfdx21-f2+ddx1+dfdx21-f-12dfdx1-f=0 (7.23)
Przykład 7.2

Równanie Eulera dla krzywej łańcuchowej.

Podobnie, jak poprzednio, rolę t w równaniach Eulera pełni zmienna x, natomiast zamiast x1 napiszemy γ a zamiast v1 napiszemy dgdx=g˙. Funkcja Lagrange'a z mnożnikiem λ ma postać:

Lλg,g˙=g+λ1+g˙2.

Wtedy

Lλg=1+g˙2;Lλg˙=g˙g+λ1+g˙2.

Zatem równania Eulera mają postać :

1+dgdx2-ddxdgdxg+λ1+dydx2=0. (7.24)
Uwaga 7.4

Zarówno równanie (7.23) jak (7.24) mają bardzo skomplikowaną postać i raczej nie ma szans rozwiązać Problemów 1 i 2 na tej drodze. Znacznie prostszą metodę podamy w następnym wykładzie.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.