Zagadnienia

7.1 Wprowadzenie
7.2 Przykłady zagadnień wariacyjnych.
7.3 Punkty krytyczne i równania Eulera
7.4 Przykłady równań Eulera.

7. Rachunek wariacyjny, równania Eulera.

7.1. Wprowadzenie

Przedmiotem rachunku wariacyjnego są warunki ekstremalności funkcji (tradycyjnie nazywanych funkcjonałami), których dziedziną są rodziny obiektów geometrycznych (np. krzywe, powierzchnie) a wartości należą do Rk. Styk prezentowanej w tym wykładzie tematyki z rachunkiem wariacyjnym jest ograniczony do specjalnej sytuacji, którą charakteryzują poniższe założenia:

(A) Dziedziną badanego funkcjonału F jest rodzina W krzywych o wartościach w Rn, określonych na wspólnym przedziale t1,t2⊂R i mających wspólny początek i wspólny koniec. Wszystkie krzywe z W są ustalonej klasy gładkości.
(B) Rozważane funkcjonały mają postać

F⁢γ=∫t1t2L⁢γ⁢t,γ˙⁢t,t⁢d⁢t

(7.1)

gdzie γ∈W a L:Rn×Rn×R⟶Rk jest klasy C2.

dγ0⁢F=0

(7.2)

(zob. Uwaga 7.1).

Użycie określenia funkcjonał dla funkcji F miało zapewne na celu ułatwienie wysłowień, bo argumentami F są także funkcje. Konwencję tę podjęła też powstała później analiza funkcjonalna.

Uwaga 7.1

Warunek (7.2) wymaga komentarza: dziedzina W funkcjonału (7.1) jest podprzestrzenią afiniczną przestrzeni liniowej X, składającej się z wszystkich krzywych tej samej co dla W klasy gładkości, określonych na t1,t2. Istotnie, każdą krzywą γ∈W można jednoznacznie przedstawić w formie γ=γ0+δ, gdzie γ0 jest ustaloną krzywą z W a δ∈Y, gdzie Y=γ∈X:γ⁢t1=γ⁢t2=0 jest podprzestrzenią liniową X. Elementy Y będziemy nazywali wariacjami. Wracając do (7.2) ustalając γ0 możemy krzywe W zapisać w postaci γ=γ0+δ. Zatem F⁢γ=F⁢γ0+δ. Wprowadzając Φ⁢δ=F⁢γ0+δ-F⁢γ0 gdzie teraz Φ jest funkcjonałem na Y, redukujemy pytanie o stacjonarność γ0 dla F do pytania, czy d0⁢Φ=0.

Część rachunku wariacyjnego dotycząca założeń A,B,C przypomina więc fragment klasycznej analizy, dotyczący warunku koniecznego istnienia ekstremum. Sytuacja w rachunku wariacyjnym różni się tym, że dziedzina badanej funkcji jest nieskończenie wymiarowa. Za to same funkcje - ”funkcjonały” - są bardzo specjalnej postaci. Schemat uwarunkowany założeniami A,B,C jest krokiem wstępnym, poza który w zasadzie nie wyjdziemy. Jedynym wyjątkiem jest uogólnienie warunku A do takiego, w którym W jest zbiorem krzywych przyjmujących swoje wartości w podrozmaitościach M⊂R3. Ta sytuacja pojawia się przy badaniu układów z więzami.

7.2. Przykłady zagadnień wariacyjnych.

Niech W będzie rodziną krzywych klasy C1 określonych na [0,1] i przyjmujących wartości w R2. Załóżmy, że wszystkie nasze krzywe zaczynają się w punkcie (0, 1) a kończą w (1,0). Rozpatrzmy na R2 stałe pole wektorowe

F⁢x,y=0,-1.

(7.3)

Problem 7.1

Wśród krzywych rodziny W wskazać taką, żeby ruch po niej bez tarcia i pod wpływem pola F, zaczynający się od prędkości zero trwał możliwie jak najkrócej. Problem ten jest nazywany zagadnieniem krzywej najszybszego spadku (brachistochrony) z greckiego brachistos- najkrótszy, chronos - czas.

Uwaga 7.2

Ponieważ chodzi nam raczej o wprowadzenie do metod rachunku wariacyjnego niż o rozstrzygnięcie ogólnego pytania, ograniczymy się do krzywych, których zbiorem wartości są punkty o postaci x,f⁢x dla x∈0,1 gdzie funkcja f jest klasy C1, malejąca oraz f⁢0=1 i f⁢1=0. Zatem

γ⁢t=f⁢x⁢t.

(7.4)

Założymy ponadto, że x⁢0=0, x˙⁢0=0 i x˙⁢t>0 dla t>0. Dowód, że przy rozwiązywaniu Problemu 7.1 można się ograniczyć do krzywych o postaci (7.4) i rosnących funkcji x⁢t, pozostawimy czytelnikowi.

Dyskusja wstępna.

Zauważmy, że siła (7.3) spełnia warunek F⁢x,y=-g⁢r⁢a⁢d⁢⁢U⁢x,y przy
U⁢x,y=y. Zaczniemy od wyprowadzenia wzoru na czas potrzebny do przebycia ustalonej krzywej. Bez założenia, że f jest malejąca, formuła ta mogłaby dać nieskończony czas na przejście, co skomplikowałoby formalnie nasze wywody. Zgodnie z Ćwiczeniem 3.1, w ruchu bez tarcia po zadanej krzywej pod wpływem pola potencjalnego, jest zachowywana energia całkowita E=T+U, gdzie T jest energią kinetyczną o postaci

T⁢γ⁢t=12⁢⁢γ˙2⁢t

(przyjmujemy, że masa poruszającego się punktu wynosi 1). Ponieważ dla krzywej (7.4) zachodzi

γ˙⁢t=x˙⁢t,⁢d⁢fd⁢x⁢⁢x⁢t⋅x˙⁢t

(7.5)

otrzymamy:

E⁢t=12⁢x˙2⁢t⁢1+d⁢fd⁢x2⁢x⁢t+f⁢x⁢t

(7.6)

Z uwagi na to, że x˙⁢0=0, musi być E⁢t=E⁢0=f⁢1=1 zatem

x˙2⁢t⁢1+d⁢td⁢x2⁢x⁢t=2⁢1-f⁢x⁢t

a ponieważ x˙⁢t≥0 otrzymamy

d⁢xd⁢t=2⁢1-f⁢x1+d⁢fd⁢x2⁢x⁢t12.

Ponieważ chcemy znależć czas przebycia krzywej, napiszmy dla x≠0

d⁢td⁢x=1+f′⁢x22⁢1-f⁢x12

skąd F⁢γ=t⁢1 otrzymamy w formie

F⁢γ=12⁢∫011+f′⁢x21-f⁢x⁢d⁢x

(7.7)

Tak więc otrzymaliśmy funkcjonał (7.1) z funkcją L:R×R→R o postaci

L⁢γ,γ˙=12⁢1+γ˙1-γ

gdzie rolę zmiennej t pełni zmienna x przebiegająca przedział [0,1]. Drugie zadanie ”zagadnienie krzywej łańcuchowej” ma charakter statyczny. Przyjmijmy, że w R2 jest dane pole wektorowe we F⁢x,y=0,-1 i że w każdym interesującym nas punkcie siła działająca na masę m wynosi m⋅F⁢x,y. Wtedy energia potencjalna punktu o masie m jest U⁢x,y=m⁢y. W polu tym zawieszamy idealnie giętką linę (łańcuch) o stałej liniowej gęstości masy 1 i długości l≥2. Punktami zawieszenia liny będą -1,0 i 1,0.

Założenie

Przyjmiemy jako założenie, że zwisająca lina przyjmuje kształt, przy którym suma (całka) energii potencjalnych wszystkich jej punktów zwana dalej ”potencjałem sumarycznym” jest możliwie najmniejsza.

Problem 7.2

Opisać krzywą zwisu liny.

Dyskusja wstępna.

Podobnie, jak poprzednio (por. Uwaga 7.2), przyjmiemy, że krzywa zwisu liny opisana jest jako wykres funkcji g należacej do zbioru W funkcji różniczkowalnych o ciągłej pochodnej na przedziale [-1,1] i przyjmujących wartość 0 na końcach przedziału.

Z przedstawionych powyżej założeń wynika, że odcinek d⁢s liny znajdujący się na wysokości g⁢x ma energię potencjalną równą g⁢x⋅d⁢s, gdzie

d⁢s=d⁢x2+d⁢y2=1+y′⁢x2.

Zatem, ”potencjał sumaryczny” ma postać:

V⁢g=∫-11g⁢x⋅1+g′⁢x2⁢d⁢x.

(7.8)

Tego typu funkcja V nie byłaby oczywiście ograniczona z dołu na W gdyby nie dodatkowy warunek, że długość liny wynosi l. Warunek ten ma postać Φ⁢g=l, gdzie

Φ⁢g=∫111+g′⁢x2⁢d⁢x.

(7.9)

Naszym zadaniem jest więc znalezienie punktów krytycznych funkcjonału V na poziomicy

N=g∈W:Φ⁢g=l

Podobnie, jak przy badaniu ekstremów warunkowych w analizie, rozwiążemy ten problem metodą mnożników Lagrange'a.

Polega ona na rozpatrzeniu rodziny funkcjonałów Fλ, o postaci

Fλ⁢g=V⁢g+λ⁢Φ⁢g

gdzie parametr λ∈R Dla każdego z tych funkcjonałów szukamy punktów krytycznych leżących na N. Wyjaśnienie tego jest następujące:

Jeżeli dg0⁢Fλ=0 dla g0∈N, to z uwagi na fakt, że różniczka dg0⁢Φ, ograniczona do przestrzeni stycznej w g0 do N jest zerowa, warunek dg0⁢Fλ=0 pociąga, że dg0⁢V=0 na tejże przestrzeni stycznej. Jednocześnie właściwy dobór λ umożliwia uzyskanie warunku dg0⁢Fλ=0 także na przestrzeni prostopadłej do N w punkcie g0.

Podsumowując: pierwszym krokiem do rozwiązania Problemu 7.2 jest znalezienie należących do N punktów krytycznych funkcjonałów

Fλ⁢g=∫-11g⁢x+λ⁢1+g′⁢x2⁢d⁢x

(7.10)

Widzimy, więc że funkcjonały Fλ mają postać (7.1), gdzie Lλ:R×R ma postać

Lλ⁢γ,γ˙=γ+λ⁢1+γ˙2.

(7.11)

7.3. Punkty krytyczne i równania Eulera

Będziemy poszukiwać warunków, przy których krzywa γ0 jest punktem krytycznym funkcjonału

F⁢γ=∫t1t2L⁢γ,γ˙⁢d⁢t

(7.12)

Pisząc γ=γ0+δ, redukujemy nasz problem do pytania czy funkcjonał

ϕ⁢δ=F⁢γ0+δ-F⁢γ0=∫tt2L⁢γ0+δ,γ0+δ˙-L⁢γ0,δ˙0⁢d⁢t

(7.13)

ma w punkcie δ0=0∈Y punkt krytyczny. ( Y jest tutaj przestrzenią liniową wariacji - zob. Uwagę 7.1.)

Wyposażmy Y w w strukturę przestrzeni Banacha, wprowadzając C1 normę:

δC1=t1≤t≤t2s⁢u⁢p⁢δ⁢t12⁢+t1≤t≤t2s⁢u⁢p⁢⁢δ˙⁢t2,

(7.14)

gdzie |⋅|2 oznacza normę euklidesową w Rn. Zamierzamy zapisać Φ⁢δ w postaci

Φ⁢δ=d0⁢Φ⁢δ+R⁢δ,

(7.15)

gdzie d0⁢Φ⁢δ jest ciągłą w normie (7.14) operacją liniową, natomiast R spełnia warunek:

l⁢i⁢mδC1→0R⁢δC1δC1=0

(7.16)

Definicja 7.1

Powiemy, że funkcjonał (7.12) jest różniczkowalny w γ0(lub, że (7.13) jest różniczkowalny w 0), jeżeli przestawienie (7.15) z warunkiem (7.16) jest możliwe. Operacja liniowa d0⁢Φ jest wtedy wyznaczona jednoznacznie i nazywa się różniczką Φ w 0 (lub różniczką F w γ0). Powiemy, że γ0 jest punktem krytycznym Φ jeżeli d0⁢Φ=0 (tj. d0⁢Φ⁢δ=0 dla każdego δ).

Twierdzenie 7.1

Jeżeli F jest postaci (7.12), gdzie funkcja L jest klasy C2, to dla każdego γ0 istnieje dγ0⁢F. Na to, aby krzywa γ była punktem krytycznym F potrzeba i wystarcza, by spełniała ona układ równań :

∂⁡L∂⁡xj(γ(t),γ˙(t))-dd⁢t(∂⁡L∂⁡γ˙j(γ(t),γ˙(t)))=0j=1,2,..n.

(7.17)

Równania powyższe noszą nazwę równań Eulera.

Ustalimy najpierw możliwą postać operacji d0⁢ϕ, występującej w formule (7.15).

Oznaczmy zmienne, od których zależy L jako x=x1,…,xn,v1,…,vn. Wtedy zgodnie ze wzorem Taylora dla przyrostu △⁢x=△⁢x1,…,△⁢xn,△⁢v1,…,△⁢vn zachodzi

L⁢x+△⁢x-L⁢x=∑i=1n∂⁡L∂⁡xi⁢x⋅△⁢xi+∂⁡L∂⁡vi⁢vi⋅△⁢vi+R2⁢△⁢x

gdzie

R2⁢△⁢x△⁢x2⟶0

(7.18)

gdy △⁢x2 dąży do zera, a |⋅|2 jest normą euklidesową w R2⁢n.

Podstawiając xi=γi⁢t,v1=γ˙i⁢t oraz △⁢xi=δi⁢t,△⁢vi=δ˙i⁢t przy ustalonym t i dla i=1,2..,n oraz wycałkowując po t otrzymamy, zgodnie z (7.13):

Φ⁢δ=∫t1t2∑i=1n∂⁡L∂⁡xi⁢γ⁢t,γ˙⁢t⋅δi⁢t+∂⁡L∂⁡vi⁢γ⁢t,γ˙⁢t⁢δ˙i⁢t⁢d⁢t+∫t1t2R2⁢δ⁢t,δ˙⁢t⁢d⁢t

(7.19)

Część pierwsza, po prawej stronie równości (7.19) zależy liniowo od δ⁢t i przyjmujemy ją jako d0⁢Φ. Także odpowiednio przyjmujemy

R⁢δ=∫t1t2R2⁢δ⁢t,δ˙⁢t⁢d⁢t.

(7.20)

Mamy wtedy

|d0Φ(δ)|≤∑i=1n(s⁢u⁢pt1≤t≤t2∂⁡L∂⁡xi(γ(t),γ˙(t))+s⁢u⁢pt1≤t≤t2∂⁡L∂⁡xi(γ(t),γ˙(t))⋅)||δ||C1≤M||δ||C1

gdzie M jest stałą zależną Φ. Zatem d0⁢Φ jest ciągłym funkcjonałem liniowym. Pokażemy, że reszta R spełnia warunek (7.16). Zauważmy najpierw, że dla każdego ustalonego t

|δ1(t),…,δn(t),δ˙1(t),…δ˙n(t)|2≤2⁢n||δ||C1.

Więc na mocy (7.14), (7.18) i (7.20) otrzymamy:

R⁢δδC′≤2⁢n⁢⁢∫t1t2R2⁢δ⁢t,δ˙⁢t|δ1(t),…,δn(t),δ˙1(t),…δ˙n(t)|2⁢d⁢t→0,

przy δC1⟶0.
Przejdźmy do wyprowadzenia równań (7.17). Warunek d0⁢Φ=0 oznacza, że dla każdego δ∈Y zachodzi:

0=d0⁢Φ⁢δ=∫t1t2∑i=1n∂⁡L∂⁡xi⁢γ⁢t,γ˙⁢t⁢δi⁢t+∂⁡L∂⁡vi⁢γ⁢t,γ˙⁢t⁢δ˙i⁢t⁢d⁢t

Całkując przez części drugie człony składników sumy oraz uwzględniając, że δi⁢t1=δi⁢t2=0 otrzymamy:

∫t1t2(∑i=1n∂⁡L∂⁡xi(γ(t),γ˙(t))-dd⁢t∂⁡L∂⁡v1(γ(t),γ˙(t))δi(t)dt=0.

(7.21)

Przyjmując jako δ⁢t kolejno krzywe o postaci 0,…︸j-1,δj⁢t,0..0, gdzie δj może być dowolną funkcją różniczkowalną taką, że z δj⁢t1=δj⁢t2=0, otrzymamy n niezależnych warunków

∫t1t2(∂⁡L∂⁡xj(γ(t),γ˙(t))-dd⁢t∂⁡L∂⁡vj(γ(t),γ˙(t))δj(t)dt=0.

(7.22)

j=1,2,…,n.

∎

Nietrudne rozumowanie pokazuje, że j-ty warunek (7.22) jest równoważny j-temu równaniu Eulera. Odwrotnie: spełnienie równań Eulera daje równania (7.22) a te przez wysumowanie warunek (7.21), z którego wynika z kolei, że d0⁢Φ=0.

Uwaga 7.3

Chcąc uniknąć wprowadzania zmiennych x1,…⁢xn oraz v1,…⁢vn zapisuje się równania, utożsamiając xi z γi oraz vi z γ˙i w postaci (7.17).

7.4. Przykłady równań Eulera.

Na zakończenie napiszemy równania Eulera dla zagadnienia brachistochrony i zagadnienia krzywej łańcuchowej.

Przykład 7.1

Równanie Eulera dla zagadnienia brachistochomy.

Mamy znaleźć funkcję f argumentu x , który pełni rolę zmiennej t w równianiach Eulera (zobacz sformułowanie Twierdzenia 7.1). Będziemy pisać f zamiast γ oraz f˙ zamiast γ˙. Nasza funkcja Lagrange'a ma zatem postać:

L⁢f,f˙=1+f˙21-f12.

Wtedy

∂⁡L∂⁡f⁢f,f˙=12⁢1+f˙21-f-12⁢1+f˙21-f2

oraz

∂⁡L∂⁡f˙⁢f,f˙=1+f˙21-f-12⋅f˙1-f.

Równanie Eulera

∂⁡L∂⁡f-dd⁢x⁢∂⁡L∂⁡f˙=0

przyjmie więc postać

12⁢1+d⁢fd⁢x21-f-12⋅1+d⁢fd⁢x21-f2+dd⁢x⁢1+d⁢fd⁢x21-f-12⋅d⁢fd⁢x1-f=0

(7.23)

Przykład 7.2

Równanie Eulera dla krzywej łańcuchowej.

Podobnie, jak poprzednio, rolę t w równaniach Eulera pełni zmienna x, natomiast zamiast x1 napiszemy γ a zamiast v1 napiszemy d⁢gd⁢x=g˙. Funkcja Lagrange'a z mnożnikiem λ ma postać:

Lλ⁢g,g˙=g+λ⁢1+g˙2.

Wtedy

∂⁡Lλ∂⁡g=1+g˙2;∂⁡Lλ∂⁡g˙=g˙⁢g+λ1+g˙2.

Zatem równania Eulera mają postać :

1+d⁢gd⁢x2-dd⁢x⁢d⁢gd⁢x⁢g+λ1+d⁢yd⁢x2=0.

(7.24)

Uwaga 7.4

Zarówno równanie (7.23) jak (7.24) mają bardzo skomplikowaną postać i raczej nie ma szans rozwiązać Problemów 1 i 2 na tej drodze. Znacznie prostszą metodę podamy w następnym wykładzie.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Matematyczne metody mechaniki