7.1. Wprowadzenie
Przedmiotem rachunku wariacyjnego są warunki ekstremalności funkcji (tradycyjnie nazywanych funkcjonałami), których dziedziną są rodziny obiektów geometrycznych (np. krzywe, powierzchnie) a wartości należą do Rk.
Styk prezentowanej w tym wykładzie tematyki z rachunkiem wariacyjnym jest ograniczony do specjalnej sytuacji, którą charakteryzują poniższe założenia:
(A) Dziedziną badanego funkcjonału F jest rodzina W krzywych o wartościach w Rn, określonych na wspólnym przedziale t1,t2⊂R i mających wspólny początek i wspólny koniec. Wszystkie krzywe z W są ustalonej klasy gładkości.
(B) Rozważane funkcjonały mają postać
|
Fγ=∫t1t2Lγt,γ˙t,tdt |
| (7.1) |
gdzie γ∈W a L:Rn×Rn×R⟶Rk jest klasy C2.
(C) Rozważanym problemem jest charakteryzacja punktów stacjonarnych funkcjonału F, tj. takich γ0∈W, że
Użycie określenia funkcjonał dla funkcji F miało zapewne na celu ułatwienie wysłowień, bo argumentami F są także funkcje. Konwencję tę podjęła też powstała później analiza funkcjonalna.
Uwaga 7.1
Warunek (7.2) wymaga komentarza: dziedzina W funkcjonału (7.1) jest podprzestrzenią afiniczną przestrzeni liniowej X, składającej się z wszystkich krzywych tej samej co dla W klasy gładkości, określonych na t1,t2. Istotnie, każdą krzywą γ∈W można jednoznacznie przedstawić w formie γ=γ0+δ, gdzie γ0 jest ustaloną krzywą z W a δ∈Y, gdzie Y=γ∈X:γt1=γt2=0 jest podprzestrzenią liniową X. Elementy Y będziemy nazywali wariacjami. Wracając do (7.2) ustalając γ0 możemy krzywe W zapisać w postaci γ=γ0+δ. Zatem Fγ=Fγ0+δ. Wprowadzając Φδ=Fγ0+δ-Fγ0 gdzie teraz Φ jest funkcjonałem na Y, redukujemy pytanie o stacjonarność γ0 dla F do pytania, czy d0Φ=0.
Część rachunku wariacyjnego dotycząca założeń A,B,C przypomina więc fragment klasycznej analizy, dotyczący warunku koniecznego istnienia ekstremum.
Sytuacja w rachunku wariacyjnym różni się tym, że dziedzina badanej funkcji jest nieskończenie wymiarowa. Za to same funkcje - ”funkcjonały” - są bardzo specjalnej postaci. Schemat uwarunkowany założeniami A,B,C jest krokiem wstępnym, poza który w zasadzie nie wyjdziemy. Jedynym wyjątkiem jest uogólnienie warunku A do takiego, w którym W jest zbiorem krzywych przyjmujących swoje wartości w podrozmaitościach M⊂R3. Ta sytuacja pojawia się przy badaniu układów z więzami.
7.2. Przykłady zagadnień wariacyjnych.
Niech W będzie rodziną krzywych klasy C1 określonych na [0,1] i przyjmujących wartości w R2. Załóżmy, że wszystkie nasze krzywe zaczynają się w punkcie (0, 1) a kończą w (1,0). Rozpatrzmy na R2 stałe pole wektorowe
Problem 7.1
Wśród krzywych rodziny W wskazać taką, żeby ruch po niej bez tarcia i pod wpływem pola F, zaczynający się od prędkości zero trwał możliwie jak najkrócej.
Problem ten jest nazywany zagadnieniem krzywej najszybszego spadku (brachistochrony) z greckiego brachistos- najkrótszy, chronos - czas.
Uwaga 7.2
Ponieważ chodzi nam raczej o wprowadzenie do metod rachunku wariacyjnego niż o rozstrzygnięcie ogólnego pytania, ograniczymy się do krzywych, których zbiorem wartości są punkty o postaci x,fx dla x∈0,1 gdzie funkcja f jest klasy C1, malejąca oraz f0=1 i f1=0. Zatem
Założymy ponadto, że x0=0, x˙0=0 i x˙t>0 dla t>0. Dowód, że przy rozwiązywaniu Problemu 7.1 można się ograniczyć do krzywych o postaci (7.4) i rosnących funkcji xt, pozostawimy czytelnikowi.
Zauważmy, że siła (7.3) spełnia warunek Fx,y=-gradUx,y przy
Ux,y=y.
Zaczniemy od wyprowadzenia wzoru na czas potrzebny do przebycia ustalonej krzywej. Bez założenia, że f jest malejąca, formuła ta mogłaby dać nieskończony czas na przejście, co skomplikowałoby formalnie nasze wywody.
Zgodnie z Ćwiczeniem 3.1, w ruchu bez tarcia po zadanej krzywej pod wpływem pola potencjalnego, jest zachowywana energia całkowita E=T+U, gdzie T jest energią kinetyczną o postaci
(przyjmujemy, że masa poruszającego się punktu wynosi 1).
Ponieważ dla krzywej (7.4) zachodzi
|
γ˙t=x˙t,dfdxxt⋅x˙t |
| (7.5) |
|
Et=12x˙2t1+dfdx2xt+fxt |
| (7.6) |
Z uwagi na to, że x˙0=0, musi być Et=E0=f1=1 zatem
|
x˙2t1+dtdx2xt=21-fxt |
|
a ponieważ x˙t≥0 otrzymamy
|
dxdt=21-fx1+dfdx2xt12. |
|
Ponieważ chcemy znależć czas przebycia krzywej, napiszmy dla x≠0
skąd Fγ=t1 otrzymamy w formie
|
Fγ=12∫011+f′x21-fxdx |
| (7.7) |
Tak więc otrzymaliśmy funkcjonał (7.1) z funkcją L:R×R→R o postaci
gdzie rolę zmiennej t pełni zmienna x przebiegająca przedział [0,1].
Drugie zadanie ”zagadnienie krzywej łańcuchowej” ma charakter statyczny. Przyjmijmy, że w R2 jest dane pole wektorowe we Fx,y=0,-1 i że w każdym interesującym nas punkcie siła działająca na masę m wynosi m⋅Fx,y. Wtedy energia potencjalna punktu o masie m jest Ux,y=my. W polu tym zawieszamy idealnie giętką linę (łańcuch) o stałej liniowej gęstości masy 1 i długości l≥2. Punktami zawieszenia liny będą -1,0 i 1,0.
Przyjmiemy jako założenie, że zwisająca lina przyjmuje kształt, przy którym suma (całka) energii potencjalnych wszystkich jej punktów zwana dalej ”potencjałem sumarycznym” jest możliwie najmniejsza.
Problem 7.2
Opisać krzywą zwisu liny.
Podobnie, jak poprzednio (por. Uwaga 7.2), przyjmiemy, że krzywa zwisu liny opisana jest jako wykres funkcji g należacej do zbioru W funkcji różniczkowalnych o ciągłej pochodnej na przedziale [-1,1] i przyjmujących wartość 0 na końcach przedziału.
Z przedstawionych powyżej założeń wynika, że odcinek ds liny znajdujący się na wysokości gx ma energię potencjalną równą gx⋅ds, gdzie
Zatem, ”potencjał sumaryczny” ma postać:
|
Vg=∫-11gx⋅1+g′x2dx. |
| (7.8) |
Tego typu funkcja V nie byłaby oczywiście ograniczona z dołu na W gdyby nie dodatkowy warunek, że długość liny wynosi l. Warunek ten ma postać Φg=l, gdzie
|
Φg=∫111+g′x2dx. |
| (7.9) |
Naszym zadaniem jest więc znalezienie punktów krytycznych funkcjonału V na poziomicy
Podobnie, jak przy badaniu ekstremów warunkowych w analizie, rozwiążemy ten problem metodą mnożników Lagrange'a.
Polega ona na rozpatrzeniu rodziny funkcjonałów Fλ, o postaci
gdzie parametr λ∈R
Dla każdego z tych funkcjonałów szukamy punktów krytycznych leżących na N. Wyjaśnienie tego jest następujące:
Jeżeli dg0Fλ=0 dla g0∈N, to z uwagi na fakt, że różniczka dg0Φ, ograniczona do przestrzeni stycznej w g0 do N jest zerowa, warunek dg0Fλ=0 pociąga, że dg0V=0 na tejże przestrzeni stycznej. Jednocześnie właściwy dobór λ umożliwia uzyskanie warunku dg0Fλ=0 także na przestrzeni prostopadłej do N w punkcie g0.
Podsumowując: pierwszym krokiem do rozwiązania Problemu 7.2 jest znalezienie należących do N punktów krytycznych funkcjonałów
|
Fλg=∫-11gx+λ1+g′x2dx |
| (7.10) |
Widzimy, więc że funkcjonały Fλ mają postać (7.1), gdzie Lλ:R×R ma postać
|
Lλγ,γ˙=γ+λ1+γ˙2. |
| (7.11) |
7.3. Punkty krytyczne i równania Eulera
Będziemy poszukiwać warunków, przy których krzywa γ0 jest punktem krytycznym funkcjonału
|
Fγ=∫t1t2Lγ,γ˙dt |
| (7.12) |
Pisząc γ=γ0+δ, redukujemy nasz problem do pytania czy funkcjonał
|
ϕδ=Fγ0+δ-Fγ0=∫tt2Lγ0+δ,γ0+δ˙-Lγ0,δ˙0dt |
| (7.13) |
ma w punkcie δ0=0∈Y punkt krytyczny. ( Y jest tutaj przestrzenią liniową wariacji - zob. Uwagę 7.1.)
Wyposażmy Y w w strukturę przestrzeni Banacha, wprowadzając C1 normę:
|
δC1=t1≤t≤t2supδt12+t1≤t≤t2supδ˙t2, |
| (7.14) |
gdzie |⋅|2 oznacza normę euklidesową w Rn.
Zamierzamy zapisać Φδ w postaci
gdzie d0Φδ jest ciągłą w normie (7.14) operacją liniową, natomiast R spełnia warunek:
|
limδC1→0RδC1δC1=0 |
| (7.16) |
Definicja 7.1
Powiemy, że funkcjonał (7.12) jest różniczkowalny w γ0(lub, że (7.13) jest różniczkowalny w 0), jeżeli przestawienie (7.15) z warunkiem (7.16) jest możliwe. Operacja liniowa d0Φ jest wtedy wyznaczona jednoznacznie i nazywa się różniczką Φ w 0 (lub różniczką F w γ0). Powiemy, że γ0 jest punktem krytycznym Φ jeżeli d0Φ=0 (tj. d0Φδ=0 dla każdego δ).
Twierdzenie 7.1
Jeżeli F jest postaci (7.12), gdzie funkcja L jest klasy C2, to dla każdego γ0 istnieje dγ0F. Na to, aby krzywa γ była punktem krytycznym F potrzeba i wystarcza, by spełniała ona układ równań :
|
∂L∂xj(γ(t),γ˙(t))-ddt(∂L∂γ˙j(γ(t),γ˙(t)))=0j=1,2,..n. |
| (7.17) |
Równania powyższe noszą nazwę równań Eulera.
Ustalimy najpierw możliwą postać operacji d0ϕ, występującej w formule (7.15).
Oznaczmy zmienne, od których zależy L jako x=x1,…,xn,v1,…,vn. Wtedy zgodnie ze wzorem Taylora dla przyrostu △x=△x1,…,△xn,△v1,…,△vn zachodzi
|
Lx+△x-Lx=∑i=1n∂L∂xix⋅△xi+∂L∂vivi⋅△vi+R2△x |
|
gdzie
gdy △x2 dąży do zera, a |⋅|2 jest normą euklidesową w R2n.
Podstawiając xi=γit,v1=γ˙it oraz △xi=δit,△vi=δ˙it przy ustalonym t i dla i=1,2..,n oraz wycałkowując po t otrzymamy, zgodnie z (7.13):
|
Φδ=∫t1t2∑i=1n∂L∂xiγt,γ˙t⋅δit+∂L∂viγt,γ˙tδ˙itdt+∫t1t2R2δt,δ˙tdt |
| (7.19) |
Część pierwsza, po prawej stronie równości (7.19) zależy liniowo od δt i przyjmujemy ją jako d0Φ. Także odpowiednio przyjmujemy
|
Rδ=∫t1t2R2δt,δ˙tdt. |
| (7.20) |
Mamy wtedy
|
|d0Φ(δ)|≤∑i=1n(supt1≤t≤t2∂L∂xi(γ(t),γ˙(t))+supt1≤t≤t2∂L∂xi(γ(t),γ˙(t))⋅)||δ||C1≤M||δ||C1 |
|
gdzie M jest stałą zależną Φ. Zatem d0Φ jest ciągłym funkcjonałem liniowym.
Pokażemy, że reszta R spełnia warunek (7.16).
Zauważmy najpierw, że dla każdego ustalonego t
|
|δ1(t),…,δn(t),δ˙1(t),…δ˙n(t)|2≤2n||δ||C1. |
|
Więc na mocy (7.14), (7.18) i (7.20) otrzymamy:
|
RδδC′≤2n∫t1t2R2δt,δ˙t|δ1(t),…,δn(t),δ˙1(t),…δ˙n(t)|2dt→0, |
|
przy δC1⟶0.
Przejdźmy do wyprowadzenia równań (7.17).
Warunek d0Φ=0 oznacza, że dla każdego δ∈Y zachodzi:
|
0=d0Φδ=∫t1t2∑i=1n∂L∂xiγt,γ˙tδit+∂L∂viγt,γ˙tδ˙itdt |
|
Całkując przez części drugie człony składników sumy oraz uwzględniając, że δit1=δit2=0 otrzymamy:
|
∫t1t2(∑i=1n∂L∂xi(γ(t),γ˙(t))-ddt∂L∂v1(γ(t),γ˙(t))δi(t)dt=0. |
| (7.21) |
Przyjmując jako δt kolejno krzywe o postaci 0,…︸j-1,δjt,0..0, gdzie δj może być dowolną funkcją różniczkowalną taką, że z δjt1=δjt2=0, otrzymamy n niezależnych warunków
|
∫t1t2(∂L∂xj(γ(t),γ˙(t))-ddt∂L∂vj(γ(t),γ˙(t))δj(t)dt=0. |
| (7.22) |
j=1,2,…,n.
∎
Nietrudne rozumowanie pokazuje, że j-ty warunek (7.22) jest równoważny j-temu równaniu Eulera. Odwrotnie: spełnienie równań Eulera daje równania (7.22) a te przez wysumowanie warunek (7.21), z którego wynika z kolei, że d0Φ=0.
Uwaga 7.3
Chcąc uniknąć wprowadzania zmiennych x1,…xn oraz v1,…vn zapisuje się równania, utożsamiając xi z γi oraz vi z γ˙i w postaci (7.17).
7.4. Przykłady równań Eulera.
Na zakończenie napiszemy równania Eulera dla zagadnienia brachistochrony i zagadnienia krzywej łańcuchowej.
Przykład 7.1
Równanie Eulera dla zagadnienia brachistochomy.
Mamy znaleźć funkcję f argumentu x , który pełni rolę zmiennej t w równianiach Eulera (zobacz sformułowanie Twierdzenia 7.1). Będziemy pisać f zamiast γ oraz f˙ zamiast γ˙. Nasza funkcja Lagrange'a ma zatem postać:
Wtedy
|
∂L∂ff,f˙=121+f˙21-f-121+f˙21-f2 |
|
oraz
|
∂L∂f˙f,f˙=1+f˙21-f-12⋅f˙1-f. |
|
Równanie Eulera
przyjmie więc postać
|
121+dfdx21-f-12⋅1+dfdx21-f2+ddx1+dfdx21-f-12⋅dfdx1-f=0 |
| (7.23) |
Przykład 7.2
Równanie Eulera dla krzywej łańcuchowej.
Podobnie, jak poprzednio, rolę t w równaniach Eulera pełni zmienna x, natomiast zamiast x1 napiszemy γ a zamiast v1 napiszemy dgdx=g˙. Funkcja Lagrange'a z mnożnikiem λ ma postać:
Wtedy
|
∂Lλ∂g=1+g˙2;∂Lλ∂g˙=g˙g+λ1+g˙2. |
|
Zatem równania Eulera mają postać :
|
1+dgdx2-ddxdgdxg+λ1+dydx2=0. |
| (7.24) |
Uwaga 7.4
Zarówno równanie (7.23) jak (7.24) mają bardzo skomplikowaną postać i raczej nie ma szans rozwiązać Problemów 1 i 2 na tej drodze. Znacznie prostszą metodę podamy w następnym wykładzie.