Poprzedni rozdział 8 dotyczył warunku wystarczającego (sufficient condition) istnienia sterowania optymalnego. Natomiast w tym rozdziale 9 sformułujemy warunek konieczny (necessary condition) dla optymalnego sterowania — zwany zasadą maksimum Pontriagina (Pontryagin Maximum Principle). Zasada ta pozwala wyznaczyć optymalne sterowania i optymalne trajektorie — por. przykłady 7.2, 7.3.
Analogia: Minimum funkcji z więzami (ograniczeniami, constraints).
Rozważamy gładkie funkcje
,
,
,
,
gdzie jest niepustym obszarem w
.
Badamy istnienie minimum funkcji
na hiperpowierzchni (hypersurface)
![]() |
Jeżeli jest punktem, w którym
ma (lokalne) minimum na
hiperpowierzchni
, to istnieją liczby (mnożniki Lagrange'a (Lagrange
multipliers))
, t.ż.
,
jest
rozwiązaniem
równań:
![]() |
![]() |
czyli
![]() |
zatem wektor jest prostopadły do hiperpłaszczyzny stycznej do
hiperpowierzchni
w punkcie
, czyli jest normalny do
w
.
W tym rozdziale nie zakładamy żadnych ograniczeń na sterowania, czyli .
Rozpatrujemy najpierw zagadnienie Lagrange'a (L) dla ustalonego punktu końcowego (I) — por.
rozdział 6. Zakładamy, że jest ciągła względem
oraz
różniczkowalna w sposób ciągły względem
.
Mamy zadane punkty ,
. Wśród dopuszczalnych
sterowań
, o tej własności, że rozwiązanie
zagadnienia
![]() |
przechodzi przez dla
, tzn.
, znaleźć to, dla którego
![]() |
przyjmuje najmniejszą wartość.
Sterowanie , o którym mowa w zagadnieniu 9.1, nazywamy sterowaniem
optymalnym (optimal control), a odpowiednią trajektorię
— trajektorią optymalną (optimal trajectory).
Zauważmy, że jeżeli sterowanie ,
, prowadzi
do
z wartością
, to sterowanie
,
także
prowadzi
do
z wartością
. To pozwala przyjąć chwilę
początkową, jako
.
Każdy kawałek trajektorii optymalnej jest też trajektorią optymalną:
Jeżeli,
, jest sterowaniem optymalnym prowadzącym
do
,
— trajektorią optymalną oraz
, to
sterowanie
jest optymalnym sterowaniem prowadzącym
do
oraz
jest trajektorią optymalną.
Niech wartości na odcinkach
,
,
będą oznaczone przez
,
i
, odpowiednio. Wówczas wartość
na
odcinku
, to
. Jeżeli sterowanie
nie
byłoby optymalne, to istniałoby sterowanie
prowadzące
do
z wartością
, gdzie
. Zatem istniałoby
sterowanie prowadzące
do
z wartością
, co jest sprzeczne z
optymalnością sterowania
.
Dla zagadnienia Lagrange'a, zadanego sterowania i odpowiedzi
określamy
![]() |
Jeżeli jest pomyślne, to
, dla pewnego
i odpowiedni koszt to
. Gdy
jest optymalne, to
jest najmniejsze.
Określamy wektor –wymiarowy
oraz
![]() |
Zakładamy, że oraz
są ciągłe względem
oraz różniczkowalne w sposób ciągły względem
.
Zagadnienie 9.1 można sformułować w następującej, równoważnej postaci:
Niech oraz
będzie prostą w
:
![]() |
gdzie jest ustalonym punktem. Wśród sterowań
, o tej własności,
że rozwiązanie
zagadnienia
![]() |
(9.1) |
![]() |
przecina prostą , znaleźć to, dla którego punkt
przecięcia z prostą
ma najmniejszą współrzędną
.
Podobnie jak w definicji 9.1:
Sterowanie , o którym mowa w zagadnieniu 9.2, nazywamy sterowaniem
optymalnym (optimal control), a odpowiednią trajektorię
— trajektorią optymalną (optimal trajectory).
Wprowadzamy sprzężenie linearyzacji (adjoint to the linearization):
dla zadanego sterowania i odpowiedzi
rozważamy
–wymiarowe
zagadnienie zlinearyzowane
![]() |
(9.2) |
Rozwiązanie tego zagadnienia nazywa się rozszerzonym ko-stanem (extended costate; adjoint variable; Lagrange multiplier);
jest macierzą Jacobiego
względem
,
![]() |
(w pierwszej kolumnie są same zera, gdyż żadna z nie zależy jawnie od
).
Zlinearyzowane równanie opisuje ewolucję wektora stycznego wzdłuż krzywej wyznaczonej przez
rozwiązanie zagadnienia wyjściowego. Sprzężone równanie zlinearyzowane opisuje ewolucję
wektorów prostopadłych — leżących w -wymiarowej hiperpłaszczyźnie.
Dla zadanego , rozważamy ko-stan i rzeczywistą funkcję (Hamiltonian)
![]() |
nie zależy od
, gdyż
nie zależą od
:
![]() |
Mamy
![]() |
(9.3) |
![]() |
(9.4) |
gdzie równanie (9.3), to inny zapis równania (9.1), a równanie (9.4), to
inny zapis równania (9.2). Zatem równanie (9.3), to wyjściowy układ RRZ. W
układzie tym nie pojawia się ko–stan .
![]() |
Rozważamy rozszerzone zagadnienie sterowania
![]() |
z . Jeżeli
jest optymalne na
z odpowiedzią
, to istnieje absolutnie ciągła funkcja
spełniająca
![]() |
z
(i)
p.w. na
(ii) na
(iii) oraz
na
.
Zasada określa warunek konieczny (necessary condition) sterowania optymalnego:
jeżeli jest optymalne dla zagadnienia (I), to istnieje para
, t.ż. dla p.k.
![]() |
oraz równość jest osiągana dla — oczywiście może być również osiągana dla innych
wartości
.
Równość w (i) (bez ,,p.w.”) zachodzi, w każdym punkcie prawostronnej, lub lewostronnej
ciągłości sterowania — por. [31], Lemma 1, str. 110.
Zasada maksimum Pontriagina dla swobodnego punktu końcowego — zagadnienie
(III) — rozdział 6. Jeżeli czas końcowy
jest ustalony, a punkt końcowy
nie jest zadany, to twierdzenie 9.1
należy uzupełnić o warunek transwersalności (transversality
condition) — por. (9.6):
![]() |
(9.5) |
Z twierdzenia 9.1 można wyprowadzić warunek konieczny dla sterowania czaso–optymalnego.
Niech . Mamy
![]() |
oraz
![]() |
Wówczas mamy
![]() |
Niech
![]() |
Z zależności
![]() |
otrzymujemy
![]() |
a zatem
![]() |
Rozważamy zagadnienie
![]() |
z . Jeżeli
jest czaso–optymalne z odpowiedzią
, to istnieje absolutnie
ciągła funkcja
spełniająca
![]() |
z
(i) p.w. na
(ii) na
(iii) na
.
Por. przyklad 1.2, 2.4, 7.2. Przykład ten jest powtórzeniem
przykładu 7.2 ,,w języku” twierdzenia 9.1. Niech .
![]() |
![]() |
![]() |
![]() |
![]() |
Z twierdzenia 9.1: jeżeli jest czaso–optymalne, to
istnieją liczby
,
, t.ż.
![]() |
![]() |
a to jest osiągane jedynie dla
![]() |
Funkcja liniowa jest albo tożsamościowo
, albo zeruje się w co najwyżej
jednym punkcie. Zatem każde czaso–optymalne sterowanie jest p.w. albo tożsamościowo
,
albo bang–bang. Nie może jednak być tożsamościowo
, gdyż byłoby wtedy
i mielibyśmy
(
nie może znikać), co by dawało
, a zatem
, co byłoby sprzeczne z twierdzeniem
9.1 (ii); por. przykład 7.2.
Rozważmy przypadek, gdy punkt końcowy nie jest ustalony, lecz należy do zadanego zbioru
, o którym zakładamy, że jest
–wymiarową gładką
rozmaitością (manifold; por. [12], str. 64)
w
,
— zagadnienie (II). Możemy sformułować następujące twierdzenie
Rozważamy rozszerzone zagadnienie sterowania
![]() |
z . Jeżeli
jest optymalne na
z odpowiedzią
,
to istnieje absolutnie ciągła funkcja
spełniająca
![]() |
z
(i) p.w. na
(ii) na
(iii) oraz
na
oraz spełniony jest warunek transwersalności (transversality
(transversal orthogonal to the tangent space))
(iv) wektor jest prostopadły do
przestrzeni stycznej (tangent space)
do rozmaitości
w punkcie
:
![]() |
(9.6) |
W przypadku zagadnienia swobodnego punktu końcowego — (III) — warunek transwersalności (9.6) przyjmuje postać (9.5):
![]() |
Rozważamy układ równań z przykładu 9.1 z , jednakże
cel określamy jako
![]() |
czyli jesteśmy zainteresowani osiągnięciem położenia z dowolną prędkością
.
Wektor styczny (w dowolnym punkcie ) do
ma postać
![]() |
gdzie . Warunek transwersalności przyjmuje więc postać
![]() |
(9.7) |
skąd . Ponieważ (por. przykład 9.1)
![]() |
to z (9.7) wynika, że na odcinku
nie zmienia znaku.
Zatem każde czaso–optymalne sterowanie jest stałe i równe albo
, albo
,
bez przełączeń. Zatem przez każdy punkt początkowy
przechodzą tylko dwie
trajektorie, które mogą być optymalne (dla
i
).
Jeżeli i punkt początkowy leży powyżej dolnej części trajektorii
przechodzącej przez
, to jedynie trajektoria dla
prowadzi do
. Natomiast, gdy
i punkt początkowy leży na, lub poniżej
dolnej części trajektorii przechodzącej przez
, to do celu prowadzi zarówno
trajektoria z
, jak i
.
Mamy więc dwie trajektorie podlegające
zasadzie maksimum. Można jednak pokazać (ćwiczenie), że czas dojścia do
w obu przypadkach jest różny i optymalnym sterowaniem jest
. Analogicznie dla
optymalnym sterowaniem jest
. Można więc zsyntetyzować optymalne
sterowanie (synthesize the optimal control) wprowadzając
![]() |
i rozważając układ
![]() |
otrzymujac wszystkie optymalne trajektorie.
Analogia: Zagadnienie minimum rzeczywistej, gładkiej funkcji na obszarze
.
Warunek konieczny (the necessary condition):
Jeżeli punkt jest minimum funkcji
, to
![]() |
Wprowadzając , gdzie
,
,
otrzymujemy
![]() |
Mamy
![]() |
Warunkiem wystarczającym (sufficient condition) minimum jest
![]() |
czyli macierz
![]() |
jest dodatnio określona.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.