Poprzedni rozdział 8 dotyczył warunku wystarczającego (sufficient condition) istnienia sterowania optymalnego. Natomiast w tym rozdziale 9 sformułujemy warunek konieczny (necessary condition) dla optymalnego sterowania — zwany zasadą maksimum Pontriagina (Pontryagin Maximum Principle). Zasada ta pozwala wyznaczyć optymalne sterowania i optymalne trajektorie — por. przykłady 7.2, 7.3.
Analogia: Minimum funkcji z więzami (ograniczeniami, constraints).
Rozważamy gładkie funkcje
,
,
,
,
gdzie
jest niepustym obszarem w
.
Badamy istnienie minimum funkcji
na hiperpowierzchni (hypersurface)
Jeżeli
jest punktem, w którym
ma (lokalne) minimum na
hiperpowierzchni
, to istnieją liczby (mnożniki Lagrange'a (Lagrange
multipliers))
, t.ż.
,
jest
rozwiązaniem
równań:
![]() |
czyli
zatem wektor
jest prostopadły do hiperpłaszczyzny stycznej do
hiperpowierzchni
w punkcie
, czyli jest normalny do
w
.
W tym rozdziale nie zakładamy żadnych ograniczeń na sterowania, czyli
.
Rozpatrujemy najpierw zagadnienie Lagrange'a (L) dla ustalonego punktu końcowego (I) — por.
rozdział 6. Zakładamy, że
jest ciągła względem
oraz
różniczkowalna w sposób ciągły względem
.
Mamy zadane punkty
,
. Wśród dopuszczalnych
sterowań
, o tej własności, że rozwiązanie
zagadnienia
przechodzi przez
dla
, tzn.
, znaleźć to, dla którego
![]() |
przyjmuje najmniejszą wartość.
Sterowanie
, o którym mowa w zagadnieniu 9.1, nazywamy sterowaniem
optymalnym (optimal control), a odpowiednią trajektorię
— trajektorią optymalną (optimal trajectory).
Zauważmy, że jeżeli sterowanie
,
, prowadzi
do
z wartością
, to sterowanie
,
także
prowadzi
do
z wartością
. To pozwala przyjąć chwilę
początkową, jako
.
Każdy kawałek trajektorii optymalnej jest też trajektorią optymalną:
Jeżeli
,
, jest sterowaniem optymalnym prowadzącym
do
,
— trajektorią optymalną oraz
, to
sterowanie
jest optymalnym sterowaniem prowadzącym
do
oraz
jest trajektorią optymalną.
![]()
Niech wartości
na odcinkach
,
,
będą oznaczone przez
,
i
, odpowiednio. Wówczas wartość
na
odcinku
, to
. Jeżeli sterowanie
nie
byłoby optymalne, to istniałoby sterowanie
prowadzące
do
z wartością
, gdzie
. Zatem istniałoby
sterowanie prowadzące
do
z wartością
, co jest sprzeczne z
optymalnością sterowania
.
Dla zagadnienia Lagrange'a, zadanego sterowania
i odpowiedzi
określamy
![]() |
Jeżeli
jest pomyślne, to
, dla pewnego
i odpowiedni koszt to
. Gdy
jest optymalne, to
jest najmniejsze.
Określamy wektor
–wymiarowy
oraz
Zakładamy, że
oraz
są ciągłe względem
oraz różniczkowalne w sposób ciągły względem
.
Zagadnienie 9.1 można sformułować w następującej, równoważnej postaci:
Niech
oraz
będzie prostą w
:
gdzie
jest ustalonym punktem. Wśród sterowań
, o tej własności,
że rozwiązanie
zagadnienia
| (9.1) |
przecina prostą
, znaleźć to, dla którego punkt
przecięcia z prostą
ma najmniejszą współrzędną
.
Podobnie jak w definicji 9.1:
Sterowanie
, o którym mowa w zagadnieniu 9.2, nazywamy sterowaniem
optymalnym (optimal control), a odpowiednią trajektorię
— trajektorią optymalną (optimal trajectory).
Wprowadzamy sprzężenie linearyzacji (adjoint to the linearization):
dla zadanego sterowania
i odpowiedzi
rozważamy
–wymiarowe
zagadnienie zlinearyzowane
| (9.2) |
Rozwiązanie tego zagadnienia nazywa się rozszerzonym ko-stanem (extended costate; adjoint variable; Lagrange multiplier);
jest macierzą Jacobiego
względem
,
![]() |
(w pierwszej kolumnie są same zera, gdyż żadna z
nie zależy jawnie od
).
Zlinearyzowane równanie opisuje ewolucję wektora stycznego wzdłuż krzywej wyznaczonej przez
rozwiązanie zagadnienia wyjściowego. Sprzężone równanie zlinearyzowane opisuje ewolucję
wektorów prostopadłych — leżących w
-wymiarowej hiperpłaszczyźnie.
Dla zadanego
, rozważamy ko-stan i rzeczywistą funkcję (Hamiltonian)
![]() |
nie zależy od
, gdyż
nie zależą od
:
Mamy
![]() |
(9.3) |
![]() |
(9.4) |
gdzie równanie (9.3), to inny zapis równania (9.1), a równanie (9.4), to
inny zapis równania (9.2). Zatem równanie (9.3), to wyjściowy układ RRZ. W
układzie tym nie pojawia się ko–stan
.
Rozważamy rozszerzone zagadnienie sterowania
z
. Jeżeli
jest optymalne na
z odpowiedzią
, to istnieje absolutnie ciągła funkcja
spełniająca
z
(i)
p.w. na ![]()
(ii)
na ![]()
(iii)
oraz
na
.
Zasada określa warunek konieczny (necessary condition) sterowania optymalnego:
jeżeli
jest optymalne dla zagadnienia (I), to istnieje para
, t.ż. dla p.k. ![]()
oraz równość jest osiągana dla
— oczywiście może być również osiągana dla innych
wartości
.
Równość w (i) (bez ,,p.w.”) zachodzi, w każdym punkcie prawostronnej, lub lewostronnej
ciągłości sterowania
— por. [31], Lemma 1, str. 110.
Zasada maksimum Pontriagina dla swobodnego punktu końcowego — zagadnienie
(III) — rozdział 6. Jeżeli czas końcowy
jest ustalony, a punkt końcowy
nie jest zadany, to twierdzenie 9.1
należy uzupełnić o warunek transwersalności (transversality
condition) — por. (9.6):
| (9.5) |
Z twierdzenia 9.1 można wyprowadzić warunek konieczny dla sterowania czaso–optymalnego.
Niech
. Mamy
oraz
![]() |
Wówczas mamy
Niech
Z zależności
otrzymujemy
a zatem
Rozważamy zagadnienie
z
. Jeżeli
jest czaso–optymalne z odpowiedzią
, to istnieje absolutnie
ciągła funkcja
spełniająca
z
(i)
p.w. na ![]()
(ii)
na ![]()
(iii)
na
.
Por. przyklad 1.2, 2.4, 7.2. Przykład ten jest powtórzeniem
przykładu 7.2 ,,w języku” twierdzenia 9.1. Niech
.
![]() |
![]() |
![]() |
Z twierdzenia 9.1: jeżeli
jest czaso–optymalne, to
istnieją liczby
,
, t.ż.
a to jest osiągane jedynie dla
Funkcja liniowa
jest albo tożsamościowo
, albo zeruje się w co najwyżej
jednym punkcie. Zatem każde czaso–optymalne sterowanie jest p.w. albo tożsamościowo
,
albo bang–bang. Nie może jednak być tożsamościowo
, gdyż byłoby wtedy
i mielibyśmy
(
nie może znikać), co by dawało
, a zatem
, co byłoby sprzeczne z twierdzeniem
9.1 (ii); por. przykład 7.2.
Rozważmy przypadek, gdy punkt końcowy
nie jest ustalony, lecz należy do zadanego zbioru
, o którym zakładamy, że jest
–wymiarową gładką
rozmaitością (manifold; por. [12], str. 64)
w
,
— zagadnienie (II). Możemy sformułować następujące twierdzenie
Rozważamy rozszerzone zagadnienie sterowania
z
. Jeżeli
jest optymalne na
z odpowiedzią
,
to istnieje absolutnie ciągła funkcja
spełniająca
z
(i)
p.w. na ![]()
(ii)
na ![]()
(iii)
oraz
na
![]()
oraz spełniony jest warunek transwersalności (transversality
(transversal
orthogonal to the tangent space))
(iv) wektor
jest prostopadły do
przestrzeni stycznej (tangent space)
do rozmaitości
w punkcie
:
![]() |
(9.6) |
W przypadku zagadnienia swobodnego punktu końcowego — (III) — warunek transwersalności (9.6) przyjmuje postać (9.5):
Rozważamy układ równań z przykładu 9.1 z
, jednakże
cel określamy jako
czyli jesteśmy zainteresowani osiągnięciem położenia
z dowolną prędkością
.
Wektor styczny (w dowolnym punkcie
) do
ma postać
gdzie
. Warunek transwersalności przyjmuje więc postać
| (9.7) |
skąd
. Ponieważ (por. przykład 9.1)
to z (9.7) wynika, że
na odcinku
nie zmienia znaku.
Zatem każde czaso–optymalne sterowanie jest stałe i równe albo
, albo
,
bez przełączeń. Zatem przez każdy punkt początkowy
przechodzą tylko dwie
trajektorie, które mogą być optymalne (dla
i
).
Jeżeli
i punkt początkowy leży powyżej dolnej części trajektorii
przechodzącej przez
, to jedynie trajektoria dla
prowadzi do
. Natomiast, gdy
i punkt początkowy leży na, lub poniżej
dolnej części trajektorii przechodzącej przez
, to do celu prowadzi zarówno
trajektoria z
, jak i
.
Mamy więc dwie trajektorie podlegające
zasadzie maksimum. Można jednak pokazać (ćwiczenie), że czas dojścia do
w obu przypadkach jest różny i optymalnym sterowaniem jest
. Analogicznie dla
optymalnym sterowaniem jest
. Można więc zsyntetyzować optymalne
sterowanie (synthesize the optimal control) wprowadzając
i rozważając układ
otrzymujac wszystkie optymalne trajektorie.
Analogia: Zagadnienie minimum rzeczywistej, gładkiej funkcji
na obszarze
.
Warunek konieczny (the necessary condition):
Jeżeli punkt
jest minimum funkcji
, to
Wprowadzając
, gdzie
,
,
otrzymujemy
![]() |
Mamy
![]() |
Warunkiem wystarczającym (sufficient condition) minimum jest
![]() |
czyli macierz
jest dodatnio określona.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.