Poprzedni rozdział 8 dotyczył warunku wystarczającego (sufficient condition) istnienia sterowania optymalnego. Natomiast w tym rozdziale 9 sformułujemy warunek konieczny (necessary condition) dla optymalnego sterowania — zwany zasadą maksimum Pontriagina (Pontryagin Maximum Principle). Zasada ta pozwala wyznaczyć optymalne sterowania i optymalne trajektorie — por. przykłady 7.2, 7.3.
Analogia: Minimum funkcji z więzami (ograniczeniami, constraints).
Rozważamy gładkie funkcje , , , ,
gdzie jest niepustym obszarem w . Badamy istnienie minimum funkcji na hiperpowierzchni (hypersurface)
Jeżeli jest punktem, w którym ma (lokalne) minimum na hiperpowierzchni , to istnieją liczby (mnożniki Lagrange'a (Lagrange multipliers)) , t.ż. , jest rozwiązaniem równań:
czyli
zatem wektor jest prostopadły do hiperpłaszczyzny stycznej do hiperpowierzchni w punkcie , czyli jest normalny do w .
W tym rozdziale nie zakładamy żadnych ograniczeń na sterowania, czyli .
Rozpatrujemy najpierw zagadnienie Lagrange'a (L) dla ustalonego punktu końcowego (I) — por. rozdział 6. Zakładamy, że jest ciągła względem oraz różniczkowalna w sposób ciągły względem .
Mamy zadane punkty , . Wśród dopuszczalnych sterowań , o tej własności, że rozwiązanie zagadnienia
przechodzi przez dla , tzn. , znaleźć to, dla którego
przyjmuje najmniejszą wartość.
Sterowanie , o którym mowa w zagadnieniu 9.1, nazywamy sterowaniem optymalnym (optimal control), a odpowiednią trajektorię — trajektorią optymalną (optimal trajectory).
Zauważmy, że jeżeli sterowanie , , prowadzi do z wartością , to sterowanie , także prowadzi do z wartością . To pozwala przyjąć chwilę początkową, jako .
Każdy kawałek trajektorii optymalnej jest też trajektorią optymalną:
Jeżeli, , jest sterowaniem optymalnym prowadzącym do , — trajektorią optymalną oraz , to sterowanie jest optymalnym sterowaniem prowadzącym do oraz jest trajektorią optymalną.
Niech wartości na odcinkach , , będą oznaczone przez , i , odpowiednio. Wówczas wartość na odcinku , to . Jeżeli sterowanie nie byłoby optymalne, to istniałoby sterowanie prowadzące do z wartością , gdzie . Zatem istniałoby sterowanie prowadzące do z wartością , co jest sprzeczne z optymalnością sterowania .
∎Dla zagadnienia Lagrange'a, zadanego sterowania i odpowiedzi określamy
Jeżeli jest pomyślne, to , dla pewnego i odpowiedni koszt to . Gdy jest optymalne, to jest najmniejsze.
Określamy wektor –wymiarowy oraz
Zakładamy, że oraz są ciągłe względem oraz różniczkowalne w sposób ciągły względem .
Zagadnienie 9.1 można sformułować w następującej, równoważnej postaci:
Niech oraz będzie prostą w :
gdzie jest ustalonym punktem. Wśród sterowań , o tej własności, że rozwiązanie zagadnienia
(9.1) |
przecina prostą , znaleźć to, dla którego punkt przecięcia z prostą ma najmniejszą współrzędną .
Podobnie jak w definicji 9.1:
Sterowanie , o którym mowa w zagadnieniu 9.2, nazywamy sterowaniem optymalnym (optimal control), a odpowiednią trajektorię — trajektorią optymalną (optimal trajectory).
Wprowadzamy sprzężenie linearyzacji (adjoint to the linearization):
dla zadanego sterowania i odpowiedzi rozważamy –wymiarowe zagadnienie zlinearyzowane
(9.2) |
Rozwiązanie tego zagadnienia nazywa się rozszerzonym ko-stanem (extended costate; adjoint variable; Lagrange multiplier);
jest macierzą Jacobiego względem ,
(w pierwszej kolumnie są same zera, gdyż żadna z nie zależy jawnie od ).
Zlinearyzowane równanie opisuje ewolucję wektora stycznego wzdłuż krzywej wyznaczonej przez rozwiązanie zagadnienia wyjściowego. Sprzężone równanie zlinearyzowane opisuje ewolucję wektorów prostopadłych — leżących w -wymiarowej hiperpłaszczyźnie.
Dla zadanego , rozważamy ko-stan i rzeczywistą funkcję (Hamiltonian)
nie zależy od , gdyż nie zależą od :
Mamy
(9.3) |
(9.4) |
gdzie równanie (9.3), to inny zapis równania (9.1), a równanie (9.4), to inny zapis równania (9.2). Zatem równanie (9.3), to wyjściowy układ RRZ. W układzie tym nie pojawia się ko–stan .
Rozważamy rozszerzone zagadnienie sterowania
z . Jeżeli jest optymalne na z odpowiedzią , to istnieje absolutnie ciągła funkcja spełniająca
z
(i) p.w. na
(ii) na
(iii) oraz na .
Zasada określa warunek konieczny (necessary condition) sterowania optymalnego: jeżeli jest optymalne dla zagadnienia (I), to istnieje para , t.ż. dla p.k.
oraz równość jest osiągana dla — oczywiście może być również osiągana dla innych wartości .
Równość w (i) (bez ,,p.w.”) zachodzi, w każdym punkcie prawostronnej, lub lewostronnej ciągłości sterowania — por. [31], Lemma 1, str. 110.
Zasada maksimum Pontriagina dla swobodnego punktu końcowego — zagadnienie (III) — rozdział 6. Jeżeli czas końcowy jest ustalony, a punkt końcowy nie jest zadany, to twierdzenie 9.1 należy uzupełnić o warunek transwersalności (transversality condition) — por. (9.6):
(9.5) |
Z twierdzenia 9.1 można wyprowadzić warunek konieczny dla sterowania czaso–optymalnego. Niech . Mamy
oraz
Wówczas mamy
Niech
Z zależności
otrzymujemy
a zatem
Rozważamy zagadnienie
z . Jeżeli jest czaso–optymalne z odpowiedzią , to istnieje absolutnie ciągła funkcja spełniająca
z
(i) p.w. na
(ii) na
(iii) na .
Por. przyklad 1.2, 2.4, 7.2. Przykład ten jest powtórzeniem przykładu 7.2 ,,w języku” twierdzenia 9.1. Niech .
Z twierdzenia 9.1: jeżeli jest czaso–optymalne, to istnieją liczby , , t.ż.
a to jest osiągane jedynie dla
Funkcja liniowa jest albo tożsamościowo , albo zeruje się w co najwyżej jednym punkcie. Zatem każde czaso–optymalne sterowanie jest p.w. albo tożsamościowo , albo bang–bang. Nie może jednak być tożsamościowo , gdyż byłoby wtedy i mielibyśmy ( nie może znikać), co by dawało , a zatem , co byłoby sprzeczne z twierdzeniem 9.1 (ii); por. przykład 7.2.
Rozważmy przypadek, gdy punkt końcowy nie jest ustalony, lecz należy do zadanego zbioru , o którym zakładamy, że jest –wymiarową gładką rozmaitością (manifold; por. [12], str. 64) w , — zagadnienie (II). Możemy sformułować następujące twierdzenie
Rozważamy rozszerzone zagadnienie sterowania
z . Jeżeli jest optymalne na z odpowiedzią , to istnieje absolutnie ciągła funkcja spełniająca
z
(i) p.w. na
(ii) na
(iii) oraz na
oraz spełniony jest warunek transwersalności (transversality (transversal orthogonal to the tangent space))
(iv) wektor jest prostopadły do przestrzeni stycznej (tangent space) do rozmaitości w punkcie :
(9.6) |
W przypadku zagadnienia swobodnego punktu końcowego — (III) — warunek transwersalności (9.6) przyjmuje postać (9.5):
Rozważamy układ równań z przykładu 9.1 z , jednakże cel określamy jako
czyli jesteśmy zainteresowani osiągnięciem położenia z dowolną prędkością .
Wektor styczny (w dowolnym punkcie ) do ma postać
gdzie . Warunek transwersalności przyjmuje więc postać
(9.7) |
skąd . Ponieważ (por. przykład 9.1)
to z (9.7) wynika, że na odcinku nie zmienia znaku. Zatem każde czaso–optymalne sterowanie jest stałe i równe albo , albo , bez przełączeń. Zatem przez każdy punkt początkowy przechodzą tylko dwie trajektorie, które mogą być optymalne (dla i ).
Jeżeli i punkt początkowy leży powyżej dolnej części trajektorii przechodzącej przez , to jedynie trajektoria dla prowadzi do . Natomiast, gdy i punkt początkowy leży na, lub poniżej dolnej części trajektorii przechodzącej przez , to do celu prowadzi zarówno trajektoria z , jak i . Mamy więc dwie trajektorie podlegające zasadzie maksimum. Można jednak pokazać (ćwiczenie), że czas dojścia do w obu przypadkach jest różny i optymalnym sterowaniem jest . Analogicznie dla optymalnym sterowaniem jest . Można więc zsyntetyzować optymalne sterowanie (synthesize the optimal control) wprowadzając
i rozważając układ
otrzymujac wszystkie optymalne trajektorie.
Analogia: Zagadnienie minimum rzeczywistej, gładkiej funkcji na obszarze .
Warunek konieczny (the necessary condition): Jeżeli punkt jest minimum funkcji , to
Wprowadzając , gdzie , , otrzymujemy
Mamy
Warunkiem wystarczającym (sufficient condition) minimum jest
czyli macierz
jest dodatnio określona.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.