Rozpatrujemy liniowe zagadnienie sterowania optymalnego (LA):
(7.1) |
gdzie i są stałymi macierzami i , odpowiednio, a funkcjonał kosztu jest określony przez (6.5).
Niech będzie zbiorem osiągalnym (reachable set) z w chwili :
(7.2) |
może być zanurzony w odpowiedniej hiperpłaszczyźnie (hyperplane) w . Wówczas i będą rozumiane w sensie odpowiednich hiperpłaszczyzn.
Dla zwartych podzbiorów , przestrzeni rozważamy metrykę Hausdorffa
jest –otoczką zbioru (–sack about )
Dla (LA): Zbiór jest wypukły i zwarty (convex and compact). Ponadto odwzorowanie , , jest ciągłe z topologią w obrazie zdefiniowaną przez metrykę Hausdorffa.
Mamy
(7.4) |
Wypukłość.
Wtedy dla
i
Zatem
Zwartość. Pokażemy domkniętość. Niech
Chcemy pokazać, że . Ponieważ , to istnieje , t.ż.
Z twierdzenia Alaoglu istnieje podciąg , , dla oraz istnieje , t. ż.
Stąd przechodząc do podciągu (por. rozdział 5)
a zatem i jest domknięty, ponadto jest ograniczony, a więc zwarty.
Ciągłość. Dla , oraz pokażemy, że istnieje , t.ż. spełniony jest następujący warunek:
jeżeli , to .
Chcemy więc pokazać, że jeżeli , to
Niech , .
dla pewnego .
Przedłużamy zerem na (czyli dla ) oraz określamy
zatem .
Mamy
Niech będzie t.ż. dla mamy , gdzie będzie wybrane później. Mamy
i wybieramy takie, aby
Stąd wynika, że , a z dowolności , że
Identycznie pokazujemy, że
Warto zauważyć, że podobny wynik nie jest prawdziwy dla (NLA) — por. [14], str. 52.
Można teraz sformułować twierdzenie o istnieniu sterowania czaso–optymalnego
Dla (LA): jeżeli istnieje pomyślne sterowanie prowadzące do celu , to istnieje sterowanie czaso–optymalne i jest ono bang-bang.
Istnieje pomyślne sterowanie, a zatem dla pewnego . Niech
(7.5) |
Zbiór jest więc niepusty i ograniczony z dołu. Istnieje więc . Chcemy pokazać, że
co oznacza, że istnieje sterowanie prowadzące do celu w najkrótszym czasie .
Załóżmy, że . Ponieważ jest domknięty, to istnieje otwarta kula , , t.ż.
Korzystając z ciągłości przekształcenia otrzymujemy
dla pewnego .
To oznacza, że nie jest osiągalny dla pewnych , co jest sprzeczne z definicją .
Z zasady bang–bang: jeżeli istnieje pomyślne sterowanie z prowadzące do w czasie , to istnieje sterowanie bang–bang prowadzące do w czasie . To kończy dowód.
∎Sterowanie określone na jest ekstremalne (extremal), jeżeli
(7.6) |
gdzie oznacza brzeg zbioru.
Należy zauważyć, że sterowanie ekstremalne nie musi być ani optymalne, ani nawet pomyślne!
W momencie dotarcia do celu, odpowiedż na sterowanie czaso–optymalne leży na brzegu zbioru :
Jeżeli sterowanie jest czaso–optymalne, to w — momencie dotarcia do celu — odpowiedź leży w (czyli ).
Załóżmy, że jest czaso–optymalnym sterowaniem prowadzącym do w czasie , czyli
i nie leży w .
Wówczas istnieje (otwarta) kula . Z ciągłości przekształcenia istnieje , t.ż.
zatem cel byłby osiągalny w czasie , co jest sprzeczne z minimalnością .
∎Odpowiedź na dowolne sterowanie nie może przechodzić z wnętrza zbioru osiągalnego na jego brzeg:
Załóżmy, że dla sterowania
gdzie jest odpowiedzią .
Wówczas
(7.7) |
Jeżeli , to istnieje (otwarta) kula , t.ż. .
Dla każdego istnieje sterowanie , które prowadzi do w czasie (punkt jest osiągalny z ).
Rozważmy zagadnienie z ustalonym sterowaniem :
Dla mamy dla . Rozwiązanie ma postać
czyli
Dla ustalonego odwzorowanie jest liniowe ciągłe i przekształca na , bo . Z twierdzenia o odwzorowaniu otwartym (por. [34], tw. 15.4, str. 147) wynika, że przekształca zbiory otwarte na zbiory otwarte. Stąd zbiór
jest otwarty w oraz , a zatem
czyli (7.7) jest spełnione, co kończy dowód lematu.
∎Dla (LA): jeżeli sterowanie jest czaso–optymalne, to jest ekstremalne.
Z lematu 7.2 wynika, że w — momencie przybycia do celu — odpowiedź leży na brzegu zbioru osiągalnego . Z lematu 7.3 wynika, że jeżeli odpowiedź leży na brzegu zbioru osiągalnego dla pewnego , to
To kończy dowód.
∎Dla (LA) i następujące warunki są równoważne:
jest ekstremalne na ,
istnieje , , t.ż.
(7.8) |
Dowód ,,”: załóżmy, że jest ekstremalne, czyli
Ponieważ jest wypukły oraz , to istnieje hiperpłaszczyzna podpierająca w punkcie , tzn. istnieje , , t.ż.
Mamy
Zatem
Wstawiając mamy , (bo macierz jest nieosobliwa) oraz
(7.9) |
Pokażemy, że stąd wynika
(7.10) |
Załóżmy, że nie! Istnieje wtedy podzbiór , , t.ż.
Określamy sterowanie
gdzie jest t.ż.
Mamy wtedy
Sprzeczność z (7.9)! Zatem (7.10) jest spełnione, co kończy dowód .
Dowód . Załóżmy, że istnieje , , t.ż.
Stąd
dla dowolnego, ale ustalonego . Wstawiając i postępując odwrotnie jak poprzednio otrzymujemy
co oznacza, że leży na brzegu :
Ponieważ jest dowolne, więc otrzymujemy wynikanie .
Z twierdzenia 7.2 i twierdzenie 7.3 wynika zasada maksimum Pontriagina dla liniowego zagadnienia czaso–optymalnego (Pontryagin maximum principle for linear time–optimal control) — szczególny przypadek zasady maksimum Pontriagina rozpatrywanej w rozdziale 9 — warunku koniecznego (necessary condition) dla sterowania optymalnego.
Dla (LA): jeżeli sterowanie jest czaso–optymalne, to istnieje , , t.ż.
(7.11) |
Każda współrzędna wektora jest funkcją analityczną zmiennej . Stąd (por. [12] , twierdzenie 6.9, str. 199) na zwartym przedziale w jest albo tożsamościowo równa , albo znika tylko w skończonej liczbie punktów . Jeżeli zachodzi ten drugi przypadek dla każdej współrzędnej, to sterowanie jest jednoznacznie wyznaczone, poza skończonym (a więc miary ) zbiorem punktów. Wtedy sterowanie jest bang–bang ze skończoną liczbą przełączeń (switches). Natomiast w pierwszym przypadku sterowanie nie jest określone przez . Pierwszy przypadek będziemy nazywali osobliwym (singular), a drugi normalnym (normal) — por. [24], str. 52.
(LA) nazywamy normalnym (normal), jeżeli dla każdego , , żadna współrzędna wektora nie znika na zbiorze dodatniej miary.
Każdy (LA) — normalny jest właściwy (tzn. ). Warunek w definicji 7.3 jest równoważny warunkowi, że żadna współrzędna nie znika tożsamościowo.
Rozpatrujemy układ RRZ, , w postaci macierzowej:
, ,
Układ jest właściwy, ale nie jest normalny.
Następujący wniosek pokazuje związek pomiędzy sterowaniami ekstremalnymi a sterowaniami bang–bang:
Twierdzenie 7.4 można zapisać w ogólnym formalizmie, który będzie później stosowany w rozdziale 9 w ogólnej sytuacji.
Wprowadzamy hamiltonian (Hamiltonian)
(7.13) |
gdzie , .
Możemy wyrazić twierdzenie 7.4 w następującej postaci
Dla (LA): niech będzie sterowaniem czaso-optymalnym z odpowiedzią . Wówczas istnieje absolutnie ciągła funkcja , t.ż.
(7.14) |
(7.15) |
oraz
(7.16) |
gdzie
Niech będzie jak w twierdzeniu 7.4. Rozważmy zagadnienie
Jego rozwiązaniem jest
a zatem
Z twierdzenia 7.4 wynika, że
Zatem
(7.17) |
Z definicji warunek (7.16) oraz równania (7.14) i (7.15) są spełnione.
∎Równanie (7.15) nazywa się równaniem sprzężonym (adjoint equation), a funkcja — ko–stanem (costate).
Rozpatrujemy układ RRZ z , — por. przykłady 1.2, 2.4:
(7.18) |
lub w postaci macierzowej:
,,W języku” twierdzenia 7.4:
Mamy
Układ (7.18) jest normalny!
,,W języku” twierdzenia 7.5:
Mamy
Stąd
i
Zatem
gdzie , . Dla uproszczenia zapisu nie zaznaczono w sposób jawny zależności zmiennych od .
Twierdzenie 7.5 implikuje, że jeżeli jest czaso–optymalne, to istnieją liczby , , t.ż.
a to jest osiągane dla , gdzie
Funkcja liniowa nie może być tożsamościowo , gdyż nie może znikać tożsamościowo.
Opisać czaso–optymalne trajektorie.
Rozpatrujemy układ RRZ z , :
(7.19) |
lub w postaci macierzowej:
,,W języku” twierdzenia 7.4:
Mamy
stąd
gdzie , , .
Układ (7.19) jest normalny!
Z twierdzenia 7.4 wynika, że każde sterowanie optymalne musi spełniać
,,W języku” twierdzenia 7.5:
Mamy
Stąd
i
Stąd , gdzie i są stałymi.
Twierdzenie 7.5 implikuje, że jeżeli jest czaso–optymalne, to
a to jest osiągane jedynie dla , gdzie
Zatem każde sterowanie czaso–optymalne jest bang–bang i okresowe o okresie .
Opisać czaso–optymalne trajektorie.
W przykładzie 7.1 rozpatrywany był układ właściwy, który nie jest normalny.
Niech . Wówczas każde ze sterowań , , gdzie
oraz
dla ,
jest czaso–optymalne z , ale tylko jest bang–bang.
Jeżeli (LA) jest normalny oraz istnieje pomyślne sterowanie (prowadzące do ), to istnieje jednoznaczne sterowanie czaso–optymalne. To sterowanie jest bang–bang i kawałkami stałe.
Z twierdzenia 7.1 wynika istnienie. Z twierdzenia 7.4 i wniosku 7.1 wynika, że każde sterowanie czaso–optymalne jest bang–bang. Załóżmy, że oraz są dwoma różnymi sterowaniami czaso–optymalnymi bang–bang. Wówczas sterowanie jest też czaso–optymalne, ale nie jest bang–bang. Otrzymujemy sprzeczność: zatem sterowanie czaso–optymalne jest jednoznaczne.
Sterowanie czaso–optymalne jest kawałkami stałe, gdyż każda współrzędna zmienia wartość tylko wtedy, gdy ta sama współrzędna przyjmuje wartość , a to może zdarzyć się tylko w skończonej liczbie punktów odcinka .
∎Niech będzie ustalone, oraz . Jeżeli
(7.20) |
dla każdego i każdego , t.ż.
to odpowiedź z do jest jednoznaczna (unique).
Załóżmy, ze macierz nie ma żadnej kolumny złożonej z samych , i niech . Wówczas następujące warunki są równoważne
sterowanie prowadzące do w czasie jest jednoznaczne,
odpowiedź z do w czasie jest jednoznaczna,
jest ekstremalnym punktem .
Dowód: [31], str. 69–71.
Dalej w tym rozdziale będziemy zakładać, że macierz nie ma żadnej kolumny złożonej z samych . Nie zmniejsza to ogólności!
Zbiór jest ściśle wypukły jeżeli
dla każdych dwóch punktów .
(LA) jest normalny na jest ściśle wypukły dla pewnego .
Dowód: [31], str. 71.
(LA) jest normalny na są liniowo niezależnymi wektorami w , dla każdej kolumny macierzy , .
Dowód: [31], str. 72.
Podsumowaniem jest następujący wniosek:
Dla (LA) normalnego: istnieje otoczenie punktu , t.ż. każdy punkt może być doprowadzony do jednoznacznym sterowaniem czaso-optymalnym bang–bang i kawałkami stałym. Jeżeli dodatkowo , dla każdej wartości własnej macierzy , to .
Dla (LA) normalnego:
jeżeli każda wartość własna (eigenvalue) macierzy jest rzeczywista,
to każda współrzędna każdego sterowania czaso–optymalnego ma co najwyżej przełączeń.
Poniższe twierdzenie formułuje warunek dostateczny — odwrotność zasady maksimum:
Dla (LA) właściwego: każde (pomyślne) sterowanie , prowadzące do w czasie i spełniające
(7.21) |
jest czaso–optymalne na .
Dowód: [31], str. 77.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.