Rozpatrujemy liniowe zagadnienie sterowania optymalnego (LA):
![]() |
(7.1) |
gdzie i
są stałymi macierzami
i
, odpowiednio, a
funkcjonał kosztu jest określony przez (6.5).
Niech będzie zbiorem osiągalnym (reachable set) z
w
chwili
:
![]() |
(7.2) |
może być zanurzony w odpowiedniej hiperpłaszczyźnie (hyperplane)
w
. Wówczas
i
będą rozumiane
w sensie odpowiednich hiperpłaszczyzn.
Dla zwartych podzbiorów ,
przestrzeni
rozważamy metrykę Hausdorffa
![]() |
jest
–otoczką zbioru
(
–sack about
)
![]() |
Dla (LA): Zbiór jest wypukły i zwarty
(convex and compact). Ponadto odwzorowanie
,
, jest ciągłe z topologią w obrazie zdefiniowaną przez metrykę Hausdorffa.
Mamy
![]() |
(7.4) |
Wypukłość.
![]() |
Wtedy dla
![]() |
i
![]() |
Zatem
![]() |
Zwartość. Pokażemy domkniętość. Niech
![]() |
Chcemy pokazać, że . Ponieważ
,
to istnieje
, t.ż.
![]() |
Z twierdzenia Alaoglu istnieje podciąg ,
, dla
oraz istnieje
,
t. ż.
![]() |
Stąd przechodząc do podciągu (por. rozdział 5)
![]() |
a zatem i
jest domknięty, ponadto jest
ograniczony, a więc zwarty.
Ciągłość.
Dla ,
oraz
pokażemy, że istnieje
, t.ż. spełniony jest następujący warunek:
jeżeli , to
.
Chcemy więc pokazać, że jeżeli , to
![]() |
Niech ,
.
![]() |
dla pewnego .
Przedłużamy zerem na
(czyli
dla
) oraz
określamy
![]() |
zatem .
Mamy
![]() |
Niech będzie t.ż. dla
mamy
,
gdzie
będzie wybrane później. Mamy
![]() |
i
wybieramy takie, aby
![]() |
Stąd wynika, że , a z dowolności
, że
![]() |
Identycznie pokazujemy, że
![]() |
Warto zauważyć, że podobny wynik nie jest prawdziwy dla (NLA) — por. [14], str. 52.
Można teraz sformułować twierdzenie o istnieniu sterowania czaso–optymalnego
Dla (LA): jeżeli istnieje pomyślne sterowanie prowadzące
do celu
, to istnieje sterowanie czaso–optymalne i jest ono bang-bang.
Istnieje pomyślne sterowanie, a zatem dla pewnego
.
Niech
![]() |
(7.5) |
Zbiór jest więc niepusty i ograniczony z dołu.
Istnieje więc
. Chcemy pokazać, że
![]() |
co oznacza, że istnieje sterowanie prowadzące do celu w najkrótszym czasie .
Załóżmy, że . Ponieważ
jest domknięty, to
istnieje otwarta kula
,
, t.ż.
![]() |
Korzystając z ciągłości przekształcenia otrzymujemy
![]() |
dla pewnego .
To oznacza, że nie jest osiągalny dla pewnych
, co jest sprzeczne z
definicją
.
Z zasady bang–bang: jeżeli istnieje pomyślne sterowanie z prowadzące
do
w czasie
, to istnieje sterowanie bang–bang prowadzące
do
w czasie
. To kończy dowód.
Sterowanie określone na
jest ekstremalne (extremal),
jeżeli
![]() |
(7.6) |
gdzie oznacza brzeg zbioru.
Należy zauważyć, że sterowanie ekstremalne nie musi być ani optymalne, ani nawet pomyślne!
W momencie dotarcia do celu, odpowiedż na sterowanie czaso–optymalne leży na brzegu zbioru
:
Jeżeli sterowanie jest czaso–optymalne, to w
— momencie dotarcia do celu
— odpowiedź
leży w
(czyli
).
Załóżmy, że jest czaso–optymalnym sterowaniem prowadzącym
do
w czasie
, czyli
![]() |
i nie leży w
.
Wówczas istnieje (otwarta) kula . Z ciągłości
przekształcenia
istnieje
, t.ż.
![]() |
zatem cel byłby osiągalny w czasie
, co jest sprzeczne z
minimalnością
.
Odpowiedź na dowolne sterowanie nie może przechodzić z wnętrza zbioru osiągalnego na jego brzeg:
Załóżmy, że dla sterowania
![]() |
gdzie jest odpowiedzią
.
Wówczas
![]() |
(7.7) |
Jeżeli , to istnieje
(otwarta) kula
, t.ż.
.
Dla każdego istnieje sterowanie
, które prowadzi
do
w czasie
(punkt
jest osiągalny z
).
Rozważmy zagadnienie z ustalonym sterowaniem :
![]() |
Dla mamy
dla
. Rozwiązanie ma postać
![]() |
czyli
![]() |
Dla ustalonego odwzorowanie
jest liniowe ciągłe i przekształca
na
, bo
. Z twierdzenia o
odwzorowaniu otwartym (por. [34], tw. 15.4, str. 147) wynika, że
przekształca
zbiory otwarte na zbiory otwarte. Stąd zbiór
![]() |
jest otwarty w oraz
, a zatem
![]() |
czyli (7.7) jest spełnione, co kończy dowód lematu.
∎Dla (LA): jeżeli sterowanie jest czaso–optymalne, to
jest ekstremalne.
Z lematu 7.2 wynika, że w
— momencie przybycia do celu
— odpowiedź
leży na brzegu zbioru osiągalnego
. Z lematu
7.3 wynika, że jeżeli odpowiedź
leży na brzegu zbioru osiągalnego
dla pewnego
, to
![]() |
To kończy dowód.
∎Dla (LA) i następujące warunki są równoważne:
jest ekstremalne na
,
istnieje ,
, t.ż.
![]() |
(7.8) |
Dowód ,,”: załóżmy, że
jest ekstremalne,
czyli
![]() |
Ponieważ jest wypukły oraz
, to istnieje hiperpłaszczyzna podpierająca
w punkcie
, tzn. istnieje
,
,
t.ż.
![]() |
Mamy
![]() |
Zatem
![]() |
Wstawiając mamy
,
(bo macierz
jest nieosobliwa) oraz
![]() |
(7.9) |
Pokażemy, że stąd wynika
![]() |
(7.10) |
Załóżmy, że nie! Istnieje wtedy podzbiór ,
,
t.ż.
![]() |
Określamy sterowanie
![]() |
gdzie jest t.ż.
![]() |
Mamy wtedy
![]() |
Sprzeczność z (7.9)! Zatem (7.10) jest spełnione, co kończy dowód .
Dowód . Załóżmy, że istnieje
,
, t.ż.
![]() |
Stąd
![]() |
dla dowolnego, ale ustalonego . Wstawiając
i postępując
odwrotnie jak poprzednio otrzymujemy
![]() |
co oznacza, że leży na brzegu
:
![]() |
Ponieważ jest dowolne, więc otrzymujemy wynikanie
.
Z twierdzenia 7.2 i twierdzenie 7.3 wynika zasada maksimum Pontriagina dla liniowego zagadnienia czaso–optymalnego (Pontryagin maximum principle for linear time–optimal control) — szczególny przypadek zasady maksimum Pontriagina rozpatrywanej w rozdziale 9 — warunku koniecznego (necessary condition) dla sterowania optymalnego.
Dla (LA): jeżeli sterowanie jest czaso–optymalne, to istnieje
,
, t.ż.
![]() |
(7.11) |
Każda współrzędna wektora jest funkcją analityczną zmiennej
.
Stąd (por. [12] , twierdzenie 6.9, str. 199) na zwartym przedziale w
jest albo tożsamościowo równa
, albo znika tylko w skończonej liczbie punktów
.
Jeżeli zachodzi ten drugi przypadek dla każdej współrzędnej, to sterowanie
jest jednoznacznie
wyznaczone, poza skończonym (a więc miary
) zbiorem punktów. Wtedy sterowanie jest bang–bang
ze skończoną liczbą przełączeń (switches). Natomiast w pierwszym
przypadku sterowanie nie jest określone przez
.
Pierwszy przypadek będziemy nazywali osobliwym (singular), a drugi
normalnym (normal) — por. [24], str. 52.
(LA) nazywamy normalnym (normal), jeżeli dla każdego
,
, żadna współrzędna wektora
nie znika na zbiorze
dodatniej miary.
Każdy (LA) — normalny jest właściwy
(tzn. ).
Warunek w definicji 7.3 jest równoważny warunkowi, że żadna współrzędna nie
znika tożsamościowo.
Rozpatrujemy układ RRZ, , w postaci macierzowej:
![]() |
,
,
![]() |
Układ jest właściwy, ale nie jest normalny.
Następujący wniosek pokazuje związek pomiędzy sterowaniami ekstremalnymi a sterowaniami bang–bang:
Twierdzenie 7.4 można zapisać w ogólnym formalizmie, który będzie później stosowany w rozdziale 9 w ogólnej sytuacji.
Wprowadzamy hamiltonian (Hamiltonian)
![]() |
(7.13) |
gdzie ,
.
Możemy wyrazić twierdzenie 7.4 w następującej postaci
Dla (LA): niech będzie sterowaniem
czaso-optymalnym z odpowiedzią
. Wówczas istnieje absolutnie ciągła funkcja
, t.ż.
![]() |
(7.14) |
![]() |
(7.15) |
oraz
![]() |
(7.16) |
gdzie
![]() |
Niech będzie jak w twierdzeniu 7.4. Rozważmy zagadnienie
![]() |
Jego rozwiązaniem jest
![]() |
a zatem
![]() |
Z twierdzenia 7.4 wynika, że
![]() |
Zatem
![]() |
(7.17) |
Z definicji warunek (7.16) oraz równania (7.14) i (7.15) są
spełnione.
Równanie (7.15) nazywa się równaniem sprzężonym (adjoint equation),
a funkcja — ko–stanem (costate).
Rozpatrujemy układ RRZ z ,
— por. przykłady 1.2, 2.4:
![]() |
(7.18) |
lub w postaci macierzowej:
![]() |
,,W języku” twierdzenia 7.4:
Mamy
![]() |
![]() |
Układ (7.18) jest normalny!
,,W języku” twierdzenia 7.5:
Mamy
![]() |
![]() |
Stąd
![]() |
i
![]() |
Zatem
![]() |
gdzie ,
. Dla uproszczenia
zapisu nie zaznaczono w sposób jawny zależności zmiennych od
.
Twierdzenie 7.5 implikuje, że jeżeli jest czaso–optymalne, to
istnieją liczby
,
, t.ż.
![]() |
a to jest osiągane dla , gdzie
![]() |
Funkcja liniowa nie może być tożsamościowo
, gdyż
nie może znikać
tożsamościowo.
Opisać czaso–optymalne trajektorie.
Rozpatrujemy układ RRZ z ,
:
![]() |
(7.19) |
lub w postaci macierzowej:
![]() |
,,W języku” twierdzenia 7.4:
Mamy
![]() |
![]() |
![]() |
stąd
![]() |
gdzie ,
,
.
Układ (7.19) jest normalny!
Z twierdzenia 7.4 wynika, że każde sterowanie optymalne musi spełniać
![]() |
,,W języku” twierdzenia 7.5:
Mamy
![]() |
![]() |
Stąd
![]() |
i
![]() |
Stąd , gdzie
i
są stałymi.
Twierdzenie 7.5 implikuje, że jeżeli jest
czaso–optymalne, to
![]() |
a to jest osiągane jedynie dla , gdzie
![]() |
Zatem każde sterowanie czaso–optymalne jest bang–bang i okresowe o okresie .
Opisać czaso–optymalne trajektorie.
W przykładzie 7.1 rozpatrywany był układ właściwy, który nie jest normalny.
![]() |
Niech . Wówczas każde ze sterowań
,
, gdzie
![]() |
oraz
![]() |
![]() |
dla ,
![]() |
jest czaso–optymalne z , ale tylko
jest bang–bang.
Jeżeli (LA) jest normalny oraz istnieje pomyślne sterowanie (prowadzące
do
), to istnieje jednoznaczne sterowanie czaso–optymalne. To sterowanie
jest bang–bang i kawałkami stałe.
Z twierdzenia 7.1 wynika istnienie. Z twierdzenia 7.4 i wniosku 7.1
wynika, że każde sterowanie czaso–optymalne jest bang–bang.
Załóżmy, że oraz
są dwoma różnymi sterowaniami czaso–optymalnymi bang–bang.
Wówczas sterowanie
jest też czaso–optymalne, ale nie jest
bang–bang. Otrzymujemy sprzeczność: zatem sterowanie czaso–optymalne jest jednoznaczne.
Sterowanie czaso–optymalne jest kawałkami stałe, gdyż każda współrzędna zmienia wartość tylko wtedy,
gdy ta sama współrzędna przyjmuje wartość
, a to może zdarzyć się tylko w
skończonej liczbie punktów odcinka
.
Niech będzie ustalone,
oraz
.
Jeżeli
![]() |
(7.20) |
dla każdego i każdego
, t.ż.
![]() |
to odpowiedź z do
jest
jednoznaczna (unique).
Załóżmy, ze macierz nie ma żadnej kolumny złożonej z samych
,
i niech
.
Wówczas następujące warunki są równoważne
sterowanie prowadzące do
w czasie
jest jednoznaczne,
odpowiedź z do
w czasie
jest
jednoznaczna,
jest ekstremalnym punktem
.
Dowód: [31], str. 69–71.
Dalej w tym rozdziale będziemy zakładać, że macierz nie ma żadnej kolumny złożonej z samych
. Nie zmniejsza to ogólności!
Zbiór jest ściśle wypukły jeżeli
![]() |
dla każdych dwóch punktów .
(LA) jest normalny na
jest
ściśle wypukły dla pewnego
.
Dowód: [31], str. 71.
(LA) jest normalny na
są liniowo niezależnymi wektorami w
, dla każdej kolumny
macierzy
,
.
Dowód: [31], str. 72.
Podsumowaniem jest następujący wniosek:
Dla (LA) normalnego: istnieje otoczenie punktu
, t.ż. każdy punkt
może być doprowadzony do
jednoznacznym sterowaniem czaso-optymalnym
bang–bang i kawałkami stałym. Jeżeli dodatkowo
, dla każdej wartości własnej
macierzy
, to
.
Dla (LA) normalnego:
jeżeli każda wartość własna (eigenvalue) macierzy
jest rzeczywista,
to każda współrzędna każdego sterowania czaso–optymalnego ma
co najwyżej przełączeń.
Poniższe twierdzenie formułuje warunek dostateczny — odwrotność zasady maksimum:
Dla (LA) właściwego: każde (pomyślne) sterowanie , prowadzące
do
w czasie
i spełniające
![]() |
(7.21) |
jest czaso–optymalne na .
Dowód: [31], str. 77.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.