Rozpatrujemy liniowe zagadnienie sterowania optymalnego (LA):
| (7.1) |
gdzie
i
są stałymi macierzami
i
, odpowiednio, a
funkcjonał kosztu jest określony przez (6.5).
Niech
będzie zbiorem osiągalnym (reachable set) z
w
chwili
:
| (7.2) |
może być zanurzony w odpowiedniej hiperpłaszczyźnie (hyperplane)
w
. Wówczas
i
będą rozumiane
w sensie odpowiednich hiperpłaszczyzn.
Dla zwartych podzbiorów
,
przestrzeni
rozważamy metrykę Hausdorffa
jest
–otoczką zbioru
(
–sack about
)
Dla (LA): Zbiór
jest wypukły i zwarty
(convex and compact). Ponadto odwzorowanie
,
, jest ciągłe z topologią w obrazie zdefiniowaną przez metrykę Hausdorffa.
Mamy
![]() |
(7.4) |
Wypukłość.
![]() |
Wtedy dla ![]()
![]() |
i
Zatem
Zwartość. Pokażemy domkniętość. Niech
Chcemy pokazać, że
. Ponieważ
,
to istnieje
, t.ż.
![]() |
Z twierdzenia Alaoglu istnieje podciąg
,
, dla
oraz istnieje
,
t. ż.
Stąd przechodząc do podciągu (por. rozdział 5)
![]() |
a zatem
i
jest domknięty, ponadto jest
ograniczony, a więc zwarty.
Ciągłość.
Dla
,
oraz
pokażemy, że istnieje
, t.ż. spełniony jest następujący warunek:
jeżeli
, to
.
Chcemy więc pokazać, że jeżeli
, to
Niech
,
.
![]() |
dla pewnego
.
Przedłużamy
zerem na
(czyli
dla
) oraz
określamy
![]() |
zatem
.
Mamy
![]() |
Niech
będzie t.ż. dla
mamy
,
gdzie
będzie wybrane później. Mamy
i
wybieramy takie, aby
Stąd wynika, że
, a z dowolności
, że
Identycznie pokazujemy, że
Warto zauważyć, że podobny wynik nie jest prawdziwy dla (NLA) — por. [14], str. 52.
Można teraz sformułować twierdzenie o istnieniu sterowania czaso–optymalnego
Dla (LA): jeżeli istnieje pomyślne sterowanie prowadzące
do celu
, to istnieje sterowanie czaso–optymalne i jest ono bang-bang.
![]()
Istnieje pomyślne sterowanie, a zatem
dla pewnego
.
Niech
| (7.5) |
Zbiór
jest więc niepusty i ograniczony z dołu.
Istnieje więc
. Chcemy pokazać, że
co oznacza, że istnieje sterowanie prowadzące do celu w najkrótszym czasie
.
Załóżmy, że
. Ponieważ
jest domknięty, to
istnieje otwarta kula
,
, t.ż.
Korzystając z ciągłości przekształcenia
otrzymujemy
dla pewnego
.
To oznacza, że
nie jest osiągalny dla pewnych
, co jest sprzeczne z
definicją
.
Z zasady bang–bang: jeżeli istnieje pomyślne sterowanie z
prowadzące
do
w czasie
, to istnieje sterowanie bang–bang prowadzące
do
w czasie
. To kończy dowód.
Sterowanie
określone na
jest ekstremalne (extremal),
jeżeli
| (7.6) |
gdzie
oznacza brzeg zbioru.
Należy zauważyć, że sterowanie ekstremalne nie musi być ani optymalne, ani nawet pomyślne!
W momencie dotarcia do celu, odpowiedż na sterowanie czaso–optymalne leży na brzegu zbioru
:
Jeżeli sterowanie
jest czaso–optymalne, to w
— momencie dotarcia do celu
— odpowiedź
leży w
(czyli
).
Załóżmy, że
jest czaso–optymalnym sterowaniem prowadzącym
do
w czasie
, czyli
i
nie leży w
.
Wówczas istnieje (otwarta) kula
. Z ciągłości
przekształcenia
istnieje
, t.ż.
zatem cel
byłby osiągalny w czasie
, co jest sprzeczne z
minimalnością
.
Odpowiedź na dowolne sterowanie nie może przechodzić z wnętrza zbioru osiągalnego na jego brzeg:
Załóżmy, że dla sterowania ![]()
gdzie
jest odpowiedzią
.
Wówczas
| (7.7) |
Jeżeli
, to istnieje
(otwarta) kula
, t.ż.
.
Dla każdego
istnieje sterowanie
, które prowadzi
do
w czasie
(punkt
jest osiągalny z
).
Rozważmy zagadnienie z ustalonym sterowaniem
:
Dla
mamy
dla
. Rozwiązanie ma postać
![]() |
czyli
Dla ustalonego
odwzorowanie
jest liniowe ciągłe i przekształca
na
, bo
. Z twierdzenia o
odwzorowaniu otwartym (por. [34], tw. 15.4, str. 147) wynika, że
przekształca
zbiory otwarte na zbiory otwarte. Stąd zbiór
jest otwarty w
oraz
, a zatem
czyli (7.7) jest spełnione, co kończy dowód lematu.
∎Dla (LA): jeżeli sterowanie
jest czaso–optymalne, to
jest ekstremalne.
Z lematu 7.2 wynika, że w
— momencie przybycia do celu
— odpowiedź
leży na brzegu zbioru osiągalnego
. Z lematu
7.3 wynika, że jeżeli odpowiedź
leży na brzegu zbioru osiągalnego
dla pewnego
, to
To kończy dowód.
∎Dla (LA) i
następujące warunki są równoważne:
jest ekstremalne na
,
istnieje
,
, t.ż.
| (7.8) |
![]()
Dowód ,,
”: załóżmy, że
jest ekstremalne,
czyli
Ponieważ
jest wypukły oraz
, to istnieje hiperpłaszczyzna podpierająca
w punkcie
, tzn. istnieje
,
,
t.ż.
Mamy
![]() |
Zatem
![]() |
Wstawiając
mamy
,
(bo macierz
jest nieosobliwa) oraz
![]() |
(7.9) |
Pokażemy, że stąd wynika
| (7.10) |
Załóżmy, że nie! Istnieje wtedy podzbiór
,
,
t.ż.
Określamy sterowanie
gdzie
jest t.ż.
Mamy wtedy
![]() |
Sprzeczność z (7.9)! Zatem (7.10) jest spełnione, co kończy dowód
.
Dowód
. Załóżmy, że istnieje
,
, t.ż.
Stąd
![]() |
dla dowolnego, ale ustalonego
. Wstawiając
i postępując
odwrotnie jak poprzednio otrzymujemy
co oznacza, że
leży na brzegu
:
Ponieważ
jest dowolne, więc otrzymujemy wynikanie
.
Z twierdzenia 7.2 i twierdzenie 7.3 wynika zasada maksimum Pontriagina dla liniowego zagadnienia czaso–optymalnego (Pontryagin maximum principle for linear time–optimal control) — szczególny przypadek zasady maksimum Pontriagina rozpatrywanej w rozdziale 9 — warunku koniecznego (necessary condition) dla sterowania optymalnego.
Dla (LA): jeżeli sterowanie
jest czaso–optymalne, to istnieje
,
, t.ż.
| (7.11) |
![]()
Każda współrzędna wektora
jest funkcją analityczną zmiennej
.
Stąd (por. [12] , twierdzenie 6.9, str. 199) na zwartym przedziale w
jest albo tożsamościowo równa
, albo znika tylko w skończonej liczbie punktów
.
Jeżeli zachodzi ten drugi przypadek dla każdej współrzędnej, to sterowanie
jest jednoznacznie
wyznaczone, poza skończonym (a więc miary
) zbiorem punktów. Wtedy sterowanie jest bang–bang
ze skończoną liczbą przełączeń (switches). Natomiast w pierwszym
przypadku sterowanie nie jest określone przez
.
Pierwszy przypadek będziemy nazywali osobliwym (singular), a drugi
normalnym (normal) — por. [24], str. 52.
(LA) nazywamy normalnym (normal), jeżeli dla każdego
,
, żadna współrzędna wektora
nie znika na zbiorze
dodatniej miary.
Każdy (LA) — normalny jest właściwy
(tzn.
).
Warunek w definicji 7.3 jest równoważny warunkowi, że żadna współrzędna nie
znika tożsamościowo.
Rozpatrujemy układ RRZ,
, w postaci macierzowej:
,
,
Układ jest właściwy, ale nie jest normalny.
Następujący wniosek pokazuje związek pomiędzy sterowaniami ekstremalnymi a sterowaniami bang–bang:
Twierdzenie 7.4 można zapisać w ogólnym formalizmie, który będzie później stosowany w rozdziale 9 w ogólnej sytuacji.
Wprowadzamy hamiltonian (Hamiltonian)
| (7.13) |
gdzie
,
.
Możemy wyrazić twierdzenie 7.4 w następującej postaci
Dla (LA): niech
będzie sterowaniem
czaso-optymalnym z odpowiedzią
. Wówczas istnieje absolutnie ciągła funkcja
, t.ż.
| (7.14) |
| (7.15) |
oraz
| (7.16) |
gdzie
![]()
Niech
będzie jak w twierdzeniu 7.4. Rozważmy zagadnienie
Jego rozwiązaniem jest
a zatem
Z twierdzenia 7.4 wynika, że
Zatem
![]() |
(7.17) |
Z definicji
warunek (7.16) oraz równania (7.14) i (7.15) są
spełnione.
Równanie (7.15) nazywa się równaniem sprzężonym (adjoint equation),
a funkcja
— ko–stanem (costate).
Rozpatrujemy układ RRZ z
,
— por. przykłady 1.2, 2.4:
| (7.18) |
lub w postaci macierzowej:
,,W języku” twierdzenia 7.4:
Mamy
Układ (7.18) jest normalny!
,,W języku” twierdzenia 7.5:
Mamy
![]() |
Stąd
i
Zatem
gdzie
,
. Dla uproszczenia
zapisu nie zaznaczono w sposób jawny zależności zmiennych od
.
Twierdzenie 7.5 implikuje, że jeżeli
jest czaso–optymalne, to
istnieją liczby
,
, t.ż.
a to jest osiągane dla
, gdzie
Funkcja liniowa
nie może być tożsamościowo
, gdyż
nie może znikać
tożsamościowo.
Opisać czaso–optymalne trajektorie.
Rozpatrujemy układ RRZ z
,
:
| (7.19) |
lub w postaci macierzowej:
,,W języku” twierdzenia 7.4:
Mamy
stąd
gdzie
,
,
.
Układ (7.19) jest normalny!
Z twierdzenia 7.4 wynika, że każde sterowanie optymalne
musi spełniać
,,W języku” twierdzenia 7.5:
Mamy
![]() |
Stąd
i
Stąd
, gdzie
i
są stałymi.
Twierdzenie 7.5 implikuje, że jeżeli
jest
czaso–optymalne, to
a to jest osiągane jedynie dla
, gdzie
Zatem każde sterowanie czaso–optymalne jest bang–bang i okresowe o okresie
.
Opisać czaso–optymalne trajektorie.
W przykładzie 7.1 rozpatrywany był układ właściwy, który nie jest normalny.
Niech
. Wówczas każde ze sterowań
,
, gdzie
oraz
![]() |
dla
,
jest czaso–optymalne z
, ale tylko
jest bang–bang.
Jeżeli (LA) jest normalny oraz istnieje pomyślne sterowanie (prowadzące
do
), to istnieje jednoznaczne sterowanie czaso–optymalne. To sterowanie
jest bang–bang i kawałkami stałe.
![]()
Z twierdzenia 7.1 wynika istnienie. Z twierdzenia 7.4 i wniosku 7.1
wynika, że każde sterowanie czaso–optymalne jest bang–bang.
Załóżmy, że
oraz
są dwoma różnymi sterowaniami czaso–optymalnymi bang–bang.
Wówczas sterowanie
jest też czaso–optymalne, ale nie jest
bang–bang. Otrzymujemy sprzeczność: zatem sterowanie czaso–optymalne jest jednoznaczne.
Sterowanie czaso–optymalne jest kawałkami stałe, gdyż każda współrzędna zmienia wartość tylko wtedy,
gdy ta sama współrzędna
przyjmuje wartość
, a to może zdarzyć się tylko w
skończonej liczbie punktów odcinka
.
Niech
będzie ustalone,
oraz
.
Jeżeli
| (7.20) |
dla każdego
i każdego
, t.ż.
to odpowiedź z
do
jest
jednoznaczna (unique).
Załóżmy, ze macierz
nie ma żadnej kolumny złożonej z samych
,
i niech
.
Wówczas następujące warunki są równoważne
sterowanie prowadzące
do
w czasie
jest jednoznaczne,
odpowiedź z
do
w czasie
jest
jednoznaczna,
jest ekstremalnym punktem
.
Dowód: [31], str. 69–71.![]()
Dalej w tym rozdziale będziemy zakładać, że macierz
nie ma żadnej kolumny złożonej z samych
. Nie zmniejsza to ogólności!
Zbiór
jest ściśle wypukły jeżeli
dla każdych dwóch punktów
.
(LA) jest normalny na
jest
ściśle wypukły dla pewnego
.
Dowód: [31], str. 71.![]()
(LA) jest normalny na
są liniowo niezależnymi wektorami w
, dla każdej kolumny
macierzy
,
.
Dowód: [31], str. 72.![]()
Podsumowaniem jest następujący wniosek:
Dla (LA) normalnego: istnieje otoczenie
punktu
, t.ż. każdy punkt
może być doprowadzony do
jednoznacznym sterowaniem czaso-optymalnym
bang–bang i kawałkami stałym. Jeżeli dodatkowo
, dla każdej wartości własnej
macierzy
, to
.
Dla (LA) normalnego:
jeżeli każda wartość własna (eigenvalue) macierzy
jest rzeczywista,
to każda współrzędna każdego sterowania czaso–optymalnego ma
co najwyżej
przełączeń.
Poniższe twierdzenie formułuje warunek dostateczny — odwrotność zasady maksimum:
Dla (LA) właściwego: każde (pomyślne) sterowanie
, prowadzące
do
w czasie
i spełniające
![]() |
(7.21) |
jest czaso–optymalne na
.
Dowód: [31], str. 77.![]()
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.