7. Liniowe zagadnienie czaso–optymalne
Rozpatrujemy liniowe zagadnienie sterowania optymalnego (LA):
gdzie A i B są stałymi macierzami n×n i n×m, odpowiednio, a
funkcjonał kosztu jest określony przez (6.5).
Definicja 7.1
Niech Kt;x0 będzie zbiorem osiągalnym (reachable set) z x0 w
chwili t>0:
|
K(t;x0)={x(t,x0,u(.)):u∈Um[0,t]}⊂Rn, |
| (7.2) |
Kt;x0 może być zanurzony w odpowiedniej hiperpłaszczyźnie (hyperplane)
w Rn. Wówczas IntKt;x0 i ∂Kt;x0 będą rozumiane
w sensie odpowiednich hiperpłaszczyzn.
Z zasady bang–bang 5.1 dla układu liniowego (-LA) (czyli y˙=-Ay-Bu) wynika, że
a zatem
|
Kt1;x0=KBBt1;x0. |
| (7.3) |
Dla zwartych podzbiorów A, B przestrzeni Rn rozważamy metrykę Hausdorffa
|
dHA,B=infε>0:A⊂NεB,B⊂NεA, |
|
NεA jest ε–otoczką zbioru A
(ε–sack about A)
|
NεA=x∈Rn:dx,A<ε,dx,A=infx-y:y∈A. |
|
Lemat 7.1
Dla (LA): Zbiór Kt;x0 jest wypukły i zwarty
(convex and compact). Ponadto odwzorowanie t⟶Kt;x0,
0≤t<∞, jest ciągłe z topologią w obrazie zdefiniowaną przez metrykę Hausdorffa.
Dowód: [19], str. 32, [31], str. 60.
Mamy
|
y∈K(t;x0)⇔∃u∈Um[0,t]:y=eAtx0+∫0teAt-sBu(s)ds. |
| (7.4) |
-
Wypukłość.
|
xi∈K(t;x0)⇔∃ui∈Um[0,t]:xi=eAtx0+∫0teAt-sBui(s)dsi=1,2 . |
|
Wtedy dla λ∈0,1
|
λx1+1-λx2=eAtx0+∫0teAt-sBλu1s+1-λu2sdsi=1,2 |
|
i
Zatem
-
Zwartość. Pokażemy domkniętość. Niech
|
xjj∈N⊂Kt;x0orazxj→ywRn. |
|
Chcemy pokazać, że y∈Kt;x0. Ponieważ xj∈Kt;x0,
to istnieje uj∈Um0,t, t.ż.
|
xj=eAtx0+∫0teAt-sBujsds. |
|
Z twierdzenia Alaoglu istnieje podciąg jkk∈N,
jk→∞, dla k→∞ oraz istnieje u∈Um0,t,
t. ż.
Stąd przechodząc do podciągu (por. rozdział 5)
|
y=eAtx0+∫0teAt-sBusds, |
|
a zatem y∈Kt;x0 i Kt;x0 jest domknięty, ponadto jest
ograniczony, a więc zwarty.
-
Ciągłość.
Dla x0∈Rn, t0≥0 oraz ε>0 pokażemy, że istnieje
δ∈] 0,1[, t.ż. spełniony jest następujący warunek:
-
jeżeli t~-t0<δ, to dHKt~;x0,Kt0,x0<ε.
Chcemy więc pokazać, że jeżeli t~-t0<δ, to
|
Kt~;x0⊂NεKt0,x0orazKt0,x0⊂NεKt~;x0. |
|
Niech T=t0+1, C=max0≤s≤Te-AsB.
|
y~∈Kt~;x0⇔y~=eAt~x0+∫0t~eAt~-sBu~sds |
|
dla pewnego u~∈Um0,t~.
Przedłużamy u~ zerem na 0,T (czyli u~s=0 dla t∈]t~,T]) oraz
określamy
|
y0=eAt0x0+∫0t0eAt0-sBu~sds, |
|
zatem y0∈Kt0;x0.
Mamy
|
y~-y0=eAt~x0-eAt0x0+∫0t~eAt~-sBu~sds-∫0t0eAt0-sBu~sds≤eAt~-eAt0x0+eAt~-eAt0∫0t~e-AsBu~sds+eAt0∫t0t~e-AsBu~sds. |
|
Niech δ>0 będzie t.ż. dla t~-t0<δ mamy eAt~-eAt0<ε1,
gdzie ε1>0 będzie wybrane później. Mamy
|
y~-y0≤ε1x0+ε1TCm+eAt0δCm. |
|
δ i ε1 wybieramy takie, aby
|
ε1x0+ε1TCm+eAt0Cmδ<ε. |
|
Stąd wynika, że y~∈NεKt0;x0, a z dowolności y~, że
Identycznie pokazujemy, że
∎
Warto zauważyć, że podobny wynik nie jest prawdziwy dla (NLA) — por. [14], str. 52.
Można teraz sformułować twierdzenie o istnieniu sterowania czaso–optymalnego
Twierdzenie 7.1
Dla (LA): jeżeli istnieje pomyślne sterowanie prowadzące x0∈Rn
do celu 0∈Rn, to istnieje sterowanie czaso–optymalne i jest ono bang-bang.
Dowód: [19], str. 31; [31], str. 60; [36], str. 147;
por. [27], str. 173.
Istnieje pomyślne sterowanie, a zatem 0∈Kt~;x0 dla pewnego t~≥0.
Niech
|
t1=inft≥0:0∈Kt;x0. |
| (7.5) |
Zbiór t≥0: 0∈Kt;x0 jest więc niepusty i ograniczony z dołu.
Istnieje więc inf. Chcemy pokazać, że
co oznacza, że istnieje sterowanie prowadzące do celu w najkrótszym czasie t1.
Załóżmy, że 0∉Kt1;x0. Ponieważ Kt1;x0 jest domknięty, to
istnieje otwarta kula B=B0,ϱ, ϱ>0, t.ż.
Korzystając z ciągłości przekształcenia t→Kt;x0 otrzymujemy
|
B0,ϱ2∩Kt,x0=∅dlat1≤t≤t1+δ, |
|
dla pewnego δ>0.
To oznacza, że 0∈Rn nie jest osiągalny dla pewnych t>t1, co jest sprzeczne z
definicją t1.
Z zasady bang–bang: jeżeli istnieje pomyślne sterowanie z Um prowadzące x0∈Rn
do 0∈Rn w czasie t1, to istnieje sterowanie bang–bang prowadzące x0∈Rn
do 0∈Rn w czasie t1. To kończy dowód.
∎
Definicja 7.2
Sterowanie u określone na 0,τ jest ekstremalne (extremal),
jeżeli
|
x(t;x0,u(.))∈∂K(t;x0)∀t∈[0,τ], |
| (7.6) |
gdzie ∂ oznacza brzeg zbioru.
Należy zauważyć, że sterowanie ekstremalne nie musi być ani optymalne, ani nawet pomyślne!
W momencie dotarcia do celu, odpowiedż na sterowanie czaso–optymalne leży na brzegu zbioru
Kt1;x0:
Lemat 7.2
Jeżeli sterowanie u∗ jest czaso–optymalne, to w t1 — momencie dotarcia do celu
0∈Rn — odpowiedź x(t)=x(t;x0,u∗(.)) leży w
∂Kt1;x0 (czyli 0∈∂Kt1;x0).
Dowód
Załóżmy, że u∗ jest czaso–optymalnym sterowaniem prowadzącym x0∈Rn do
0∈Rn w czasie t1, czyli
|
x(t1)=x(t1;x0,u∗(.))=0∈Rn |
|
i xt1=0 nie leży w ∂Kt1;x0.
Wówczas istnieje (otwarta) kula B0,ϱ⊂Kt1;x0. Z ciągłości
przekształcenia t↦Kt;x0 istnieje δ>0, t.ż.
|
B0,ϱ2⊂Kt;x0dlat1-δ≤t≤t1. |
|
zatem cel 0∈Rn byłby osiągalny w czasie t<t1, co jest sprzeczne z
minimalnością t1.
∎
Odpowiedź na dowolne sterowanie nie może przechodzić z wnętrza zbioru osiągalnego
na jego brzeg:
Lemat 7.3
Załóżmy, że dla sterowania u∈Um0,t1
|
x~=xt~∈IntKt~;x0dlapewnego 0<t~<t1, |
|
gdzie x=xt jest odpowiedzią x(t)=x(t;x0,u(.)).
Wówczas
|
x(t)∈IntK(t;x0)∀t∈]t~,t1]. |
| (7.7) |
Dowód
Jeżeli x~=xt~∈IntKt~;x0, to istnieje
(otwarta) kula B~=Bx~,δ, t.ż. B~⊂Kt~;x0.
Dla każdego x~0∈B~ istnieje sterowanie u~, które prowadzi
x0 do x~0 w czasie t~ (punkt x~0 jest osiągalny z x0).
Rozważmy zagadnienie z ustalonym sterowaniem u:
|
y˙=Ay+Bu,yt~=x~0,t>t~. |
|
Dla x~0=x~ mamy yt=xt dla t∈t~,t1. Rozwiązanie ma postać
|
yt=eAt-t~x~0+∫t~teAt-sBusds, |
|
czyli
Dla ustalonego t>t~ odwzorowanie Ft jest liniowe ciągłe i przekształca
Rn na Rn, bo detFt≠0. Z twierdzenia o
odwzorowaniu otwartym (por. [34], tw. 15.4, str. 147) wynika, że Ft przekształca
zbiory otwarte na zbiory otwarte. Stąd zbiór
|
Ft:=y∈Rn:y=Ftx~0+Gt,x~0∈B~ |
|
jest otwarty w Rn oraz Ft⊂Kt;x0, a zatem
czyli (7.7) jest spełnione, co kończy dowód lematu.
∎
Twierdzenie 7.2
Dla (LA): jeżeli sterowanie u∗ jest czaso–optymalne, to
u∗ jest ekstremalne.
Dowód: [31], str. 61.
Z lematu 7.2 wynika, że w t1 — momencie przybycia do celu 0 — odpowiedź
xt1 leży na brzegu zbioru osiągalnego ∂Kt1;x0. Z lematu
7.3 wynika, że jeżeli odpowiedź xt¯ leży na brzegu zbioru osiągalnego
∂Kt¯;x0 dla pewnego t¯∈]0,t1], to
|
xt∈∂Kt;x0∀t∈0,t¯. |
|
To kończy dowód.
∎
Twierdzenie 7.3
Dla (LA) i ue∈Um0,te następujące warunki są równoważne:
-
ue jest ekstremalne na 0,te,
-
istnieje h∈Rn, h≠0, t.ż.
|
hTe-tABuet=maxv∈ΩhTe-tABv,dlap.k.t∈0,te. |
| (7.8) |
Dowód: [31], str. 62; [19], str. 33.
-
Dowód ,,⇒”: załóżmy, że ue∈Um0,te jest ekstremalne,
czyli
|
xe(t):=x(t;x0,ue(.))∈∂K(t;x0)∀t∈[0,te]. |
|
Ponieważ Kte;x0 jest wypukły oraz
xete∈∂Kte;x0, to istnieje hiperpłaszczyzna podpierająca
Kte;x0 w punkcie xete, tzn. istnieje b∈Rn, b≠0,
t.ż.
|
bTx≤bTxete∀x∈Kte;x0. |
|
Mamy
|
x∈Kte;x0⇔x=eAtex0+∫0teeAte-sBusds,u∈Um0,te. |
|
Zatem
|
bTeAtex0+bT∫0teeAte-sBusds≤bTeAtex0+bT∫0teeAte-sBuesds∀u∈Um0,te. |
|
Wstawiając hT=bTeAte mamy h∈Rn, h≠0 (bo macierz
eAte jest nieosobliwa) oraz
|
∫0tehTe-AsBusds≤∫0tehTe-AsBuesds∀u∈Um0,te. |
| (7.9) |
Pokażemy, że stąd wynika
|
hTe-AsBues=maxv∈ΩhTe-AsBvdlap.k.s∈0,te. |
| (7.10) |
Załóżmy, że nie! Istnieje wtedy podzbiór I⊂0,te, I>0,
t.ż.
|
hTe-AsBues<maxv∈ΩhTe-AsBvdlas∈I. |
|
Określamy sterowanie
|
u~t=uett∈I′:=0,te∖Iu∗tt∈I, |
|
gdzie u∗ jest t.ż.
|
hTe-AsBu∗s=maxv∈ΩhTe-AsBvdlas∈I. |
|
Mamy wtedy
|
∫0tehTe-AsBu~sds=∫IhTe-AsBu∗sds+∫I′hTe-AsBuesds>∫0tehTe-AsBuesds. |
|
Sprzeczność z (7.9)! Zatem (7.10) jest spełnione, co kończy dowód ⇒.
-
Dowód ⇐. Załóżmy, że istnieje h∈Rn, h≠0, t.ż.
|
hTe-AtBuet=maxv∈ΩhTe-AtBvdlap.k.t∈0,te. |
|
Stąd
|
∫0thTe-AsBusds≤∫0thTe-AsBuesds∀u∈Um0,te, |
|
dla dowolnego, ale ustalonego t∈0,te. Wstawiając bT=hTe-At i postępując
odwrotnie jak poprzednio otrzymujemy
|
bTxt≤bTxet∀xt∈Kt;x0, |
|
co oznacza, że xet leży na brzegu Kt;x0:
Ponieważ t jest dowolne, więc otrzymujemy wynikanie ⇐.
∎
Z twierdzenia 7.2 i twierdzenie 7.3 wynika zasada maksimum Pontriagina
dla liniowego zagadnienia czaso–optymalnego (Pontryagin maximum principle for
linear time–optimal control) — szczególny przypadek zasady maksimum Pontriagina rozpatrywanej w rozdziale
9 — warunku koniecznego (necessary condition) dla
sterowania optymalnego.
Twierdzenie 7.4
Dla (LA): jeżeli sterowanie u∗ jest czaso–optymalne, to istnieje h∈Rn,
h≠0, t.ż.
|
hTe-tABu∗t=maxv∈ΩhTe-tABv,dlap.k.t∈0,t1, |
| (7.11) |
Uwaga 7.1
Każda współrzędna wektora hTe-tAB∈Rm jest funkcją analityczną zmiennej t.
Stąd (por. [12] , twierdzenie 6.9, str. 199) na zwartym przedziale w 0,t1
jest albo tożsamościowo równa 0, albo znika tylko w skończonej liczbie punktów 0<t≤t1.
Jeżeli zachodzi ten drugi przypadek dla każdej współrzędnej, to sterowanie u jest jednoznacznie
wyznaczone, poza skończonym (a więc miary 0) zbiorem punktów. Wtedy sterowanie jest bang–bang
ze skończoną liczbą przełączeń (switches). Natomiast w pierwszym
przypadku sterowanie nie jest określone przez maxv∈ΩhTe-tABv.
Pierwszy przypadek będziemy nazywali osobliwym (singular), a drugi
normalnym (normal) — por. [24], str. 52.
Definicja 7.3
(LA) nazywamy normalnym (normal), jeżeli dla każdego
h∈Rn, h≠0, żadna współrzędna wektora hTe-tAB∈Rm nie znika na zbiorze
dodatniej miary.
Każdy (LA) — normalny jest właściwy
(tzn. rankM=n).
Warunek w definicji 7.3 jest równoważny warunkowi, że żadna współrzędna nie
znika tożsamościowo.
Przykład 7.1
Rozpatrujemy układ RRZ, n=m=2, w postaci macierzowej:
|
x˙1x˙2=Ax1x2+But,A=0000,B=1001. |
|
h∈R2, h≠0,
|
hTe-tAB=h1,h210011001=h1,h2. |
|
Układ jest właściwy, ale nie jest normalny.
Następujący wniosek pokazuje związek pomiędzy sterowaniami ekstremalnymi a
sterowaniami bang–bang:
Wniosek 7.1
Jeżeli (LA) jest normalny, to warunek (7.8) jest równoważny
warunkowi
|
ueit=signhTe-tABi,i=1,…,m,dlap.k.t∈0,te. |
| (7.12) |
Twierdzenie 7.4 można zapisać w ogólnym formalizmie, który będzie
później stosowany w rozdziale 9 w ogólnej sytuacji.
Definicja 7.4
Wprowadzamy hamiltonian (Hamiltonian)
|
Hw,x,u=wTAx+Bu, |
| (7.13) |
gdzie w,x∈Rn, u∈Um.
Możemy wyrazić twierdzenie 7.4 w następującej postaci
Twierdzenie 7.5
Dla (LA): niech u∗∈Um0,t1 będzie sterowaniem
czaso-optymalnym z odpowiedzią
x∗=x∗(t)=x(t;x0,u∗(.)). Wówczas istnieje absolutnie ciągła funkcja
w:0,t1→Rn, t.ż.
|
x˙∗j=∂∂wjHw,x∗,u∗,j=1,…,n,p.w.na0,t1, |
| (7.14) |
|
w˙j=-∂∂xjHw,x∗,u∗,j=1,…,n,p.w.na0,t1, |
| (7.15) |
oraz
|
Hwt,x∗t,u∗t=Mwt,x∗t,dlap.w.t∈0,t1, |
| (7.16) |
gdzie
Dowód: [19], str. 35.
Niech h∈Rn będzie jak w twierdzeniu 7.4. Rozważmy zagadnienie
Jego rozwiązaniem jest
a zatem
|
wTt=hTe-tA,boe-tATT=e-tA. |
|
Z twierdzenia 7.4 wynika, że
|
hTe-tABu∗t=maxv∈ΩhTe-tABv. |
|
Zatem
|
Hwt,x∗t,u∗t=wTtAx∗t+Bu∗t=hTe-tAAx∗t+hTe-tABu∗t=hTe-tAAx∗t+maxv∈ΩhTe-tABv=maxv∈ΩhTe-tAAx∗t+hTe-tABv=maxv∈ΩwTtAx∗t+wTtBv=Mwt,x∗t. |
| (7.17) |
Z definicji H warunek (7.16) oraz równania (7.14) i (7.15) są
spełnione.
∎
Definicja 7.5
Równanie (7.15) nazywa się równaniem sprzężonym (adjoint equation),
a funkcja w — ko–stanem (costate).
Przykład 7.2 (wagon odrzutowy, [36], str. 29–34;
[19], str. 36; [31], str. 64, 109, 111)
Rozpatrujemy układ RRZ z n=2, m=1 — por. przykłady 1.2, 2.4:
|
x˙1=x2,x˙2=u,u=ut∈-1,1, |
| (7.18) |
lub w postaci macierzowej:
|
x˙1x˙2=Ax1x2+But,A=0100,B=01. |
|
-
,,W języku” twierdzenia 7.4:
Mamy
|
e-tA=I-tA=1-t01,h=h1h2,h12+h22≠0, |
|
|
hTe-tAB=h1,h21-t0101=h1,-h1t+h201=h2-h1t. |
|
Układ (7.18) jest normalny!
Z twierdzenia 7.4 i wniosku 7.1 wynika, że każde
optymalne sterowanie u∗ musi spełniać
dla pewnego h∈R2∖0.
-
,,W języku” twierdzenia 7.5:
Mamy
|
Hw,x,v=wTAx+Bv=w1,w20100x1x2+01v, |
|
Stąd
i
Zatem
|
Hw,x,v=w01x2+w02-w01tv, |
|
gdzie w01=w10∈R1, w02=w20∈R1. Dla uproszczenia
zapisu nie zaznaczono w sposób jawny zależności zmiennych od t.
Twierdzenie 7.5 implikuje, że jeżeli u∗ jest czaso–optymalne, to
istnieją liczby w0i, i=1,2, t.ż.
|
Hw,x∗,u∗=Mw,x∗=max-1≤v≤1Hw,x∗,v=w01x∗2+w02-w01t |
|
a to jest osiągane dla v=u∗t, gdzie
Funkcja liniowa w02-w01t nie może być tożsamościowo 0, gdyż wt=e-tATh nie może znikać
tożsamościowo.
Z twierdzenia 7.1 i przykładu 2.4 wynika istnienie sterowania czaso–optymalnego
(dla każdego punktu x0∈R2).
Z powyższych rozważań wynika, że sterowanie czaso–optymalne jest bang–bang, kawałkami stałe,
z co najwyżej jednym punktem przełączenia.
Ćwiczenie 7.1
Opisać czaso–optymalne trajektorie.
Przykład 7.3 (Zlinearyzowane równanie kątowego odchylenia od pionu z wymuszeniem,
[36], str. 34–42; [31], str. 64)
Rozpatrujemy układ RRZ z n=2, m=1:
|
x˙1=x2,x˙2=-x1+u,u=ut∈-1,1, |
| (7.19) |
lub w postaci macierzowej:
|
x˙1x˙2=Ax1x2+But,A=01-10,B=01. |
|
-
,,W języku” twierdzenia 7.4:
Mamy
|
e-tA=cost-sintsintcost,h=h1h2,h12+h22≠0, |
|
|
hTe-tAB=h1,h2cost-sintsintcost01= |
|
|
h1cost+h2sint,-h1sint+h2cost01, |
|
stąd
|
hTe-tAB=h2cost-h1sint=rsint+α, |
|
gdzie r=h1+h212,
α=arccos-h1r,
r≠0.
Układ (7.19) jest normalny!
Z twierdzenia 7.4 wynika, że każde sterowanie optymalne u∗ musi spełniać
-
,,W języku” twierdzenia 7.5:
Mamy
|
Hw,x,v=wTAx+Bv=w1,w201-10x1x2+01v, |
|
Stąd
i
Stąd w2t=rsint+α, gdzie r>0 i α są stałymi.
Twierdzenie 7.5 implikuje, że jeżeli u∗ jest
czaso–optymalne, to
|
Hw,x∗,u∗=Mw,x∗=max-1≤v≤1Hw,x∗,v=w1tx∗2t-w2tx∗1t+w2t |
|
a to jest osiągane jedynie dla v=u∗t, gdzie
Zatem każde sterowanie czaso–optymalne jest bang–bang i okresowe o okresie 2π.
Ćwiczenie 7.2
Opisać czaso–optymalne trajektorie.
Przykład 7.4 ([31], str. 65.)
W przykładzie 7.1 rozpatrywany był układ właściwy, który nie jest normalny.
|
x˙1x˙2=Ax1x2+But,A=0000,B=1001. |
|
Niech x0=-1,0. Wówczas każde ze sterowań ua, a∈0,12, gdzie
oraz
|
ua2=10≤t≤a0a<t≤1-a-11-a<t≤1, |
|
dla a∈]0,12[,
jest czaso–optymalne z t1=1, ale tylko u12 jest bang–bang.
Twierdzenie 7.6
Jeżeli (LA) jest normalny oraz istnieje pomyślne sterowanie (prowadzące x0
do 0), to istnieje jednoznaczne sterowanie czaso–optymalne. To sterowanie
jest bang–bang i kawałkami stałe.
Dowód: [31], str. 66.
Z twierdzenia 7.1 wynika istnienie. Z twierdzenia 7.4 i wniosku 7.1
wynika, że każde sterowanie czaso–optymalne jest bang–bang.
Załóżmy, że u1 oraz u2 są dwoma różnymi sterowaniami czaso–optymalnymi bang–bang.
Wówczas sterowanie u3t=u1t+u2t2 jest też czaso–optymalne, ale nie jest
bang–bang. Otrzymujemy sprzeczność: zatem sterowanie czaso–optymalne jest jednoznaczne.
Sterowanie czaso–optymalne jest kawałkami stałe, gdyż każda współrzędna zmienia wartość tylko wtedy,
gdy ta sama współrzędna hTe-AtB przyjmuje wartość 0, a to może zdarzyć się tylko w
skończonej liczbie punktów odcinka 0,t1.
∎
Definicja 7.6
Niech x0∈Rn będzie ustalone, τ>0 oraz y∈Kτ;x0.
Jeżeli
|
x(t;x0,u1(.))=x(t;x0,u2(.))∀t∈[0,τ], |
| (7.20) |
dla każdego u1∈Um0,τ i każdego u2∈Um0,τ, t.ż.
|
x(τ,x0,u1(.))=x(τ,x0,u2(.))=y, |
|
to odpowiedź z x0 do y jest
jednoznaczna (unique).
Twierdzenie 7.7
Załóżmy, ze macierz B nie ma żadnej kolumny złożonej z samych 0, x0∈Rn
i niech y∈Kτ,x0.
Wówczas następujące warunki są równoważne
-
sterowanie prowadzące x0 do y w czasie τ jest jednoznaczne,
-
odpowiedź z x0 do y w czasie τ jest
jednoznaczna,
-
y jest ekstremalnym punktem Kτ,x0.
Dowód: [31], str. 69–71.♣
Dalej w tym rozdziale będziemy zakładać, że macierz B nie ma żadnej kolumny złożonej z samych
0. Nie zmniejsza to ogólności!
Definicja 7.7
Zbiór A jest ściśle wypukły jeżeli
dla każdych dwóch punktów x,y∈A.
Twierdzenie 7.8 (Geometryczna charakteryzacja (LA) normalnych)
(LA) jest normalny na 0,τ ⇔ Kτ;x0 jest
ściśle wypukły dla pewnego x0.
Twierdzenie 7.9 (Analityczna charakteryzacja (LA) normalnych)
(LA) jest normalny na 0,τ ⇔ bj,Abj,…,An-1bj
są liniowo niezależnymi wektorami w Rn, dla każdej kolumny bj macierzy B, j=1,…,m.
Podsumowaniem jest następujący wniosek:
Wniosek 7.2
Dla (LA) normalnego: istnieje otoczenie N punktu 0, t.ż. każdy punkt
N może być doprowadzony do 0 jednoznacznym sterowaniem czaso-optymalnym
bang–bang i kawałkami stałym. Jeżeli dodatkowo ℜλ≤0, dla każdej wartości własnej
λ macierzy A, to N=Rn.
Twierdzenie 7.10
Dla (LA) normalnego:
jeżeli każda wartość własna (eigenvalue) macierzy A
jest rzeczywista,
to każda współrzędna każdego sterowania czaso–optymalnego ma
co najwyżej n-1 przełączeń.
Dowód: [31], str. 77; [36], str. 138–140.♣
Poniższe twierdzenie formułuje warunek dostateczny — odwrotność zasady maksimum:
Twierdzenie 7.11
Dla (LA) właściwego: każde (pomyślne) sterowanie u∗, prowadzące x0 do 0 w czasie
t1>0 i spełniające
|
dlapewnegoh∈Rn,h≠0:hTe-tABu∗t=maxv∈ΩhTe-tABvdlap.k.t∈] 0,τ[, |
| (7.21) |
jest czaso–optymalne na 0,τ.