2. Sterowalność
Współrzędne wektora x∈Rn oznaczamy x1, x2, …, xn, n=1,2,…:
Dla odróżnienia naturalne potęgi ϕ oznaczamy jako ϕp, p=1,2,….
Dla uproszczenia notacji element zerowy w każdej Rn, dla n=1,2,…,
oznaczamy przez 0.
Definicja 2.1
Niech Ω⊂Rm, m=1,2,… będzie zadanym zbiorem. Zbiór ten będziemy nazywali
zbiorem parametrów sterujących.
Przez większą część wykładu, będziemy przyjmować, że Ω=-1,1m,
choć omówimy kilkakrotnie sytuacje Ω=Rm.
Jeżeli nie będzie podane inaczej, będziemy zakładali, że Ω=-1,1m.
Niech
|
Um0,t1=u:ut∈Ωorazumierzalnana0,t1 |
|
Każdy element u∈Um będziemy nazywali sterowaniem (control)
(lub strategią).
Dla każdego sterowania u istnieje odpowiedni odcinek 0,t1u, na którym jest określone.
Definicja 2.2
Dla każdego t≥0 określamy rodzinę zbiorów celu (target sets)
Tt⊂Rn, gdzie Tt jest zbiorem domkniętym w Rn.
Jeżeli nie będzie podane inaczej, to Tt=0∈Rn,
tak jak w przykładach 1.2 i 1.3.
Rozpatrujemy zagadnienie początkowe dla równania różniczkowego zwyczajnego
|
x˙t=ft,xt,ut,x0=x0, |
| (2.1) |
gdzie x0∈Rn, x:0,t1→Rn oraz u=ut, u∈Um0,t1,
jest poszukiwanym sterowaniem.
Powyższe zagadnienie dotyczy sterowania w pętli otwartej (control in open–loop form),
u=ut. Można też rozpatrywać sterowanie w zamkniętej
pętli (control in closed–loop form), gdy poszukuje się odwzorowania (zwanego
sprzężeniem zwrotnym (feedback)
α:Rn→Um
dla RRZ
|
x˙t=ft,xt,αxt,x0=x0. |
| (2.2) |
Sprowadzenie u=ut do u=αxt nazywa się zagadnieniem syntezy (synthesis)
sterowania.
Możliwe jest podejście alternatywne w języku inkluzji różniczkowej (differential
inclusion)
gdzie
|
Ft,x=y:y=ft,x,u,dlapewnegou∈Ω. |
|
Założenie 2.1
Funkcja
jest ciągła wraz z pochodnymi cząstkowymi ∂fi∂xj,
∂fi∂uk dla i,j=1,…,n, k=1,2,…,m na
zbiorze [0,∞[×Rn×Ω.
Założenie 2.1 gwarantuje lokalne istnienie i
jednoznaczność rozwiązania dla u∈Um — tw. Picarda–Lindelöfa — por.
[14, 17, 23]. Ponieważ jednak funkcja u jest jedynie funkcją mierzalną i ograniczoną, więc
prawa strona RRZ (2.1) jest tylko mierzalna i ograniczona jako funkcja t dla
każdego x. Zatem rozwiązanie rozumiane jest jako absolutnie ciągła funkcja spełniająca
RRZ (2.1) prawie wszędzie — por. [14, 17, 23].
Założenie 2.1 jest mocniejsze, niż jest to jest potrzebne w niektórych wynikach. Do
istnienia i jednoznaczności wystarczy Lipschitz–owskość, ciągłość też można osłabić.
Definicja 2.3
Dla zadanego sterowania u∈Um rozwiązanie RRZ (2.1) nazywa się
odpowiedzią na (response to) u — oznaczamy
x(t)=x(t,x0,u(.)).
Problem 2.1
Zagadnienie sterowania (control problem): dla zadanego x0
znaleźć t1>0 oraz u∈Um 0,t1, t.ż. odpowiednia odpowiedź
xt1∈Tt1.
Jeżeli takie u da się znaleźć, to mówimy, że sterowanie u prowadzi x0
do celu Tt1 (control u
steers x0 to the target Tt1), lub że u jest
sterowaniem pomyślnym (successful control).
Problem 2.2
Zagadnienie sterowalności (controllability
problem):
określić dane początkowe, które można doprowadzić do celu (tzn. dane początkowe, które są
sterowalne (controllable)), czyli określić te dane
początkowe, dla których istnieje pomyślne sterowanie u∈Um.
Definicja 2.4
Zbiór sterowalny (controllable set)
C=⋃t1>0Ct1, gdzie
|
C(t1)={x0∈Rn:istniejeu∈Um,t.z˙.x(t1,x0,u(.))∈T(t1)}, |
| (2.4) |
Ct1 jest zbiorem tych stanów, które mogą być doprowadzone do celu
w chwili t1.
Będziemy badali zbiór C, oraz określimy jak zmienia się C
wraz z zawężeniem klasy sterowań.
Definicja 2.5
Jeżeli C=Rn, to sterowalność jest całkowita (completely
controllable). Natomiast przypadek 0∈IntC nazywamy sterowalnością
lokalną (locally controllable).
Można rozważać węższe klasy sterowań (por. [31]):
-
Klasa sterowań kawałkami stałych (piecewise constant controls)
UPC:
u∈UPC0,t1, jeżeli u jest kawałkami stała na
0,t1, czyli istnieją 0=s0<s1<…<sl=t1, t. ż, u jest stała na każdym
przedziale [sk-1,sk[;
-
Klasa sterowań gładkich i niezmieniających się nagle (smooth controls
that do not change rapidly) Uε:
u∈Uε0,t1, jeżeli u jest absolutnie
ciągła na 0,t1, u0=u1 oraz u˙t≤ε p.w. na
0,t1;
-
Klasa sterowań ,,bang–bang” (bang–bang controls) UBB:
u∈UBB0,t1, jeżeli ujt=1 dla p.k. t∈0,t1
oraz każdego j=1,…,m;
-
Klasa sterowań bang–bang kawałkami stałychUBBPC:
|
UBBPC0,t1=UBB0,t1⋂UPC0,t1; |
|
|
UBBPC=⋃t1>0UBBPC0,t1. |
|
Analogicznie do C określamy zbiory sterowalne CPC, Cε,
CBB, CBBPC w odniesieniu do odpowiednich klas sterowań.
Problem 2.3
Rozpatrywać będziemy ogólne autonomiczne (autonomous)
zagadnienie nieliniowe (NLA)
|
x˙=fx,u,xt∈Rn,u∈Um, |
| (2.5) |
z warunkiem początkowym
i celem Tt≡0.
Założenie 2.2
Zakładamy, że funkcja f:×Rn×Ω→Rn
jest klasy C1 na Rn×Ω oraz f0,0=0.
Stąd dla zadanego warunku początkowego x0 odpowiedź x(t)=x(t;x0,u(.)) istnieje
(przynajmniej) lokalnie w czasie i jest jednoznaczna.
Będziemy również rozpatrywać zagadnienie liniowe (LA)
Problem 2.4
|
x˙=Ax+Bu,xt∈Rn,u∈Um, |
| (2.6) |
gdzie A i B są stałymi macierzami, n×n i n×m, odpowiednio,
z warunkiem początkowym
i celem Tt≡0.
Macierz B ma więc postać:
|
B=b11…b1m.........bn1…bnm. |
|
Lemat 2.1
Dla (NLA):
-
Jeżeliu=ut prowadzi x0 do 0 na 0,t1 z odpowiedzią x=xt (tzn.
xt1=0), to u¯t=ut-t0 prowadzi x0 do 0 na t0,t0+t1 z odpowiedzią
x¯t=xt-t0.
-
Jeżelix=xt jest odpowiedzią na u∈Um0,t1 prowadzącą x0=x0
do xt1=x1, to zt=xt1-t jest odpowiedzią na u¯t=ut1-t
dla równania (z odwróconym czasem)
prowadzącą z0=x1 do zt1=x0.
Dowód
1. Mamy
|
x¯˙=x˙t-t0=fxt-t0,ut-t0=fx¯t,u¯t |
|
dla p.w. t∈t0,t0+t1. Ponadto
|
x¯t0=x0=x0,x¯t0+t1=xt1=0 . |
|
2. Mamy
|
z˙t=ddtxt1-t=-fxt1-t,ut1-t=-fzt,u¯t |
|
dla p.w. t∈0,t1. Ponadto
|
z0=xt1=x1,zt1=x0=x0. |
|
∎
Zagadnienie (NLA) jest autonomiczne w tym sensie, że punkt 1
lematu 2.1 jest spełniony.
Definicja 2.6
Zbiór jest łukowo spójny (arcwise connected), jeżeli każde dwa punkty zbioru
mogą być połączone łukiem (homeomorficznym obrazem odcinka) całkowicie zawartym
w zbiorze.
Twierdzenie 2.1
Dla (NLA):
-
jeżeli x0∈C oraz y jest punktem trajektorii łączącej x0 z celem 0,
to y∈C;
-
zbiór C jest łukowo spójny;
-
jeżeli 0≤τ1<τ2, to Cτ1⊂Cτ2;
-
C jest otwarty wtedy i tylko wtedy, gdy 0∈IntC.
Dowód: [31] — str. 26–27, [24] — str. 31–32.
1. Niech x0∈C. Istnieje wówczas pomyślne sterowanie u1∈Um oraz odpowiedź
x(t)=x(t;x0,u1(.)), t.ż. xt1=0 dla pewnego t1>0. Dla t¯∈0,t1
chcemy pokazać, że y:=xt¯∈C. Sterowanie u2t:=ut+t¯,
określone na t∈0,t1-t¯ jest pomyślne z odpowiedzią
x2t:=xt+t¯:
|
x˙2t=fx2t,u2t,x20=xt¯=y,x1t1-t¯=0, |
|
a zatem y∈Ct1-t¯.
2. Jeżeli x¯0, x⌃0 są w C, to istnieją sterowania u¯ i u⌃ oraz
odpowiedzi x¯(t)=x(t;x¯0,u¯(.)), x⌃(t)=x(t;x⌃0,u⌃(.)),
t.ż.
|
x¯t¯=0=x⌃t⌃dlapewnycht¯>0,t⌃>0 . |
|
Z 1. każdy punkt obu trajektorii jest w C. Zatem istnieje łuk całkowicie
zawarty w C łączący punkty x¯0, x~0.
3. Niech x0∈Cτ1. Zatem istnieje sterowanie u∈Um, t.ż. xτ1=0 dla
odpowiedzi x(t)=x(t;x0,u(.)). Dla τ2>τ1 określmy sterowanie
|
u2∈Um:u2t=utdlat∈ 0,τ10dlat∈]τ1,τ2]. |
|
Z warunku f0,0=0 wynika, że odpowiedż x2(t)=x(t;x0,u2(.)) spełnia
a zatem u2 prowadzi x0 do celu 0 w czasie τ2, czyli x0∈Cτ2.
4. Implikacja ,,⇒” jest oczywista, gdyż 0∈C.
Pokażemy implikację ,,⇐”. Jeżeli 0∈IntC, to istnieje otwarta kula
B0=B0,δ0 o środku w 0 i promieniu δ0>0,
t.ż. B0⊂C.
Niech x1∈C. Chcemy pokazać, że istnieje otwarta kula o środku w x1 całkowicie
zawarta w C. Ponieważ x1∈C, więc istnieje sterowanie u1∈Um oraz
odpowiedź x(t)=x(t;x1,u1(.)), t.ż. xt1=0 dla pewnego t1>0.
Funkcja f jest klasy C1, więc z ciągłej zależności od danych początkowych wynika istnienie
otwartej kuli B1=Bx1,δ1, δ1>0,
t.ż. dla każdego y∈B1:
|
x2:=x(t1;y,u1(.))∈B0(⊂C). |
|
Istnieje więc sterowanie u2∈Um, które prowadzi x2 do 0 w czasie
t2>0.
Zatem dla każdego y∈B1 istnieje sterowanie u∈Um,
|
ut=u1tdlat∈ 0,t1u2t-t1dlat∈]t1,t1+t2], |
| (2.8) |
które prowadzi y do 0. Zatem B1⊂C.
∎
Uwaga 2.1
Można pokazać, że są prawdziwe twierdzenia analogiczne do twierdzenia 2.1 dla
klas CPC oraz Cε. Dla CBB oraz CBBPC
punkty 1, 2 i 4 wynikają bezpośrednio. Natomiast punkt 3 dla CBB wynika z
zasady bang–bang — por. twierdzenie 5.1.
Uwaga 2.2
Argumentu w dowodzie ,,⇐” punktu 4 twierdzenia 2.1 nie można
przenieść na Ct1 dla t1>0, gdyż sterowanie (2.8) określone jest
na t1+t2. Najczęściej brzeg zbioru Ct1 należy do tego zbioru,
więc Ct1 nie jest otwarty.
Rozważymy teraz zagadnienie liniowe (LA).
Rozwiązanie (LA) ma postać
|
x(t)=x(t;x0,u(.))=eAtx0+∫0teAt-sBu(s)ds. |
| (2.9) |
Mamy:
|
x0∈C(t1)⇔∃u∈Um[0,t1]:x0=-∫0t1e-AsBu(s)ds, |
| (2.10) |
Definicja 2.7
Zbiór S jest symetryczny (symmetric), gdy x∈S
⇔ -x∈S.
Twierdzenie 2.2
Dla (LA): C⊂Rn jest symetryczny oraz wypukły.
Dowód: [19] — str. 17, [31] — str. 29,
[24] — str. 33.
Mamy (2.10).
Jeżeli x0∈Ct1 dla u∈Um0,t1, to -x0∈Ct1 dla
-u∈Um0,t1. Zatem C=⋃t1>0Ct1
jest symetryczny.
Jeżeli x0∈Ct1 ze sterowaniem u0 i x*∈Ct1 ze sterowaniem u1,
to αx0+1-αx*∈Ct1 ze sterowaniem αu0+1-αu*.
Zatem Ct1 jest wypukły. Nie wynika z tego od razu, że
C=⋃t1>0Ct1 jest wypukły
(suma zbiorów wypukłych nie musi być wypukła). Jednakże stosując argument z dowodu punktu 3 twierdzenia 2.1
pokazujemy, że C jest wypukły.
∎
Twierdzenie 2.2 można uogólnić na sytuację, gdy A=At, B=Bt są ciągłymi
funkcjami. W dowodzie korzysta się z następujących własności klasy sterowań:
symetryczności, wypukłości i możliwości przyjmowania wartości 0. Twierdzenie 2.2
zachodzi więc dla klas UPC i Uε, ale nie zachodzi dla
UBB i UBBPC, które nie są wypukłe i nie zawierają 0.
W rozdziale 5 (twierdzenie 5.1) pokażemy jednak zasadę ,,bang–bang”
dla (LA): CBBt1=Ct1.
Z zasady ,,bang–bang” wynika, że
|
CBB=⋃t1>0CBBt1=⋃t1>0Ct1=C, |
|
a zatem z wypukłości C wynika wypukłość CBB.
Następujące przykłady pokazują, że C może nie zawierać pewnego otoczenia celu, czyli, że
nie jest spełniona nawet lokalna sterowalność.
Przykład 2.1 ([19], str. 18)
Niech n=2, m=1,
Zatem
Rozwiązanie spełniające x0=x0 ma postać
|
x1t=x01x2t=x02+∫0tusds. |
| (2.12) |
Stąd
czyli C jest osią x2.
Przykład 2.2 ([31], str. 30; [24], str. 34)
Niech n=2, m=1,
|
x˙1=x1+u,x˙2=x2+u. |
| (2.13) |
Zatem
Rozwiązanie spełniające x0=x0 ma postać
|
x1tx2t=etx01x02+et∫0te-susds11. |
| (2.14) |
Jeżeli x1t1=x2t1=0, to
|
x01=x02=-∫0t1e-susds |
|
oraz
|
-1-e-t1≤-x01=-x02≤1-e-t1, |
|
bo us∈-1,1.
Stąd
|
C=x1x2:x1=x2,x1<1,x2<1. |
|
Przykłady 2.1 i 2.2 pokazują, że potrzebne są pewne warunki na macierze
A i B. Warunki te zostaną wyrażone przez macierz sterowalności.
Definicja 2.8
Dla (LA) wprowadzamy macierz sterowalności (controllability matrix):
|
M=B,AB,A2B,…,An-1B︸macierznnm |
|
W dowodzie odpowiedniego twierdzenia (tw. 2.4) korzysta się z pojęcia hiperpłaszczyzny:
Definicja 2.9
n-1–wymiarową hiperpłaszczyzną (hyperplane) w Rn nazywamy zbiór
gdzie a∈Rn, aT oraz α∈R1 są zadane, aTx oznacza
iloczyn skalarny wektorów a i x.
Istotną rolę odgrywa tu wniosek z twierdzenia Mazura (geometrycznej wersji twierdzenia
Hahna-Banacha) - twierdzenie o hiperpłaszczyźnie podpierającej — por. [30],
str. 190.
Twierdzenie 2.3 (Twierdzenie o hiperpłaszczyźnie podpierającej)
Jeżeli y∉IntK, gdzie K jest wypukłym zbiorem,
t.ż. IntK≠∅, to istnieje
hiperpłaszczyzna podpierająca H w y (supporting hyperplane
H through y), tzn. K leży po jednej
stronie H:
|
aTy=α,aTx≤α∀x∈K, |
| (2.15) |
dla pewnego α∈R1.
Twierdzenie 2.4
Dla (LA): Następujące trzy warunki są równoważne
-
-
(b) 0∈IntC (lokalna sterowalność)
-
Dowód: [19], str. 18, [31], str. 31, [24],
str. 35, [27], str. 108
Zauważmy, że równoważność b ⇔ c wynika z
twierdzenia 2.1.
1. Dowód b ⇒ a, czyli ∼a ⇒
∼b. Załóżmy więc ∼a, czyli rankM<n.
Wówczas istnieje wektor y∈Rn, y≠0, prostopadły do każdej
kolumny macierzy M, czyli
Stąd
|
yTB=yTAB=…=yTAn-1B=0(∈Rm). |
|
Niech P będzie wielomianem charakterystycznym macierzy A
gdzie I jest macierzą jednostkową n×n.
Mamy (twierdzenie Cayleya–Hamiltona)
Stąd
a zatem
|
yTAnB=βn-1yTAn-1B+…+β0yTB=0 . |
|
Podobnie
i
Powtarzając to postępowanie
Stąd
|
yTe-AsB=yT∑k=0∞-1kAkskk!B=0, |
|
dla każdego s∈0,t1.
Mamy (2.10). Stąd
|
yTx0=-∫0t1yTe-AsBusds=0, |
|
czyli istnieje niezerowy wektor y∈Rn, który jest prostopadły do każdego
x0∈Ct1. Stąd wynika, że Ct1 leży w hiperpłaszczyźnie
prostopadłej do y dla każdego t1>0. Zatem C=⋃t1>0Ct1 leży w hiperpłaszczyźnie prostopadłej do y i
Otrzymujemy więc, że 0∉IntC, czyli ∼b.
2. Dowód a ⇒ b, czyli ∼b ⇒
∼a. Załóżmy więc ∼b, czyli 0∉IntC.
Stąd dla każdego t1>0: 0∉IntCt1, gdyż
Ct1⊂C (nie istnieje kula B0,δ⊂C ⇒ nie istnieje kula B0,δ⊂Ct1 dla każdego t1).
Ale 0∈Ct1 oraz Ct1 jest zbiorem wypukłym dla każdego
t1>0 (por. dowód twierdzenia 2.2).
Zatem istnieje hiperpłaszczyzna przechodząca przez 0, taka że Ct1
leży po jednej stronie tej hiperpłaszczyzny (twierdzenie 2.3), tzn. istnieje
wektor b=bt1∈Rn, b≠0, taki że
Stąd
|
-bTx0=∫0t1bTe-AsBusds≥0∀u∈Um0,t1. |
|
Z lematu 2.2 poniżej wynika, że
Wstawiając s=0 otrzymujemy bTB=0. Następnie różniczkując względem s i
wstawiając s=0 otrzymujemy
Zatem niezerowy wektor b jest prostopadły do każdej kolumny M i
rankM<n, czyli ∼a.
∎
Lemat 2.2 (Nierówność całkowa)
Jeżeli
|
∫0t1bTe-AsBusds≥0∀u∈Um0,t1, |
| (2.16) |
to
Dowód: [31], str. 32; [19], str. 21
Jeżeli u∈Um0,t1, to -u∈Um0,t1. Zatem z (2.16)
wynika, że
|
∫0t1bTe-AsBusds=0∀u∈Um0,t1. |
|
Niech vs:=bTe-AsBT. Jeżeli v≢0, to istnieje s0∈0,t1, t.ż.
vs0≠0. Istnieje wtedy przedział I⊂0,t1, t.ż. s0∈I
oraz v≠0 na I. Określmy sterowanie
|
ut=vtvtdlat∈I0dlat∈0,t1∖I. |
|
Wówczas mamy
|
0=∫0t1vTsusds=∫IvTsvsvsds=∫Ivsds. |
|
Otrzymujemy więc sprzeczność z założeniem v≢0.
∎
Wniosek 2.1
Twierdzenie 2.4 można powtórzyć dla klas UPC, Uε, gdyż dla tych klas
,,przechodzi” lemat 2.2.
W dowodzie twierdzenia 2.4 pokazaliśmy, że
Wniosek 2.2
rankM<n⇒ istnieje hiperpłaszczyzna w Rn, t.ż.
C=⋃t1>0Ct1 leży w tej hiperpłaszczyźnie
⇒ 0∉IntC.
Wniosek 2.3
rankM=n wtedy i tylko wtedy, gdy
|
∀b∈Rn,b≠0:bTe-AtB≢0 |
| (2.17) |
jako funkcja zmiennej t.
Dowód
Pokazaliśmy, że
rankM<n ⇒ ∃y∈Rn, y≠0, t.ż.
⇒0∉IntC⇒rankM<n. Zatem otrzymujemy (2.17).
∎
Definicja 2.10
Układ (LA) spełniający (2.17) nazywa się właściwy (proper).
(LA) jest właściwy wtedy i tylko wtedy, gdy
W rozpatrywanym tutaj przypadku Ω=-1,1m warunek rankM=n nie gwarantuje całkowitej
sterowalności C=Rn, jak pokazuje prosty przykład
Przykład 2.3 ([31], str. 33)
Niech n=m=1. Rozważmy
Jeżeli x0>1 (lub x0<-1), to odpowiedź na dowolne sterowanie rośnie
(maleje) wraz z t, a więc żadne sterowanie nie jest pomyślne. Mamy C=]-1,1[≠R1, choć 0∈IntC.
Jednakże przy dodatkowym warunku otrzymujemy:
Twierdzenie 2.5
Dla (LA) następujące dwa warunki są równoważne:
-
(a) rankM=n oraz ℜλ≤0 dla każdej wartości własnej λ macierzy
A
-
Dowód: [31], str. 34; [24], str. 37–38;
oraz ⇒: [27], str. 112, [19], str. 22
1. Dowód a ⇒ b. Załóżmy, że rankM=n oraz ℜλ≤0 dla każdej
wartości własnej λ macierzy A. Gdyby istniał y∈Rn, t.ż. y∉C, to z
wypukłości C (twierdzenie 2.2) oraz twierdzenia 2.3 wynikałoby, że y mógłby być
odseparowany od C hiperpłaszczyzną, tzn. istniałby b∈Rn, b≠0, t.ż.
dla pewnego α∈R1.
Pokażemy, że dla każdego α∈R1 oraz każdego b∈Rn, b≠0
istnieje t1>0 oraz u∈Um0,t1, t.ż.
|
-∫0t1bTe-AsBusds>α, |
| (2.19) |
co oznacza sprzeczność z (2.18), a zatem sprzeczność
z założeniem istnienia y∈Rn, t.ż. y∉C, a więc
dowodzi prawdziwości a ⇒ b.
Niech
Z założenia, że rankM=n oraz uwagi 2.3 wynika, że (LA) jest właściwy,
czyli
Określmy sterowanie
|
ut=-vtvtdlavt≠00dlavt=0 . |
|
Wówczas mamy
|
-∫0t1bTe-AsBusds=-∫0t1vTsusds=∫0t1vsds. |
|
Pokażemy, że
a zatem istnienie takiego t1, że (2.19) jest spełniona.
Załóżmy, że (2.21) nie jest spełniona, czyli
Wówczas ϕt:=∫t∞vsds spełnia
|
ϕ˙t=-vt,limt→∞ϕt=0,ϕ≢0 . |
| (2.22) |
Jeżeli P jest wielomianem charakterystycznym macierzy A, to
PA=0. Stąd
|
P-ddtvt=P-ddtbTe-AtBT=bTP-ddte-AtBT=bTPAe-AtBT≡0 . |
|
Zatem funkcja ϕ=ϕt spełnia liniowy układ równań różniczkowych ze stałymi
współczynnikami
Rozwiązaniem tego równania jest pewna liniowa kombinacja wyrazów postaci
|
P1tsinℑγt+P2tcosℑγteℜγt, |
|
gdzie γ jest pierwiastkiem równania
Zatem γ=0, lub -γ=λ, gdzie λ jest wartością własną macierzy A.
Z założenia wynika, że
co jest sprzeczne z (2.22). To kończy dowód implikacji a ⇒ b.
2. Dowód b ⇒ a. Pokażemy, że
lub
-
ℜλ>0 dla pewnej wartości własnej λ macierzy A
implikuje C≠Rn.
Jeżeli rankM<n, to z wniosku 2.2 wynika, że
C≠Rn.
Niech ℜλ>0, dla pewnej wartości własnej λ macierzy A.
Jeżeli y∈Cn jest (lewym) wektorem własnym (eigenvector), to
Stąd
a zatem
Mamy
|
yT=yℜT+iyℑT,yℜ,yℑ∈Rn,yℜ≠0 . |
|
Wówczas
|
yℜTe-At=e-ℜλtcosℑλtyℜT-e-ℜλtsinℑλtyℑT. |
| (2.23) |
Mamy
|
yℜTx0=-∫0t1yℜTe-AsBusds. |
| (2.24) |
Z (2.23) wynika, że prawa strona (2.24) jest ograniczona
jednostajnie względem t1>0. Zatem
dla pewnego α∈R1. Czyli C leży po jednej stronie pewnej
hiperpłaszczyzny, a więc C≠Rn.
To kończy dowód b ⇒ a.
∎
Ćwiczenie 2.1
Czy twierdzenie 2.5 jest prawdziwe dla klas CPC, Cε,
CBB oraz CBBPC? Dla CBB można zastosować zasadę bang–bang
— por. twierdzenie 5.1.
Z dowodu b ⇒ a twierdzenia 2.5 wynika prawdziwość (por. [24], str. 38):
Wniosek 2.4
Jeżeli rankM=n oraz ℜλ>0, dla pewnej wartości własnej λ macierzy A, to
C≠Rn.
Przykład 2.4 (Wagon odrzutowy — patrz przykład 1.2)
|
x˙1x˙2=Ax1x2+But,A=0100,B=01. |
|
Mamy
rankM=2 i układ jest właściwy. Jedyną (podwójną) wartością własną
macierzy A jest 0. Z twierdzenia 2.5 wynika, że C=R2, czyli
każdy stan początkowy może być doprowadzony do celu 0∈R2.
W przeciwieństwie do przypadku klasy sterowań Um o wartościach w Ω=-1,1m, rozważanego
w twierdzeniu 2.5, w przypadku sterowań o wartościach w Ω=Rm
okazuje się, że warunek rankM=n jest równoważny całkowitej sterowalności.
W przypadku Ω=Rm klasę sterowań definiujemy jako
Dla uproszczenia notacji odpowiedni zbiór sterowalny bedziemy oznaczali jako C,
czyli tak samo, jak w przypadku Ω=-1,1m (sens będzie wynikał z kontekstu).
Wówczas można sformułować następujące twierdzenie:
Twierdzenie 2.6
Dla (LA) i klasy sterowań Um∞ następujące dwa warunki są
równoważne:
Dowód: por. [14], str. 58; [27], str. 107.
1. Dowód b ⇒ a, czyli ∼a ⇒
∼b jest identyczny jak punkt 1 dowodu twierdzenia 2.4.
2. Dowód a ⇒ b. Załóżmy, że rankM=n. Z
twierdzenia 2.4 wynika, że istnieje otwarta kula B=B0,δ
o środku w 0∈Rn i promieniu δ>0, t.ż. B⊂C.
Dla dowolnego x0∈Rn istnieje stała η∈]0,1], t.ż.
czyli istnieje t1>0 oraz u∈Um0,t1, t.ż.
|
ηx0=-∫0t1e-AsBusds. |
|
Stąd
|
x0=-∫0t1e-AsBu¯sds, |
|
gdzie u¯=uη∈Um∞, co kończy dowód.
∎
Okazuje się (por. [31], str. 37), że dla klasy sterowań Um
,,prawie wszystkie” układy (LA) są lokalnie sterowalne
(tzn. spełniają 0∈C),
a dla klasy sterowań Um∞ ,,prawie wszystkie” układy (LA) są
całkowicie sterowalne (tzn. spełniają C=Rn).
Odległość między dwoma układami (LA):
(A1,B1) i (A2,B2), czyli x˙=A1x+B1u i x˙=A2x+B2u,
odpowiednio, określamy jako
|
dA1,B1,A2,B2=A1-A2+B1-B2, |
|
gdzie A=∑i,j=1naij i analogicznie B.
Zatem dwa układy są bliskie, jeżeli elementy odpowiednich macierzy są bliskie.
Twierdzenie 2.7
Zbiór wszystkich sterowalnych (LA) jest otwarty i gęsty w przestrzeni metrycznej
wszystkich (LA), gdzie ,,sterowalność” rozumiemy w sensie
-
całkowitej sterowalności dla Ω=Rm,
-
lokalnej sterowalności dla Ω=-1,1m.
Dowód: [31], str. 37.
Z twierdzenia 2.4, lub twierdzenia 2.6, w obu rozważanych przypadkach,
sterowalność jest równoważna warunkowi rankM=n. Ten warunek oznacza, że istnieje
(n×n)–macierz N, będąca podmacierzą M, t.ż. detN≠0.
Jeżeli układ (A~,B~) jest bliski (A,B), to odpowiednia n×n podmacierz
N~ macierzy M~ jest bliska odpowiedniej podmacierzy N macierzy M.
Jeżeli detN≠0, to detN~≠0 dla N-N~ —
małego. Zatem układy sterowalne są zbiorem otwartym.
Załóżmy, że x˙=A0x+B0u nie jest sterowalny, tzn. rankM0<n, gdzie
M0=B0,…,A0n-1B0. Chcemy pokazać istnienie układu (A~,B~)
— bliskiego układowi (A0,B0) — t.ż. detN~≠0, dla pewnej n×n
podmacierzy N~ macierzy M~=B~,…,A~n-1B~.
detN~ może być traktowany jako wielomian Py1,…,yk
elementów macierzy A~ i B~, gdzie k=n2+nm.
Mamy
dla y01,…,y0k – elementów macierzy A0, B0.
Wystarczy pokazać, że: dla niezerowego wielomianu P=Py1,…,yk, t.ż.
Py01,…,y0k=0, istnieje y1∈Rk — dowolnie bliskie y0, t.ż.
Powyższe zdanie wynika z faktu, że niezerowy wielomian k zmiennych nie może znikać w żadnej
k–wymiarowej kuli: gdyby znikał, to biorąc pochodne cząstkowe pokazalibyśmy, że wszystkie
współczynniki się zerują.
∎