2. Sterowalność

Współrzędne wektora xRn oznaczamy x1, x2, , xn, n=1,2,:

x=x1...xn.

Dla odróżnienia naturalne potęgi ϕ oznaczamy jako ϕp, p=1,2,.

Dla uproszczenia notacji element zerowy w każdej Rn, dla n=1,2,, oznaczamy przez 0.

Definicja 2.1

Niech ΩRm, m=1,2, będzie zadanym zbiorem. Zbiór ten będziemy nazywali zbiorem parametrów sterujących.

Przez większą część wykładu, będziemy przyjmować, że Ω=-1,1m, choć omówimy kilkakrotnie sytuacje Ω=Rm. Jeżeli nie będzie podane inaczej, będziemy zakładali, że Ω=-1,1m. Niech

Um0,t1=u:utΩorazumierzalnana0,t1
Um=t1>0Um0,t1

Każdy element uUm będziemy nazywali sterowaniem (control) (lub strategią). Dla każdego sterowania u istnieje odpowiedni odcinek 0,t1u, na którym jest określone.

Definicja 2.2

Dla każdego t0 określamy rodzinę zbiorów celu (target sets) TtRn, gdzie Tt jest zbiorem domkniętym w Rn.

Jeżeli nie będzie podane inaczej, to Tt=0Rn, tak jak w przykładach 1.2 i 1.3.

Rozpatrujemy zagadnienie początkowe dla równania różniczkowego zwyczajnego

x˙t=ft,xt,ut,x0=x0, (2.1)

gdzie x0Rn, x:0,t1Rn oraz u=ut, uUm0,t1, jest poszukiwanym sterowaniem.

Powyższe zagadnienie dotyczy sterowania w pętli otwartej (control in open–loop form), u=ut. Można też rozpatrywać sterowanie w zamkniętej pętli (control in closed–loop form), gdy poszukuje się odwzorowania (zwanego sprzężeniem zwrotnym (feedback) α:RnUm dla RRZ

x˙t=ft,xt,αxt,x0=x0. (2.2)

Sprowadzenie u=ut do u=αxt nazywa się zagadnieniem syntezy (synthesis) sterowania.

Możliwe jest podejście alternatywne w języku inkluzji różniczkowej (differential inclusion)

x˙Ft,x (2.3)

gdzie

Ft,x=y:y=ft,x,u,dlapewnegouΩ.
Założenie 2.1

Funkcja

f:[0,[×Rn×ΩRn

jest ciągła wraz z pochodnymi cząstkowymi fixj, fiuk dla i,j=1,,n, k=1,2,,m na zbiorze [0,[×Rn×Ω.

Założenie 2.1 gwarantuje lokalne istnienie i jednoznaczność rozwiązania dla uUm — tw. Picarda–Lindelöfa — por. [14, 17, 23]. Ponieważ jednak funkcja u jest jedynie funkcją mierzalną i ograniczoną, więc prawa strona RRZ (2.1) jest tylko mierzalna i ograniczona jako funkcja t dla każdego x. Zatem rozwiązanie rozumiane jest jako absolutnie ciągła funkcja spełniająca RRZ (2.1) prawie wszędzie — por. [14, 17, 23].

Założenie 2.1 jest mocniejsze, niż jest to jest potrzebne w niektórych wynikach. Do istnienia i jednoznaczności wystarczy Lipschitz–owskość, ciągłość też można osłabić.

Definicja 2.3

Dla zadanego sterowania uUm rozwiązanie RRZ (2.1) nazywa się odpowiedzią na (response to) u — oznaczamy x(t)=x(t,x0,u(.)).

Problem 2.1

Zagadnienie sterowania (control problem): dla zadanego x0 znaleźć t1>0 oraz uUm 0,t1, t.ż. odpowiednia odpowiedź xt1Tt1.

Jeżeli takie u da się znaleźć, to mówimy, że sterowanie u prowadzi x0 do celu Tt1 (control u steers x0 to the target Tt1), lub że u jest sterowaniem pomyślnym (successful control).

Problem 2.2

Zagadnienie sterowalności (controllability problem): określić dane początkowe, które można doprowadzić do celu (tzn. dane początkowe, które są sterowalne (controllable)), czyli określić te dane początkowe, dla których istnieje pomyślne sterowanie uUm.

Definicja 2.4

Zbiór sterowalny (controllable set) C=t1>0Ct1, gdzie

C(t1)={x0Rn:istniejeuUm,t.z˙.x(t1,x0,u(.))T(t1)}, (2.4)

Ct1 jest zbiorem tych stanów, które mogą być doprowadzone do celu w chwili t1.

Będziemy badali zbiór C, oraz określimy jak zmienia się C wraz z zawężeniem klasy sterowań.

Definicja 2.5

Jeżeli C=Rn, to sterowalność jest całkowita (completely controllable). Natomiast przypadek 0IntC nazywamy sterowalnością lokalną (locally controllable).

Można rozważać węższe klasy sterowań (por. [31]):

  • Klasa sterowań kawałkami stałych (piecewise constant controls) UPC:

    uUPC0,t1, jeżeli u jest kawałkami stała na 0,t1, czyli istnieją 0=s0<s1<<sl=t1, t. ż, u jest stała na każdym przedziale [sk-1,sk[;

    UPC=t1>0UPC0,t1.
  • Klasa sterowań gładkich i niezmieniających się nagle (smooth controls that do not change rapidly) Uε:

    uUε0,t1, jeżeli u jest absolutnie ciągła na 0,t1, u0=u1 oraz u˙tε p.w. na 0,t1;

    Uε=t1>0Uε0,t1.
  • Klasa sterowań ,,bang–bang” (bang–bang controls) UBB:

    uUBB0,t1, jeżeli ujt=1 dla p.k. t0,t1 oraz każdego j=1,,m;

    UBB=t1>0UBB0,t1.
  • Klasa sterowań bang–bang kawałkami stałychUBBPC:

    UBBPC0,t1=UBB0,t1UPC0,t1;
    UBBPC=t1>0UBBPC0,t1.

Analogicznie do C określamy zbiory sterowalne CPC, Cε, CBB, CBBPC w odniesieniu do odpowiednich klas sterowań.

Problem 2.3

Rozpatrywać będziemy ogólne autonomiczne (autonomous) zagadnienie nieliniowe (NLA)

x˙=fx,u,xtRn,uUm, (2.5)

z warunkiem początkowym

xt=0=x0Rn,

i celem Tt0.

Założenie 2.2

Zakładamy, że funkcja f:×Rn×ΩRn jest klasy C1 na Rn×Ω oraz f0,0=0.

Stąd dla zadanego warunku początkowego x0 odpowiedź x(t)=x(t;x0,u(.)) istnieje (przynajmniej) lokalnie w czasie i jest jednoznaczna.

Będziemy również rozpatrywać zagadnienie liniowe (LA)

Problem 2.4
x˙=Ax+Bu,xtRn,uUm, (2.6)

gdzie A i B są stałymi macierzami, n×n i n×m, odpowiednio,

z warunkiem początkowym

xt=0=x0Rn,

i celem Tt0.

Macierz B ma więc postać:

B=b11b1m.........bn1bnm.
Lemat 2.1

Dla (NLA):

  1. Jeżeliu=ut prowadzi x0 do 0 na 0,t1 z odpowiedzią x=xt (tzn. xt1=0), to u¯t=ut-t0 prowadzi x0 do 0 na t0,t0+t1 z odpowiedzią x¯t=xt-t0.

  2. Jeżelix=xt jest odpowiedzią na uUm0,t1 prowadzącą x0=x0 do xt1=x1, to zt=xt1-t jest odpowiedzią na u¯t=ut1-t dla równania (z odwróconym czasem)

    z˙=-fzt,u¯t, (2.7)

    prowadzącą z0=x1 do zt1=x0.

Dowód

1. Mamy

x¯˙=x˙t-t0=fxt-t0,ut-t0=fx¯t,u¯t

dla p.w. tt0,t0+t1. Ponadto

x¯t0=x0=x0,x¯t0+t1=xt1=0 .

2. Mamy

z˙t=ddtxt1-t=-fxt1-t,ut1-t=-fzt,u¯t

dla p.w. t0,t1. Ponadto

z0=xt1=x1,zt1=x0=x0.

Zagadnienie (NLA) jest autonomiczne w tym sensie, że punkt 1 lematu 2.1 jest spełniony.

Definicja 2.6

Zbiór jest łukowo spójny (arcwise connected), jeżeli każde dwa punkty zbioru mogą być połączone łukiem (homeomorficznym obrazem odcinka) całkowicie zawartym w zbiorze.

Twierdzenie 2.1

Dla (NLA):

  1. jeżeli x0C oraz y jest punktem trajektorii łączącej x0 z celem 0, to yC;

  2. zbiór C jest łukowo spójny;

  3. jeżeli 0τ1<τ2, to Cτ1Cτ2;

  4. C jest otwarty wtedy i tylko wtedy, gdy 0IntC.

Dowód: [31] — str. 26–27, [24] — str. 31–32.

1. Niech x0C. Istnieje wówczas pomyślne sterowanie u1Um oraz odpowiedź x(t)=x(t;x0,u1(.)), t.ż. xt1=0 dla pewnego t1>0. Dla t¯0,t1 chcemy pokazać, że y:=xt¯C. Sterowanie u2t:=ut+t¯, określone na t0,t1-t¯ jest pomyślne z odpowiedzią x2t:=xt+t¯:

x˙2t=fx2t,u2t,x20=xt¯=y,x1t1-t¯=0,

a zatem yCt1-t¯.

2. Jeżeli x¯0, x0 są w C, to istnieją sterowania u¯ i u oraz odpowiedzi x¯(t)=x(t;x¯0,u¯(.)), x(t)=x(t;x0,u(.)), t.ż.

x¯t¯=0=xtdlapewnycht¯>0,t>0 .

Z 1. każdy punkt obu trajektorii jest w C. Zatem istnieje łuk całkowicie zawarty w C łączący punkty x¯0, x~0.

3. Niech x0Cτ1. Zatem istnieje sterowanie uUm, t.ż. xτ1=0 dla odpowiedzi x(t)=x(t;x0,u(.)). Dla τ2>τ1 określmy sterowanie

u2Um:u2t=utdlat 0,τ10dlat]τ1,τ2].

Z warunku f0,0=0 wynika, że odpowiedż x2(t)=x(t;x0,u2(.)) spełnia

x2t=0,tτ1,τ2,

a zatem u2 prowadzi x0 do celu 0 w czasie τ2, czyli x0Cτ2.

4. Implikacja ,,” jest oczywista, gdyż 0C.

Pokażemy implikację ,,”. Jeżeli 0IntC, to istnieje otwarta kula B0=B0,δ0 o środku w 0 i promieniu δ0>0, t.ż. B0C. Niech x1C. Chcemy pokazać, że istnieje otwarta kula o środku w x1 całkowicie zawarta w C. Ponieważ x1C, więc istnieje sterowanie u1Um oraz odpowiedź x(t)=x(t;x1,u1(.)), t.ż. xt1=0 dla pewnego t1>0. Funkcja f jest klasy C1, więc z ciągłej zależności od danych początkowych wynika istnienie otwartej kuli B1=Bx1,δ1, δ1>0, t.ż. dla każdego yB1:

x2:=x(t1;y,u1(.))B0(C).

Istnieje więc sterowanie u2Um, które prowadzi x2 do 0 w czasie t2>0.

Zatem dla każdego yB1 istnieje sterowanie uUm,

ut=u1tdlat 0,t1u2t-t1dlat]t1,t1+t2], (2.8)

które prowadzi y do 0. Zatem B1C.

Uwaga 2.1

Można pokazać, że są prawdziwe twierdzenia analogiczne do twierdzenia 2.1 dla klas CPC oraz Cε. Dla CBB oraz CBBPC punkty 1, 2 i 4 wynikają bezpośrednio. Natomiast punkt 3 dla CBB wynika z zasady bang–bang — por. twierdzenie 5.1.

Uwaga 2.2

Argumentu w dowodzie ,,” punktu 4 twierdzenia 2.1 nie można przenieść na Ct1 dla t1>0, gdyż sterowanie (2.8) określone jest na t1+t2. Najczęściej brzeg zbioru Ct1 należy do tego zbioru, więc Ct1 nie jest otwarty.

Rozważymy teraz zagadnienie liniowe (LA). Rozwiązanie (LA) ma postać

x(t)=x(t;x0,u(.))=eAtx0+0teAt-sBu(s)ds. (2.9)

Mamy:

x0C(t1)uUm[0,t1]:x0=-0t1e-AsBu(s)ds, (2.10)
Definicja 2.7

Zbiór S jest symetryczny (symmetric), gdy xS -xS.

Twierdzenie 2.2

Dla (LA): CRn jest symetryczny oraz wypukły.

Dowód: [19] — str. 17, [31] — str. 29, [24] — str. 33.

Mamy (2.10). Jeżeli x0Ct1 dla uUm0,t1, to -x0Ct1 dla -uUm0,t1. Zatem C=t1>0Ct1 jest symetryczny.

Jeżeli x0Ct1 ze sterowaniem u0 i x*Ct1 ze sterowaniem u1, to αx0+1-αx*Ct1 ze sterowaniem αu0+1-αu*. Zatem Ct1 jest wypukły. Nie wynika z tego od razu, że C=t1>0Ct1 jest wypukły (suma zbiorów wypukłych nie musi być wypukła). Jednakże stosując argument z dowodu punktu 3 twierdzenia 2.1 pokazujemy, że C jest wypukły.

Twierdzenie 2.2 można uogólnić na sytuację, gdy A=At, B=Bt są ciągłymi funkcjami. W dowodzie korzysta się z następujących własności klasy sterowań: symetryczności, wypukłości i możliwości przyjmowania wartości 0. Twierdzenie 2.2 zachodzi więc dla klas UPC i Uε, ale nie zachodzi dla UBB i UBBPC, które nie są wypukłe i nie zawierają 0. W rozdziale 5 (twierdzenie 5.1) pokażemy jednak zasadę ,,bang–bang” dla (LA): CBBt1=Ct1. Z zasady ,,bang–bang” wynika, że

CBB=t1>0CBBt1=t1>0Ct1=C,

a zatem z wypukłości C wynika wypukłość CBB.

Następujące przykłady pokazują, że C może nie zawierać pewnego otoczenia celu, czyli, że nie jest spełniona nawet lokalna sterowalność.

Przykład 2.1 ([19], str. 18)

Niech n=2, m=1,

x˙1=0,x˙2=u. (2.11)

Zatem

A=0000,B=01.

Rozwiązanie spełniające x0=x0 ma postać

x1t=x01x2t=x02+0tusds. (2.12)

Stąd

C=x1x2:x1=0,x2R1,

czyli C jest osią x2.

Przykład 2.2 ([31], str. 30; [24], str. 34)

Niech n=2, m=1,

x˙1=x1+u,x˙2=x2+u. (2.13)

Zatem

A=1001,B=11.

Rozwiązanie spełniające x0=x0 ma postać

x1tx2t=etx01x02+et0te-susds11. (2.14)

Jeżeli x1t1=x2t1=0, to

x01=x02=-0t1e-susds

oraz

-1-e-t1-x01=-x021-e-t1,

bo us-1,1.

Stąd

C=x1x2:x1=x2,x1<1,x2<1.

Przykłady 2.1 i 2.2 pokazują, że potrzebne są pewne warunki na macierze A i B. Warunki te zostaną wyrażone przez macierz sterowalności.

Definicja 2.8

Dla (LA) wprowadzamy macierz sterowalności (controllability matrix):

M=B,AB,A2B,,An-1Bmacierznnm

W dowodzie odpowiedniego twierdzenia (tw. 2.4) korzysta się z pojęcia hiperpłaszczyzny:

Definicja 2.9

n-1–wymiarową hiperpłaszczyzną (hyperplane) w Rn nazywamy zbiór

H=xRn:aTx=α,

gdzie aRn, aT oraz αR1 są zadane, aTx oznacza iloczyn skalarny wektorów a i x.

Istotną rolę odgrywa tu wniosek z twierdzenia Mazura (geometrycznej wersji twierdzenia Hahna-Banacha) - twierdzenie o hiperpłaszczyźnie podpierającej — por. [30], str. 190.

Twierdzenie 2.3 (Twierdzenie o hiperpłaszczyźnie podpierającej)

Jeżeli yIntK, gdzie K jest wypukłym zbiorem, t.ż. IntK, to istnieje hiperpłaszczyzna podpierająca H w y (supporting hyperplane H through y), tzn. K leży po jednej stronie H:

aTy=α,aTxαxK, (2.15)

dla pewnego αR1.

Twierdzenie 2.4

Dla (LA): Następujące trzy warunki są równoważne

  • (a) rankM=n

  • (b)  0IntC (lokalna sterowalność)

  • (c) C — otwarty w Rn

Dowód: [19], str. 18, [31], str. 31, [24], str. 35, [27], str. 108

Zauważmy, że równoważność b c wynika z twierdzenia 2.1.

1. Dowód b a, czyli a b. Załóżmy więc a, czyli rankM<n.

Wówczas istnieje wektor yRn, y0, prostopadły do każdej kolumny macierzy M, czyli

yTM=0(Rnm).

Stąd

yTB=yTAB==yTAn-1B=0(Rm).

Niech P będzie wielomianem charakterystycznym macierzy A

Pλ=detλI-A,

gdzie I jest macierzą jednostkową n×n.

Mamy (twierdzenie Cayleya–Hamiltona)

PA=0 .

Stąd

An=βn-1An-1++β0I,

a zatem

yTAnB=βn-1yTAn-1B++β0yTB=0 .

Podobnie

An+1=βn-1An++β0A

i

yTAn+1B=0 .

Powtarzając to postępowanie

yTAkB=0,k=0,1,.

Stąd

yTe-AsB=yTk=0-1kAkskk!B=0,

dla każdego s0,t1.

Mamy (2.10). Stąd

yTx0=-0t1yTe-AsBusds=0,

czyli istnieje niezerowy wektor yRn, który jest prostopadły do każdego x0Ct1. Stąd wynika, że Ct1 leży w hiperpłaszczyźnie prostopadłej do y dla każdego t1>0. Zatem C=t1>0Ct1 leży w hiperpłaszczyźnie prostopadłej do y i

IntC=.

Otrzymujemy więc, że 0IntC, czyli b.

2. Dowód a b, czyli b a. Załóżmy więc b, czyli 0IntC. Stąd dla każdego t1>0: 0IntCt1, gdyż Ct1C (nie istnieje kula B0,δC nie istnieje kula B0,δCt1 dla każdego t1).

Ale 0Ct1 oraz Ct1 jest zbiorem wypukłym dla każdego t1>0 (por. dowód twierdzenia 2.2). Zatem istnieje hiperpłaszczyzna przechodząca przez 0, taka że Ct1 leży po jednej stronie tej hiperpłaszczyzny (twierdzenie 2.3), tzn. istnieje wektor b=bt1Rn, b0, taki że

bTx00x0Ct1.

Stąd

-bTx0=0t1bTe-AsBusds0uUm0,t1.

Z lematu 2.2 poniżej wynika, że

bTe-AsB=0s0,t1.

Wstawiając s=0 otrzymujemy bTB=0. Następnie różniczkując względem s i wstawiając s=0 otrzymujemy

bTAkB=0k=0,1,.

Zatem niezerowy wektor b jest prostopadły do każdej kolumny M i rankM<n, czyli a.

Lemat 2.2 (Nierówność całkowa)

Jeżeli

0t1bTe-AsBusds0uUm0,t1, (2.16)

to

bTe-AsB=0s0,t1.
Dowód: [31], str. 32; [19], str. 21

Jeżeli uUm0,t1, to -uUm0,t1. Zatem z (2.16) wynika, że

0t1bTe-AsBusds=0uUm0,t1.

Niech vs:=bTe-AsBT. Jeżeli v0, to istnieje s00,t1, t.ż. vs00. Istnieje wtedy przedział I0,t1, t.ż. s0I oraz v0 na I. Określmy sterowanie

ut=vtvtdlatI0dlat0,t1I.

Wówczas mamy

0=0t1vTsusds=IvTsvsvsds=Ivsds.

Otrzymujemy więc sprzeczność z założeniem v0.

Wniosek 2.1

Twierdzenie 2.4 można powtórzyć dla klas UPC, Uε, gdyż dla tych klas ,,przechodzi” lemat 2.2.

W dowodzie twierdzenia 2.4 pokazaliśmy, że

Wniosek 2.2

rankM<n istnieje hiperpłaszczyzna w Rn, t.ż. C=t1>0Ct1 leży w tej hiperpłaszczyźnie 0IntC.

Ponadto

Wniosek 2.3

rankM=n wtedy i tylko wtedy, gdy

bRn,b0:bTe-AtB0 (2.17)

jako funkcja zmiennej t.

Dowód

Pokazaliśmy, że rankM<n yRn, y0, t.ż.

yTe-AtB0

0IntCrankM<n. Zatem otrzymujemy (2.17).

Definicja 2.10

Układ (LA) spełniający (2.17) nazywa się właściwy (proper).

(LA) jest właściwy wtedy i tylko wtedy, gdy

rankM=n.

W rozpatrywanym tutaj przypadku Ω=-1,1m warunek rankM=n nie gwarantuje całkowitej sterowalności C=Rn, jak pokazuje prosty przykład

Przykład 2.3 ([31], str. 33)

Niech n=m=1. Rozważmy

x˙=x+u.

Jeżeli x0>1 (lub x0<-1), to odpowiedź na dowolne sterowanie rośnie (maleje) wraz z t, a więc żadne sterowanie nie jest pomyślne. Mamy C=]-1,1[R1, choć 0IntC.

Jednakże przy dodatkowym warunku otrzymujemy:

Twierdzenie 2.5

Dla (LA) następujące dwa warunki są równoważne:

  • (a) rankM=n oraz λ0 dla każdej wartości własnej λ macierzy A

  • (b) C=Rn.

Dowód: [31], str. 34; [24], str. 37–38; oraz : [27], str. 112, [19], str. 22

1. Dowód a b. Załóżmy, że rankM=n oraz λ0 dla każdej wartości własnej λ macierzy A. Gdyby istniał yRn, t.ż. yC, to z wypukłości C (twierdzenie 2.2) oraz twierdzenia 2.3 wynikałoby, że y mógłby być odseparowany od C hiperpłaszczyzną, tzn. istniałby bRn, b0, t.ż.

bTx0αx0C, (2.18)

dla pewnego αR1.

Pokażemy, że dla każdego αR1 oraz każdego bRn, b0 istnieje t1>0 oraz uUm0,t1, t.ż.

-0t1bTe-AsBusds>α, (2.19)

co oznacza sprzeczność z (2.18), a zatem sprzeczność z założeniem istnienia yRn, t.ż. yC, a więc dowodzi prawdziwości a b.

Niech

vs:=bTe-AsBTRm.

Z założenia, że rankM=n oraz uwagi 2.3 wynika, że (LA) jest właściwy, czyli

v0na0,t1. (2.20)

Określmy sterowanie

ut=-vtvtdlavt00dlavt=0 .

Wówczas mamy

-0t1bTe-AsBusds=-0t1vTsusds=0t1vsds.

Pokażemy, że

0vsds=, (2.21)

a zatem istnienie takiego t1, że (2.19) jest spełniona.

Załóżmy, że (2.21) nie jest spełniona, czyli

0vsds<.

Wówczas ϕt:=tvsds spełnia

ϕ˙t=-vt,limtϕt=0,ϕ0 . (2.22)

Jeżeli P jest wielomianem charakterystycznym macierzy A, to PA=0. Stąd

P-ddtvt=P-ddtbTe-AtBT=bTP-ddte-AtBT=bTPAe-AtBT0 .

Zatem funkcja ϕ=ϕt spełnia liniowy układ równań różniczkowych ze stałymi współczynnikami

ddtP-ddtϕt=0 .

Rozwiązaniem tego równania jest pewna liniowa kombinacja wyrazów postaci

P1tsinγt+P2tcosγteγt,

gdzie γ jest pierwiastkiem równania

γP-γ=0.

Zatem γ=0, lub -γ=λ, gdzie λ jest wartością własną macierzy A. Z założenia wynika, że

γ0

co jest sprzeczne z (2.22). To kończy dowód implikacji a b.

2. Dowód b a. Pokażemy, że

  • rankM<n,

lub

  • λ>0 dla pewnej wartości własnej λ macierzy A

implikuje CRn.

Jeżeli rankM<n, to z wniosku 2.2 wynika, że CRn.

Niech λ>0, dla pewnej wartości własnej λ macierzy A. Jeżeli yCn jest (lewym) wektorem własnym (eigenvector), to

yTA=λyT.

Stąd

yTAk=λkyTk=1,2,,

a zatem

yTe-At=e-λtyTt>0 .

Mamy

yT=yT+iyT,y,yRn,y0 .

Wówczas

yTe-At=e-λtcosλtyT-e-λtsinλtyT. (2.23)

Mamy

yTx0=-0t1yTe-AsBusds. (2.24)

Z (2.23) wynika, że prawa strona (2.24) jest ograniczona jednostajnie względem t1>0. Zatem

yTx0<αx0C,

dla pewnego αR1. Czyli C leży po jednej stronie pewnej hiperpłaszczyzny, a więc CRn. To kończy dowód b a.

Ćwiczenie 2.1

Czy twierdzenie 2.5 jest prawdziwe dla klas CPC, Cε, CBB oraz CBBPC? Dla CBB można zastosować zasadę bang–bang — por. twierdzenie 5.1.

Z dowodu b a twierdzenia 2.5 wynika prawdziwość (por. [24], str. 38):

Wniosek 2.4

Jeżeli rankM=n oraz λ>0, dla pewnej wartości własnej λ macierzy A, to CRn.

Przykład 2.4 (Wagon odrzutowy — patrz przykład 1.2)
x˙1x˙2=Ax1x2+But,A=0100,B=01.

Mamy

M=B,AB=0110,

rankM=2 i układ jest właściwy. Jedyną (podwójną) wartością własną macierzy A jest 0. Z twierdzenia 2.5 wynika, że C=R2, czyli każdy stan początkowy może być doprowadzony do celu 0R2.

W przeciwieństwie do przypadku klasy sterowań Um o wartościach w Ω=-1,1m, rozważanego w twierdzeniu 2.5, w przypadku sterowań o wartościach w Ω=Rm okazuje się, że warunek rankM=n jest równoważny całkowitej sterowalności. W przypadku Ω=Rm klasę sterowań definiujemy jako

Um=t1>0L0,t1;Rm.

Dla uproszczenia notacji odpowiedni zbiór sterowalny bedziemy oznaczali jako C, czyli tak samo, jak w przypadku Ω=-1,1m (sens będzie wynikał z kontekstu).

Wówczas można sformułować następujące twierdzenie:

Twierdzenie 2.6

Dla (LA) i klasy sterowań Um następujące dwa warunki są równoważne:

  • (a) rankM=n,

  • (b) C=Rn.

Dowód: por. [14], str. 58; [27], str. 107.

1. Dowód b a, czyli a b jest identyczny jak punkt 1 dowodu twierdzenia 2.4.

2. Dowód a b. Załóżmy, że rankM=n. Z twierdzenia 2.4 wynika, że istnieje otwarta kula B=B0,δ o środku w 0Rn i promieniu δ>0, t.ż. BC. Dla dowolnego x0Rn istnieje stała η]0,1], t.ż.

ηx0B,

czyli istnieje t1>0 oraz uUm0,t1, t.ż.

ηx0=-0t1e-AsBusds.

Stąd

x0=-0t1e-AsBu¯sds,

gdzie u¯=uηUm, co kończy dowód.

Okazuje się (por. [31], str. 37), że dla klasy sterowań Um ,,prawie wszystkie” układy (LA) są lokalnie sterowalne (tzn. spełniają 0C), a dla klasy sterowań Um ,,prawie wszystkie” układy (LA) są całkowicie sterowalne (tzn. spełniają C=Rn).

Odległość między dwoma układami (LA): (A1,B1) i (A2,B2), czyli x˙=A1x+B1u i x˙=A2x+B2u, odpowiednio, określamy jako

dA1,B1,A2,B2=A1-A2+B1-B2,

gdzie A=i,j=1naij i analogicznie B.

Zatem dwa układy są bliskie, jeżeli elementy odpowiednich macierzy są bliskie.

Twierdzenie 2.7

Zbiór wszystkich sterowalnych (LA) jest otwarty i gęsty w przestrzeni metrycznej wszystkich (LA), gdzie ,,sterowalność” rozumiemy w sensie

  • całkowitej sterowalności dla Ω=Rm,

  • lokalnej sterowalności dla Ω=-1,1m.

Dowód: [31], str. 37.

Z twierdzenia 2.4, lub twierdzenia 2.6, w obu rozważanych przypadkach, sterowalność jest równoważna warunkowi rankM=n. Ten warunek oznacza, że istnieje (n×n)–macierz N, będąca podmacierzą M, t.ż. detN0.

Jeżeli układ (A~,B~) jest bliski (A,B), to odpowiednia n×n podmacierz N~ macierzy M~ jest bliska odpowiedniej podmacierzy N macierzy M. Jeżeli detN0, to detN~0 dla N-N~ — małego. Zatem układy sterowalne są zbiorem otwartym.

Załóżmy, że x˙=A0x+B0u nie jest sterowalny, tzn. rankM0<n, gdzie M0=B0,,A0n-1B0. Chcemy pokazać istnienie układu (A~,B~) — bliskiego układowi (A0,B0) — t.ż. detN~0, dla pewnej n×n podmacierzy N~ macierzy M~=B~,,A~n-1B~.

detN~ może być traktowany jako wielomian Py1,,yk elementów macierzy A~ i B~, gdzie k=n2+nm. Mamy

Py01,,y0k=0

dla y01,,y0k – elementów macierzy A0, B0.

Wystarczy pokazać, że: dla niezerowego wielomianu P=Py1,,yk, t.ż. Py01,,y0k=0, istnieje y1Rk — dowolnie bliskie y0, t.ż.

Py11,,y1k0 .

Powyższe zdanie wynika z faktu, że niezerowy wielomian k zmiennych nie może znikać w żadnej k–wymiarowej kuli: gdyby znikał, to biorąc pochodne cząstkowe pokazalibyśmy, że wszystkie współczynniki się zerują.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.