2. Sterowalność

Współrzędne wektora $x\in{{\mathbb{R}}}^{n}$ oznaczamy $x^{1}$ , $x^{2}$ , $\ldots$ , $x^{n}$ , $n=1,2,\ldots$ :

$x=\left[\begin{array}[]{c}x^{1}\\ .\\ .\\ .\\ x^{n}\end{array}\right]\,.$

Dla odróżnienia naturalne potęgi $\phi$ oznaczamy jako $\big(\phi\big)^{p}$ , $p=1,2,\ldots\,$ .

Dla uproszczenia notacji element zerowy w każdej ${{\mathbb{R}}}^{n}$ , dla $n=1,2,\ldots$ , oznaczamy przez $0$ .

Definicja 2.1

Niech $\Omega\subset{{\mathbb{R}}}^{m}$ , $m=1,2,\ldots$ będzie zadanym zbiorem. Zbiór ten będziemy nazywali zbiorem parametrów sterujących.

Przez większą część wykładu, będziemy przyjmować, że $\Omega=[-1,1]^{m}$ , choć omówimy kilkakrotnie sytuacje $\Omega={{\mathbb{R}}}^{m}$ . Jeżeli nie będzie podane inaczej, będziemy zakładali, że $\Omega=[-1,1]^{m}$ . Niech

${{\mathbb{U}}}_{m}[0,{t_{1}}]=\Big\{\, u\,:\, u(t)\in\Omega\quad{\mathrm{oraz}}\quad u\quad{\mathrm{mierzalna}}\;{\mathrm{na}}\quad[0,{t_{1}}]\,\Big\}$

${{\mathbb{U}}}_{m}=\bigcup\limits _{{{t_{1}}>0}}\;{{\mathbb{U}}}_{m}[0,{t_{1}}]$

Każdy element $u\in{{\mathbb{U}}}_{m}$ będziemy nazywali sterowaniem (control) (lub strategią). Dla każdego sterowania $u$ istnieje odpowiedni odcinek $[0,{t_{1}}(u)]$ , na którym jest określone.

Definicja 2.2

Dla każdego $t\geq 0$ określamy rodzinę zbiorów celu (target sets) ${{\mathcal{T}}}(t)\subset{{\mathbb{R}}}^{n}$ , gdzie ${{\mathcal{T}}}(t)$ jest zbiorem domkniętym w ${\mathbb{R}}^{n}$ .

Jeżeli nie będzie podane inaczej, to ${{\mathcal{T}}}(t)=0\in{{\mathbb{R}}}^{n}$ , tak jak w przykładach 1.2 i 1.3.

Rozpatrujemy zagadnienie początkowe dla równania różniczkowego zwyczajnego

${\dot{x}}(t)=f(t,x(t),u(t))\,,\qquad x(0)=x_{0}\,,$

(2.1)

gdzie $x_{0}\in{{\mathbb{R}}}^{n}$ , $x:\,[0,{t_{1}}]\,\to{{\mathbb{R}}}^{n}$ oraz $u=u(t)$ , $u\in{{\mathbb{U}}}_{m}[0,t_{1}]$ , jest poszukiwanym sterowaniem.

Powyższe zagadnienie dotyczy sterowania w pętli otwartej (control in open–loop form), $u=u(t)$ . Można też rozpatrywać sterowanie w zamkniętej pętli (control in closed–loop form), gdy poszukuje się odwzorowania (zwanego sprzężeniem zwrotnym (feedback) $\alpha\,:\;{{\mathbb{R}}}^{n}\,\to\,{{\mathbb{U}}}_{m}$ dla RRZ

${\dot{x}}(t)=f\big(t,x(t),\alpha(x(t))\big)\,,\qquad x(0)=x_{0}\,.$

(2.2)

Sprowadzenie $u=u(t)$ do $u=\alpha(x(t))$ nazywa się zagadnieniem syntezy (synthesis) sterowania.

Możliwe jest podejście alternatywne w języku inkluzji różniczkowej (differential inclusion)

${\dot{x}}\in F(t,x)$

(2.3)

gdzie

$F(t,x)=\Big\{ y\,:\, y=f(t,x,u)\,,\quad\mathrm{dla}\;\mathrm{pewnego}\; u\in\Omega\Big\}\,.$

Założenie 2.1

Funkcja

$f\,:\;[0,\infty[\,\times{\mathbb{R}}^{n}\times\Omega\to{\mathbb{R}}^{n}$

jest ciągła wraz z pochodnymi cząstkowymi $\frac{\partial f^{i}}{\partial x^{j}}$ , $\frac{\partial f^{i}}{\partial u^{k}}$ dla $i,j=1,\ldots,n$ , $k=1,2,\ldots,m$ na zbiorze $[0,\infty[\,\times{{\mathbb{R}}}^{n}\times\Omega$ .

Założenie 2.1 gwarantuje lokalne istnienie i jednoznaczność rozwiązania dla $u\in{{\mathbb{U}}}_{m}$ — tw. Picarda–Lindelöfa — por. [14, 17, 23]. Ponieważ jednak funkcja $u$ jest jedynie funkcją mierzalną i ograniczoną, więc prawa strona RRZ (2.1) jest tylko mierzalna i ograniczona jako funkcja $t$ dla każdego $x$ . Zatem rozwiązanie rozumiane jest jako absolutnie ciągła funkcja spełniająca RRZ (2.1) prawie wszędzie — por. [14, 17, 23].

Założenie 2.1 jest mocniejsze, niż jest to jest potrzebne w niektórych wynikach. Do istnienia i jednoznaczności wystarczy Lipschitz–owskość, ciągłość też można osłabić.

Definicja 2.3

Dla zadanego sterowania $u\in{{\mathbb{U}}}_{m}$ rozwiązanie RRZ (2.1) nazywa się odpowiedzią na (response to) $u$ — oznaczamy $x(t)=x(t,x_{0},{u(\,.\,)})$ .

Problem 2.1

Zagadnienie sterowania (control problem): dla zadanego $x_{0}$ znaleźć ${t_{1}}>0$ oraz $u\in{{\mathbb{U}}}_{m}\,[\, 0,t_{1}\,]\,$ , t.ż. odpowiednia odpowiedź $x({t_{1}})\in{{\mathcal{T}}}({t_{1}})$ .

Jeżeli takie $u$ da się znaleźć, to mówimy, że sterowanie $u$ prowadzi $x_{0}$ do celu ${{\mathcal{T}}}({t_{1}})$ (control $u$ steers $x_{0}$ to the target ${{\mathcal{T}}}({t_{1}})$ ), lub że $u$ jest sterowaniem pomyślnym (successful control).

Problem 2.2

Zagadnienie sterowalności (controllability problem): określić dane początkowe, które można doprowadzić do celu (tzn. dane początkowe, które są sterowalne (controllable)), czyli określić te dane początkowe, dla których istnieje pomyślne sterowanie $u\in{{\mathbb{U}}}_{m}$ .

Definicja 2.4

Zbiór sterowalny (controllable set) ${\mathcal{C}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})$ , gdzie

${\mathcal{C}}({t_{1}})=\Big\{ x_{0}\in{\mathbb{R}}^{n}\,:\;{\mathrm{istnieje}}\; u\in{\mathbb{U}}_{m}\,,\quad\mathrm{t.{\dot{z}}.}\quad x({t_{1}},x_{0},{u(\,.\,)})\in{\mathcal{T}}({t_{1}})\Big\}\,,$

(2.4)

${\mathcal{C}}({t_{1}})$ jest zbiorem tych stanów, które mogą być doprowadzone do celu w chwili ${t_{1}}$ .

Będziemy badali zbiór ${\mathcal{C}}$ , oraz określimy jak zmienia się ${\mathcal{C}}$ wraz z zawężeniem klasy sterowań.

Definicja 2.5

Jeżeli ${\mathcal{C}}={\mathbb{R}}^{n}$ , to sterowalność jest całkowita (completely controllable). Natomiast przypadek $0\in\,\mathrm{Int}\,{\mathcal{C}}$ nazywamy sterowalnością lokalną (locally controllable).

Można rozważać węższe klasy sterowań (por. [31]):

Klasa sterowań kawałkami stałych (piecewise constant controls) ${{\mathbb{U}}}_{{PC}}$ :

$u\in{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}]$ , jeżeli $u$ jest kawałkami stała na $[0,{{t_{1}}}]$ , czyli istnieją $0=s_{0}<s_{1}<\ldots<s_{l}={{t_{1}}}$ , t. ż, $u$ jest stała na każdym przedziale $[s_{{k-1}},s_{k}\,[\,$ ;

${{\mathbb{U}}}_{{PC}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}]\,.$
Klasa sterowań gładkich i niezmieniających się nagle (smooth controls that do not change rapidly) ${{\mathbb{U}}}_{{\varepsilon}}$ :

$u\in{{\mathbb{U}}}_{{\varepsilon}}[0,{{t_{1}}}]$ , jeżeli $u$ jest absolutnie ciągła na $[0,{{t_{1}}}]$ , $u(0)=u(1)$ oraz $|{\dot{u}}(t)|\leq\varepsilon$ p.w. na $[0,{{t_{1}}}]\,$ ;

${{\mathbb{U}}}_{{\varepsilon}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{\varepsilon}}[0,{{t_{1}}}]\,.$
Klasa sterowań ,,bang–bang” (bang–bang controls) ${{\mathbb{U}}}_{{BB}}$ :

$u\in{{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}]$ , jeżeli $|u^{j}(t)|=1$ dla p.k. $t\in[0,{t_{1}}]\,$ oraz każdego $j=1,\,\ldots\,,m$ ;

${{\mathbb{U}}}_{{BB}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}]\,.$
Klasa sterowań bang–bang kawałkami stałych ${{\mathbb{U}}}_{{BBPC}}$ :

${{\mathbb{U}}}_{{BBPC}}[0,{{t_{1}}}]={{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}]\bigcap{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}]\,;$

${{\mathbb{U}}}_{{BBPC}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{BBPC}}[0,{{t_{1}}}]\,.$

Analogicznie do ${\mathcal{C}}$ określamy zbiory sterowalne ${{\mathcal{C}}}_{{PC}}$ , ${{\mathcal{C}}}_{{\varepsilon}}$ , ${{\mathcal{C}}}_{{BB}}$ , ${{\mathcal{C}}}_{{BBPC}}$ w odniesieniu do odpowiednich klas sterowań.

Problem 2.3

Rozpatrywać będziemy ogólne autonomiczne (autonomous) zagadnienie nieliniowe (NLA)

${\dot{x}}=f(x,u)\,,\qquad x(t)\in{\mathbb{R}}^{n}\,,\qquad u\in{\mathbb{U}}_{m}\,,$

(2.5)

z warunkiem początkowym

$x\Big|_{{t=0}}=x_{0}\in{\mathbb{R}}^{n}\,,$

i celem ${\mathcal{T}}(t)\equiv 0$ .

Założenie 2.2

Zakładamy, że funkcja $f\,:\;{\mathbb{R}}^{n}\times\Omega\to{\mathbb{R}}^{n}$ jest klasy $C^{1}$ na ${\mathbb{R}}^{n}\times\Omega$ oraz $f(0,0)=0$ .

Stąd dla zadanego warunku początkowego $x_{0}$ odpowiedź $x(t)=x(t;x_{0},{u(\,.\,)})$ istnieje (przynajmniej) lokalnie w czasie i jest jednoznaczna.

Będziemy również rozpatrywać zagadnienie liniowe (LA)

Problem 2.4

${\dot{x}}=Ax+Bu\,,\qquad x(t)\in{\mathbb{R}}^{n}\,,\qquad u\in{\mathbb{U}}_{m}\,,$

(2.6)

gdzie $A$ i $B$ są stałymi macierzami, $n\times n$ i $n\times m$ , odpowiednio,

z warunkiem początkowym

$x\Big|_{{t=0}}=x_{0}\in{\mathbb{R}}^{n}\,,$

i celem ${\mathcal{T}}(t)\equiv 0$ .

Macierz $B$ ma więc postać:

$B=\left[\begin{array}[]{ccc}b_{{11}}&\ldots&b_{{1m}}\\ .&.&.\\ .&.&.\\ .&.&.\\ b_{{n1}}&\ldots&b_{{nm}}\end{array}\right]\,.$

Lemat 2.1

Dla (NLA):

Jeżeli $u=u(t)$ prowadzi $x_{0}$ do $0$ na $[0,{t_{1}}]$ z odpowiedzią $x=x(t)$ (tzn. $x(t_{1})=0$ ), to $\bar{u}(t)=u(t-t_{0})$ prowadzi $x_{0}$ do $0$ na $[t_{0},t_{0}+{t_{1}}]$ z odpowiedzią $\bar{x}(t)=x(t-t_{0})$ .
Jeżeli $x=x(t)$ jest odpowiedzią na $u\in{\mathbb{U}}_{m}[0,{t_{1}}]$ prowadzącą $x(0)=x_{0}$ do $x({t_{1}})=x_{1}$ , to $z(t)=x({t_{1}}-t)$ jest odpowiedzią na $\bar{u}(t)=u({t_{1}}-t)$ dla równania (z odwróconym czasem)

$\dot{z}=-f(z(t),\bar{u}(t))\,,$ (2.7)

prowadzącą $z(0)=x_{1}$ do $z({t_{1}})=x_{0}$ .

Dowód

$\quad$

1. Mamy

$\dot{\bar{x}}=\dot{x}(t-t_{0})=f({x}(t-t_{0}),u(t-t_{0}))=f(\bar{x}(t),\bar{u}(t))$

dla p.w. $t\in[t_{0},t_{0}+{t_{1}}]$ . Ponadto

$\bar{x}(t_{0})=x(0)=x_{0}\,,\qquad\bar{x}(t_{0}+{t_{1}})=x({t_{1}})=0\,.$

2. Mamy

$\dot{z}(t)=\frac{\mathrm{d}}{\mathrm{d}t}{x}({t_{1}}-t)=-f({x}({t_{1}}-t),u({t_{1}}-t))=-f(z(t),\bar{u}(t))$

dla p.w. $t\in[0,{t_{1}}]$ . Ponadto

$z(0)=x({t_{1}})=x_{1}\,,\qquad z({t_{1}})=x(0)=x_{0}\,.$

∎

Zagadnienie (NLA) jest autonomiczne w tym sensie, że punkt 1 lematu 2.1 jest spełniony.

Definicja 2.6

Zbiór jest łukowo spójny (arcwise connected), jeżeli każde dwa punkty zbioru mogą być połączone łukiem (homeomorficznym obrazem odcinka) całkowicie zawartym w zbiorze.

Twierdzenie 2.1

Dla (NLA):

jeżeli $x_{0}\in{\mathcal{C}}$ oraz $y$ jest punktem trajektorii łączącej $x_{0}$ z celem $0$ , to $y\in{\mathcal{C}}$ ;
zbiór ${\mathcal{C}}$ jest łukowo spójny;
jeżeli $0\leq\tau _{1}<\tau _{2}$ , to ${\mathcal{C}}(\tau _{1})\subset{\mathcal{C}}(\tau _{2})$ ;
${\mathcal{C}}$ jest otwarty wtedy i tylko wtedy, gdy $0\in\,\mathrm{Int}\,{\mathcal{C}}$ .

Dowód: [31] — str. 26–27, [24] — str. 31–32.

$\quad$

1. Niech $x_{0}\in{\mathcal{C}}$ . Istnieje wówczas pomyślne sterowanie $u_{1}\in{\mathbb{U}}_{m}$ oraz odpowiedź $x(t)=x(t;x_{0},u_{1}(\,.\,))$ , t.ż. $x({t_{1}})=0$ dla pewnego ${t_{1}}>0$ . Dla $\bar{t}\in[0,{t_{1}}]$ chcemy pokazać, że $y:=x(\bar{t})\in{\mathcal{C}}$ . Sterowanie $u_{2}(t):=u(t+\bar{t})$ , określone na $t\in[0,{t_{1}}-\bar{t}]$ jest pomyślne z odpowiedzią $x_{2}(t):=x(t+\bar{t})$ :

$\dot{x}_{2}(t)=f(x_{2}(t),u_{2}(t))\,,\qquad x_{2}(0)=x(\bar{t})=y\,,\qquad x_{1}({t_{1}}-\bar{t})=0\,,$

a zatem $y\in{\mathcal{C}}({t_{1}}-\bar{t})$ .

2. Jeżeli $\bar{x}_{0}$ , $\hat{x}_{0}$ są w ${\mathcal{C}}$ , to istnieją sterowania $\bar{u}$ i $\hat{u}$ oraz odpowiedzi $\bar{x}(t)=x(t;\bar{x}_{0},\bar{u}(\,.\,))$ , $\hat{x}(t)=x(t;\hat{x}_{0},\hat{u}(\,.\,))$ , t.ż.

$\bar{x}(\bar{t})=0=\hat{x}(\hat{t})\qquad\mathrm{dla}\;\mathrm{pewnych}\quad\bar{t}>0\,,\quad\hat{t}>0\,.$

Z 1. każdy punkt obu trajektorii jest w ${\mathcal{C}}$ . Zatem istnieje łuk całkowicie zawarty w ${\mathcal{C}}$ łączący punkty $\bar{x}_{0}$ , $\tilde{x}_{0}$ .

3. Niech $x_{0}\in{\mathcal{C}}(\tau _{1})$ . Zatem istnieje sterowanie $u\in{\mathbb{U}}_{m}$ , t.ż. $x(\tau _{1})=0$ dla odpowiedzi $x(t)=x(t;x_{0},{u(\,.\,)})$ . Dla $\tau _{2}>\tau _{1}$ określmy sterowanie

$u_{2}\in{\mathbb{U}}_{m}\;:\qquad u_{2}(t)=\left\{\begin{array}[]{ccc}u(t)&\textrm{dla}&t\in[\, 0,\tau _{1}\,]\\ 0&\textrm{dla}&t\in]\,\tau _{1},\tau _{2}\,]\end{array}\right.\,.$

Z warunku $f(0,0)=0$ wynika, że odpowiedż $x_{2}(t)=x(t;x_{0},u_{2}(\,.\,))$ spełnia

$x_{2}(t)=0\,,\qquad t\in[\tau _{1},\tau _{2}]\,,$

a zatem $u_{2}$ prowadzi $x_{0}$ do celu $0$ w czasie $\tau _{2}$ , czyli $x_{0}\in{\mathcal{C}}(\tau _{2})$ .

4. Implikacja ,, $\Rightarrow$ ” jest oczywista, gdyż $0\in{\mathcal{C}}$ .

Pokażemy implikację ,, $\Leftarrow$ ”. Jeżeli $0\in\,\mathrm{Int}\,{\mathcal{C}}$ , to istnieje otwarta kula $\mathbb{B}_{0}=\mathbb{B}(0,\delta _{0})$ o środku w $0$ i promieniu $\delta _{0}>0$ , t.ż. $\mathbb{B}_{0}\subset{\mathcal{C}}$ . Niech $x_{1}\in{\mathcal{C}}$ . Chcemy pokazać, że istnieje otwarta kula o środku w $x_{1}$ całkowicie zawarta w ${\mathcal{C}}$ . Ponieważ $x_{1}\in{\mathcal{C}}$ , więc istnieje sterowanie $u_{1}\in{\mathbb{U}}_{m}$ oraz odpowiedź $x(t)=x(t;x_{1},u_{1}(\,.\,))$ , t.ż. $x({t_{1}})=0$ dla pewnego ${t_{1}}>0$ . Funkcja $f$ jest klasy $C^{1}$ , więc z ciągłej zależności od danych początkowych wynika istnienie otwartej kuli $\mathbb{B}_{1}=\mathbb{B}(x_{1},\delta _{1})$ , $\delta _{1}>0$ , t.ż. dla każdego $y\in{\mathbb{B}}_{1}$ :

$x_{2}:=x({t_{1}};y,u_{1}(\,.\,))\in\mathbb{B}_{0}\;\Big(\subset{\mathcal{C}}\Big)\,.$

Istnieje więc sterowanie $u_{2}\in{\mathbb{U}}_{m}$ , które prowadzi $x_{2}$ do $0$ w czasie $t_{2}>0$ .

Zatem dla każdego $y\in{\mathbb{B}}_{1}$ istnieje sterowanie $u\in{\mathbb{U}}_{m}$ ,

$u(t)=\left\{\begin{array}[]{ccc}u_{1}(t)&\textrm{dla}&t\in[\, 0,{t_{1}}\,]\\ u_{2}(t-{t_{1}})&\textrm{dla}&t\in]\,{t_{1}},{t_{1}}+t_{2}\,]\end{array}\right.\,,$

(2.8)

które prowadzi $y$ do $0$ . Zatem $\mathbb{B}_{1}\subset{\mathcal{C}}$ .

∎

Uwaga 2.1

Można pokazać, że są prawdziwe twierdzenia analogiczne do twierdzenia 2.1 dla klas ${{\mathcal{C}}}_{{PC}}$ oraz ${{\mathcal{C}}}_{{\varepsilon}}$ . Dla ${{\mathcal{C}}}_{{BB}}$ oraz ${{\mathcal{C}}}_{{BBPC}}$ punkty 1, 2 i 4 wynikają bezpośrednio. Natomiast punkt 3 dla ${{\mathcal{C}}}_{{BB}}$ wynika z zasady bang–bang — por. twierdzenie 5.1.

Uwaga 2.2

Argumentu w dowodzie ,, $\Leftarrow$ ” punktu 4 twierdzenia 2.1 nie można przenieść na ${\mathcal{C}}({t_{1}})$ dla ${t_{1}}>0$ , gdyż sterowanie (2.8) określone jest na $t_{1}+t_{2}$ . Najczęściej brzeg zbioru ${\mathcal{C}}({t_{1}})$ należy do tego zbioru, więc ${\mathcal{C}}({t_{1}})$ nie jest otwarty.

Rozważymy teraz zagadnienie liniowe (LA). Rozwiązanie (LA) ma postać

$x(t)=x\big(t;x_{0},{u(\,.\,)}\big)=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu(s)\,{\mathrm{d}}s\,.$

(2.9)

Mamy:

$x_{0}\in{\mathcal{C}}({t_{1}})\quad\Leftrightarrow\quad\exists\; u\in{\mathbb{U}}_{m}[0,{t_{1}}]\;:\quad x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}Bu(s)\,{\mathrm{d}}s\,,$

(2.10)

Definicja 2.7

Zbiór $\mathbb{S}$ jest symetryczny (symmetric), gdy $x\in\mathbb{S}$ $\,\Leftrightarrow\,$ $-x\in\mathbb{S}$ .

Twierdzenie 2.2

Dla (LA): ${\mathcal{C}}\subset{\mathbb{R}}^{n}$ jest symetryczny oraz wypukły.

Dowód: [19] — str. 17, [31] — str. 29, [24] — str. 33.

$\quad$

Mamy (2.10). Jeżeli $x_{0}\in{\mathcal{C}}({t_{1}})$ dla $u\in{\mathbb{U}}_{m}[0,{t_{1}}]$ , to $-x_{0}\in{\mathcal{C}}({t_{1}})$ dla $-u\in{\mathbb{U}}_{m}[0,{t_{1}}]$ . Zatem ${\mathcal{C}}=\bigcup _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})$ jest symetryczny.

Jeżeli $x_{0}\in{\mathcal{C}}({t_{1}})$ ze sterowaniem $u_{0}$ i $x_{*}\in{\mathcal{C}}({t_{1}})$ ze sterowaniem $u_{1}$ , to $\alpha x_{0}+(1-\alpha)x_{*}\in{\mathcal{C}}({t_{1}})$ ze sterowaniem $\alpha u_{0}+(1-\alpha)u_{*}$ . Zatem ${\mathcal{C}}({t_{1}})$ jest wypukły. Nie wynika z tego od razu, że ${\mathcal{C}}=\bigcup _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})$ jest wypukły (suma zbiorów wypukłych nie musi być wypukła). Jednakże stosując argument z dowodu punktu 3 twierdzenia 2.1 pokazujemy, że $\mathcal{C}$ jest wypukły.

∎

Twierdzenie 2.2 można uogólnić na sytuację, gdy $A=A(t)$ , $B=B(t)$ są ciągłymi funkcjami. W dowodzie korzysta się z następujących własności klasy sterowań: symetryczności, wypukłości i możliwości przyjmowania wartości $0$ . Twierdzenie 2.2 zachodzi więc dla klas ${\mathbb{U}}_{{PC}}$ i ${\mathbb{U}}_{{\varepsilon}}$ , ale nie zachodzi dla ${\mathbb{U}}_{{BB}}$ i ${\mathbb{U}}_{{BBPC}}$ , które nie są wypukłe i nie zawierają $0$ . W rozdziale 5 (twierdzenie 5.1) pokażemy jednak zasadę ,,bang–bang” dla (LA): ${\mathcal{C}}_{{BB}}({t_{1}})={\mathcal{C}}({t_{1}})$ . Z zasady ,,bang–bang” wynika, że

${\mathcal{C}}_{{BB}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}_{{BB}}({t_{1}})=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})={\mathcal{C}}\,,$

a zatem z wypukłości ${\mathcal{C}}$ wynika wypukłość ${\mathcal{C}}_{{BB}}$ .

Następujące przykłady pokazują, że ${\mathcal{C}}$ może nie zawierać pewnego otoczenia celu, czyli, że nie jest spełniona nawet lokalna sterowalność.

Przykład 2.1 ([19], str. 18)

Niech $n=2$ , $m=1$ ,

$\begin{array}[]{lll}\dot{x}^{1}&=&0\,,\\ \dot{x}^{2}&=&u\,.\end{array}$

(2.11)

Zatem

$A=\left[\begin{array}[]{cc}0&0\\ 0&0\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\ 1\end{array}\right]\,.$

Rozwiązanie spełniające $x(0)=x_{0}$ ma postać

$\begin{array}[]{lll}x^{1}(t)&=&x^{1}_{0}\\ x^{2}(t)&=&x^{2}_{0}+\int\limits _{0}^{t}u(s)\,\mathrm{d}s\end{array}\,.$

(2.12)

Stąd

${\mathcal{C}}=\Bigg\{\left[\begin{array}[]{c}x^{1}\\ x^{2}\end{array}\right]\,:\quad x^{1}=0\,,\quad x^{2}\in\mathbb{R}^{1}\Bigg\}\,,$

czyli $\mathcal{C}$ jest osią $x^{2}$ .

Przykład 2.2 ([31], str. 30; [24], str. 34)

Niech $n=2$ , $m=1$ ,

$\begin{array}[]{lll}\dot{x}^{1}&=&x^{1}+u\,,\\ \dot{x}^{2}&=&x^{2}+u\,.\end{array}$

(2.13)

Zatem

$A=\left[\begin{array}[]{cc}1&0\\ 0&1\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}1\\ 1\end{array}\right]\,.$

Rozwiązanie spełniające $x(0)=x_{0}$ ma postać

$\left[\begin{array}[]{c}x^{1}(t)\\ x^{2}(t)\end{array}\right]=e^{t}\left[\begin{array}[]{c}x_{0}^{1}\\ x_{0}^{2}\end{array}\right]+\Big(e^{t}\int\limits _{0}^{t}e^{{-s}}u(s)\,{\mathrm{d}}s\Big)\left[\begin{array}[]{c}1\\ 1\end{array}\right]\,.$

(2.14)

Jeżeli $x^{1}({t_{1}})=x^{2}({t_{1}})=0$ , to

$x_{0}^{1}=x_{0}^{2}=-\int\limits _{0}^{{{t_{1}}}}e^{{-s}}u(s)\,{\mathrm{d}}s$

oraz

$-\big(1-e^{{-{t_{1}}}}\big)\leq-x_{0}^{1}=-x_{0}^{2}\leq 1-e^{{-{t_{1}}}}\,,$

bo $u(s)\in\,[\,-1,1\,]\,$ .

Stąd

${\mathcal{C}}=\Bigg\{\left[\begin{array}[]{c}x^{1}\\ x^{2}\end{array}\right]\,:\quad x^{1}=x^{2}\,,\quad|x^{1}|<1\,,\quad|x^{2}|<1\Bigg\}\,.$

Przykłady 2.1 i 2.2 pokazują, że potrzebne są pewne warunki na macierze $A$ i $B$ . Warunki te zostaną wyrażone przez macierz sterowalności.

Definicja 2.8

Dla (LA) wprowadzamy macierz sterowalności (controllability matrix):

$M=\underbrace{\Big[\, B,AB,A^{2}B,\ldots,A^{{n-1}}B\,\Big]}_{{\mathrm{macierz}\; n\times nm}}$

W dowodzie odpowiedniego twierdzenia (tw. 2.4) korzysta się z pojęcia hiperpłaszczyzny:

Definicja 2.9

$(n-1)$ –wymiarową hiperpłaszczyzną (hyperplane) w ${\mathbb{R}}^{n}$ nazywamy zbiór

${\mathbb{H}}=\Big\{ x\in{{\mathbb{R}}}^{n}\,:\; a^{T}x=\alpha\,\Big\}\,,$

gdzie $a\in{\mathbb{R}}^{n}$ , $a^{T}$ oraz $\alpha\in{\mathbb{R}}^{1}$ są zadane, $a^{T}x$ oznacza iloczyn skalarny wektorów $a$ i $x$ .

Istotną rolę odgrywa tu wniosek z twierdzenia Mazura (geometrycznej wersji twierdzenia Hahna-Banacha) - twierdzenie o hiperpłaszczyźnie podpierającej — por. [30], str. 190.

Twierdzenie 2.3 (Twierdzenie o hiperpłaszczyźnie podpierającej)

Jeżeli $y\not\in\,\mathrm{Int}\,\mathbb{K}$ , gdzie $\mathbb{K}$ jest wypukłym zbiorem, t.ż. $\mathrm{Int}\,\mathbb{K}\,\not=\emptyset$ , to istnieje hiperpłaszczyzna podpierająca $\mathbb{H}$ w $y$ (supporting hyperplane $\mathbb{H}$ through $y$ ), tzn. $\mathbb{K}$ leży po jednej stronie $\mathbb{H}$ :

$a^{T}y=\alpha\,,\qquad\quad a^{T}x\leq\alpha\quad\forall\; x\in\mathbb{K}\,,$

(2.15)

dla pewnego $\alpha\in{\mathbb{R}}^{1}$ .

$\clubsuit$

Twierdzenie 2.4

Dla (LA): Następujące trzy warunki są równoważne

(a) $\;\mathrm{rank}\, M=n$
(b) $\; 0\in{\mathrm{Int}}\,{\mathcal{C}}\;$ (lokalna sterowalność)
(c) $\;{\mathcal{C}}$ — otwarty w ${\mathbb{R}}^{n}$

Dowód: [19], str. 18, [31], str. 31, [24], str. 35, [27], str. 108

$\quad$

Zauważmy, że równoważność ${(b)}$ $\,\Leftrightarrow\,$ ${(c)}$ wynika z twierdzenia 2.1.

1. Dowód ${(b)}$ $\;\Rightarrow\;$ ${(a)}$ , czyli $\sim{(a)}$ $\;\Rightarrow\;$ $\sim{(b)}$ . Załóżmy więc $\sim{(a)}$ , czyli $\mathrm{rank}\, M<n$ .

Wówczas istnieje wektor $y\in\mathbb{R}^{n}$ , $y\not=0$ , prostopadły do każdej kolumny macierzy $M$ , czyli

$y^{T}M=0\;\Bigg(\in\mathbb{R}^{{nm}}\Bigg)\,.$

Stąd

$y^{T}B=y^{T}AB=\ldots=y^{T}A^{{n-1}}B=0\;\Bigg(\in\mathbb{R}^{{m}}\Bigg)\,.$

Niech $\mathcal{P}$ będzie wielomianem charakterystycznym macierzy $A$

$\mathcal{P}(\lambda)=\det(\lambda I-A)\,,$

gdzie $I$ jest macierzą jednostkową $n\times n$ .

Mamy (twierdzenie Cayleya–Hamiltona)

$\mathcal{P}(A)=0\,.$

Stąd

$A^{n}=\beta _{{n-1}}A^{{n-1}}+\ldots+\beta _{0}I\,,$

a zatem

$y^{T}A^{n}B=\beta _{{n-1}}y^{T}A^{{n-1}}B+\ldots+\beta _{0}y^{T}B=0\,.$

Podobnie

$A^{{n+1}}=\beta _{{n-1}}A^{{n}}+\ldots+\beta _{0}A$

$y^{T}A^{{n+1}}B=0\,.$

Powtarzając to postępowanie

$y^{T}A^{k}B=0\,,\qquad\forall\; k=0,1,\ldots\,.$

Stąd

$y^{T}e^{{-As}}B=y^{T}\sum\limits _{{k=0}}^{{\infty}}(-1)^{k}\frac{A^{k}\, s^{k}}{k!}B=0\,,$

dla każdego $s\in[0,t_{1}]$ .

Mamy (2.10). Stąd

$y^{T}x_{0}=-\int\limits _{0}^{{t_{1}}}y^{T}e^{{-As}}Bu(s)\,\mathrm{d}s=0\,,$

czyli istnieje niezerowy wektor $y\in\mathbb{R}^{n}$ , który jest prostopadły do każdego $x_{0}\in\mathcal{C}(t_{1})$ . Stąd wynika, że $\mathcal{C}(t_{1})$ leży w hiperpłaszczyźnie prostopadłej do $y$ dla każdego $t_{1}>0$ . Zatem $\mathcal{C}=\bigcup\limits _{{{t_{1}}>0}}\,\mathcal{C}(t_{1})$ leży w hiperpłaszczyźnie prostopadłej do $y$ i

$\mathrm{Int}\,\mathcal{C}=\emptyset\,.$

Otrzymujemy więc, że $0\not\in{\mathrm{Int}}\,{\mathcal{C}}$ , czyli $\sim{(b)}$ .

2. Dowód ${(a)}$ $\;\Rightarrow\;$ ${(b)}$ , czyli $\sim{(b)}$ $\;\Rightarrow\;$ $\sim{(a)}$ . Załóżmy więc $\sim{(b)}$ , czyli $0\not\in{\mathrm{Int}}\,{\mathcal{C}}$ . Stąd dla każdego $t_{1}>0$ : $0\not\in{\mathrm{Int}}\,{\mathcal{C}}(t_{1})$ , gdyż ${\mathcal{C}}(t_{1})\subset\mathcal{C}\;$ (nie istnieje kula $\mathbb{B}(0,\delta)\subset\mathcal{C}$ $\;\Rightarrow\;$ nie istnieje kula $\mathbb{B}(0,\delta)\subset\mathcal{C}(t_{1})$ dla każdego $t_{1}$ ).

Ale $0\in\mathcal{C}(t_{1})$ oraz $\mathcal{C}(t_{1})$ jest zbiorem wypukłym dla każdego $t_{1}>0$ (por. dowód twierdzenia 2.2). Zatem istnieje hiperpłaszczyzna przechodząca przez $0$ , taka że $\mathcal{C}(t_{1})$ leży po jednej stronie tej hiperpłaszczyzny (twierdzenie 2.3), tzn. istnieje wektor $b=b(t_{1})\in\mathbb{R}^{n}$ , $b\not=0$ , taki że

$b^{T}x_{0}\leq 0\qquad\forall\; x_{0}\in\mathcal{C}(t_{1})\,.$

Stąd

$-b^{T}x_{0}=\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\geq 0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,.$

Z lematu 2.2 poniżej wynika, że

$b^{T}e^{{-As}}B=0\qquad\forall\; s\in[0,t_{1}]\,.$

Wstawiając $s=0$ otrzymujemy $b^{T}B=0$ . Następnie różniczkując względem $s$ i wstawiając $s=0$ otrzymujemy

$b^{T}A^{k}B=0\qquad\forall\; k=0,1,\ldots\,.$

Zatem niezerowy wektor $b$ jest prostopadły do każdej kolumny $M$ i $\mathrm{rank}\, M<n$ , czyli $\sim{(a)}$ .

∎

Lemat 2.2 (Nierówność całkowa)

Jeżeli

$\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\geq 0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,,$

(2.16)

$b^{T}e^{{-As}}B=0\qquad\forall\; s\in[0,t_{1}]\,.$

Dowód: [31], str. 32; [19], str. 21

$\quad$

Jeżeli $u\in\mathbb{U}_{m}[0,t_{1}]$ , to $-u\in\mathbb{U}_{m}[0,t_{1}]$ . Zatem z (2.16) wynika, że

$\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s=0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,.$

Niech $v(s):=\Big(b^{T}e^{{-As}}B\Big)^{T}$ . Jeżeli $v\not\equiv 0$ , to istnieje $s_{0}\in[0,t_{1}]$ , t.ż. $v(s_{0})\not=0$ . Istnieje wtedy przedział $\mathbb{I}\subset[0,t_{1}]$ , t.ż. $s_{0}\in\mathbb{I}$ oraz $v\not=0$ na $\mathbb{I}$ . Określmy sterowanie

$u(t)=\left\{\begin{array}[]{ccc}\frac{v(t)}{|v(t)|}&\textrm{dla}&t\in\mathbb{I}\\ 0&\textrm{dla}&t\in[0,t_{1}]\setminus\mathbb{I}\end{array}\right.\,.$

Wówczas mamy

$0=\int\limits _{0}^{{t_{1}}}v^{T}(s)u(s)\,\mathrm{d}s=\int\limits _{{\mathbb{I}}}v^{T}(s)\frac{v(s)}{|v(s)|}\,\mathrm{d}s=\int\limits _{{\mathbb{I}}}|v(s)|\,\mathrm{d}s\,.$

Otrzymujemy więc sprzeczność z założeniem $v\not\equiv 0$ .

∎

Wniosek 2.1

Twierdzenie 2.4 można powtórzyć dla klas $\mathbb{U}_{{PC}}$ , $\mathbb{U}_{{\varepsilon}}$ , gdyż dla tych klas ,,przechodzi” lemat 2.2.

W dowodzie twierdzenia 2.4 pokazaliśmy, że

Wniosek 2.2

$\mathrm{rank}\, M<n$ $\quad\Rightarrow\quad$ istnieje hiperpłaszczyzna w ${\mathbb{R}}^{n}$ , t.ż. ${\mathcal{C}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})$ leży w tej hiperpłaszczyźnie $\quad\Rightarrow\quad$ $0\not\in\mathrm{Int}\,{\mathcal{C}}\,$ .

Ponadto

Wniosek 2.3

$\mathrm{rank}\, M=n$ wtedy i tylko wtedy, gdy

$\forall\; b\in{\mathbb{R}}^{n}\,,\; b\not=0\,:\qquad b^{T}e^{{-A\, t}}B\not\equiv 0$

(2.17)

jako funkcja zmiennej $t$ .

Dowód

Pokazaliśmy, że $\mathrm{rank}\, M<n$ $\quad\Rightarrow\quad$ $\exists\; y\in{\mathbb{R}}^{n}$ , $y\not=0$ , t.ż.

$y^{T}e^{{-A\, t}}B\equiv 0$

$\quad\Rightarrow\quad$ $0\not\in\mathrm{Int}\,{\mathcal{C}}$ $\quad\Rightarrow\quad$ $\mathrm{rank}\, M<n$ . Zatem otrzymujemy (2.17).

∎

Definicja 2.10

Układ (LA) spełniający (2.17) nazywa się właściwy (proper).

(LA) jest właściwy wtedy i tylko wtedy, gdy

${\mathrm{rank}}\, M=n\,.$

W rozpatrywanym tutaj przypadku $\Omega=\,[-1,1]^{m}\,$ warunek ${\mathrm{rank}}\, M=n$ nie gwarantuje całkowitej sterowalności $\mathcal{C}=\mathbb{R}^{n}$ , jak pokazuje prosty przykład

Przykład 2.3 ([31], str. 33)

Niech $n=m=1$ . Rozważmy

$\dot{x}=x+u\,.$

Jeżeli $x_{0}>1$ (lub $x_{0}<-1$ ), to odpowiedź na dowolne sterowanie rośnie (maleje) wraz z $t$ , a więc żadne sterowanie nie jest pomyślne. Mamy $\mathcal{C}=\,]-1,1[\,\not=\mathbb{R}^{1}$ , choć $0\in\mathrm{Int}\,\mathcal{C}$ .

Jednakże przy dodatkowym warunku otrzymujemy:

Twierdzenie 2.5

Dla (LA) następujące dwa warunki są równoważne:

(a) $\;\mathrm{rank}\, M=n\;$ oraz $\;\Re\lambda\leq 0\;$ dla każdej wartości własnej $\lambda$ macierzy $A$
(b) $\;{\mathcal{C}}={\mathbb{R}}^{n}$ .

Dowód: [31], str. 34; [24], str. 37–38; oraz $\Rightarrow$ : [27], str. 112, [19], str. 22

$\quad$

1. Dowód ${(a)}$ $\;\Rightarrow\;$ ${(b)}$ . Załóżmy, że $\mathrm{rank}\, M=n$ oraz $\Re\lambda\leq 0$ dla każdej wartości własnej $\lambda$ macierzy $A$ . Gdyby istniał $y\in\mathbb{R}^{n}$ , t.ż. $y\not\in\mathcal{C}$ , to z wypukłości $\mathcal{C}$ (twierdzenie 2.2) oraz twierdzenia 2.3 wynikałoby, że $y$ mógłby być odseparowany od $\mathcal{C}$ hiperpłaszczyzną, tzn. istniałby $b\in\mathbb{R}^{n}$ , $b\not=0$ , t.ż.

$b^{T}x_{0}\leq\alpha\qquad\forall\; x_{0}\in\mathcal{C}\,,$

(2.18)

dla pewnego $\alpha\in\mathbb{R}^{1}$ .

Pokażemy, że dla każdego $\alpha\in\mathbb{R}^{1}$ oraz każdego $b\in\mathbb{R}^{n}$ , $b\not=0$ istnieje $t_{1}>0$ oraz $u\in\mathbb{U}_{m}[0,t_{1}]$ , t.ż.

$-\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}\, s>\alpha\,,$

(2.19)

co oznacza sprzeczność z (2.18), a zatem sprzeczność z założeniem istnienia $y\in\mathbb{R}^{n}$ , t.ż. $y\not\in\mathcal{C}$ , a więc dowodzi prawdziwości ${(a)}$ $\;\Rightarrow\;$ ${(b)}$ .

Niech

$v(s):=\Big(b^{T}e^{{-As}}B\Big)^{T}\in\mathbb{R}^{m}\,.$

Z założenia, że $\mathrm{rank}\, M=n$ oraz uwagi 2.3 wynika, że (LA) jest właściwy, czyli

$v\not\equiv 0\qquad\mathrm{na}\qquad[0,t_{1}]\,.$

(2.20)

Określmy sterowanie

$u(t)=\left\{\begin{array}[]{ccc}-\frac{v(t)}{|v(t)|}&\textrm{dla}&v(t)\not=0\\ 0&\textrm{dla}&v(t)=0\,.\end{array}\right.$

Wówczas mamy

$-\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}\, s=-\int\limits _{0}^{{t_{1}}}v^{T}(s)u(s)\,\mathrm{d}\, s=\int\limits _{0}^{{t_{1}}}|v(s)|\,\mathrm{d}s\,.$

Pokażemy, że

$\int\limits _{0}^{{\infty}}|v(s)|\,\mathrm{d}s=\infty\,,$

(2.21)

a zatem istnienie takiego $t_{1}$ , że (2.19) jest spełniona.

Załóżmy, że (2.21) nie jest spełniona, czyli

$\int\limits _{0}^{{\infty}}|v(s)|\,\mathrm{d}s<\infty\,.$

Wówczas $\phi(t):=\int\limits _{t}^{{\infty}}v(s)\,\mathrm{d}s$ spełnia

$\dot{\phi}(t)=-v(t)\,,\qquad\lim\limits _{{t\to\infty}}\phi(t)=0\,,\qquad\phi\not\equiv 0\,.$

(2.22)

Jeżeli $\mathcal{P}$ jest wielomianem charakterystycznym macierzy $A$ , to $\mathcal{P}(A)=0$ . Stąd

$\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)v(t)=\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)\Big(b^{T}e^{{-At}}B\Big)^{T}=\Big(b^{T}\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)e^{{-At}}B\Big)^{T}=\Big(b^{T}\mathcal{P}(A)e^{{-At}}B\Big)^{T}\equiv 0\,.$

Zatem funkcja $\phi=\phi(t)$ spełnia liniowy układ równań różniczkowych ze stałymi współczynnikami

$\frac{\mathrm{d}}{\mathrm{d}t}\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)\phi(t)=0\,.$

Rozwiązaniem tego równania jest pewna liniowa kombinacja wyrazów postaci

$\Bigg(P_{1}(t)\sin(\Im\gamma\, t)+P_{2}(t)\cos(\Im\gamma\, t)\Bigg)e^{{\Re\gamma\, t}}\,,$

gdzie $\gamma$ jest pierwiastkiem równania

$\gamma\mathcal{P}(-\gamma)=0.$

Zatem $\gamma=0$ , lub $-\gamma=\lambda$ , gdzie $\lambda$ jest wartością własną macierzy $A$ . Z założenia wynika, że

$\Re\gamma\geq 0$

co jest sprzeczne z (2.22). To kończy dowód implikacji ${(a)}$ $\;\Rightarrow\;$ ${(b)}$ .

2. Dowód ${(b)}$ $\;\Rightarrow\;$ ${(a)}$ . Pokażemy, że

$\mathrm{rank}\, M<n\,$ ,

lub

$\Re\lambda>0$ dla pewnej wartości własnej $\lambda$ macierzy $A$

implikuje $\mathcal{C}\not=\mathbb{R}^{n}$ .

Jeżeli $\mathrm{rank}\, M<n\,$ , to z wniosku 2.2 wynika, że $\mathcal{C}\not=\mathbb{R}^{n}$ .

Niech $\Re\lambda>0$ , dla pewnej wartości własnej $\lambda$ macierzy $A$ . Jeżeli $y\in\mathbb{C}^{n}$ jest (lewym) wektorem własnym (eigenvector), to

$y^{T}A=\lambda y^{T}\,.$

Stąd

$y^{T}A^{k}=\lambda^{k}y^{T}\qquad\forall\; k=1,2,\ldots\,,$

a zatem

$y^{T}e^{{-At}}=e^{{-\lambda t}}y^{T}\qquad t>0\,.$

Mamy

$y^{T}=y^{T}_{{\Re}}+iy^{T}_{{\Im}}\,,\quad y_{{\Re}},y_{{\Im}}\in\mathbb{R}^{n}\,,\quad y_{{\Re}}\not=0\,.$

Wówczas

$y^{T}_{{\Re}}e^{{-At}}=e^{{-\Re\lambda\, t}}\cos\Big(\Im\lambda\, t\Big)y^{T}_{{\Re}}-e^{{-\Re\lambda\, t}}\sin\Big(\Im\lambda\, t\Big)y^{T}_{{\Im}}\,.$

(2.23)

Mamy

$y^{T}_{{\Re}}x_{0}=-\int\limits _{0}^{{t_{1}}}y^{T}_{{\Re}}e^{{-As}}Bu(s)\,\mathrm{d}\, s\,.$

(2.24)

Z (2.23) wynika, że prawa strona (2.24) jest ograniczona jednostajnie względem $t_{1}>0$ . Zatem

$y^{T}_{{\Re}}x_{0}<\alpha\qquad\forall\; x_{0}\in\mathcal{C}\,,$

dla pewnego $\alpha\in\mathbb{R}^{1}$ . Czyli $\mathcal{C}$ leży po jednej stronie pewnej hiperpłaszczyzny, a więc $\mathcal{C}\not=\mathbb{R}^{n}$ . To kończy dowód ${(b)}$ $\;\Rightarrow\;$ ${(a)}$ .

∎

Ćwiczenie 2.1

Czy twierdzenie 2.5 jest prawdziwe dla klas ${{\mathcal{C}}}_{{PC}}$ , ${{\mathcal{C}}}_{{\varepsilon}}$ , ${{\mathcal{C}}}_{{BB}}$ oraz ${{\mathcal{C}}}_{{BBPC}}$ ? Dla ${{\mathcal{C}}}_{{BB}}$ można zastosować zasadę bang–bang — por. twierdzenie 5.1.

Z dowodu ${(b)}$ $\;\Rightarrow\;$ ${(a)}$ twierdzenia 2.5 wynika prawdziwość (por. [24], str. 38):

Wniosek 2.4

Jeżeli $\mathrm{rank}\, M=n$ oraz $\Re\lambda>0$ , dla pewnej wartości własnej $\lambda$ macierzy $A$ , to $\mathcal{C}\not=\mathbb{R}^{n}$ .

Przykład 2.4 (Wagon odrzutowy — patrz przykład 1.2)

$\left[\begin{array}[]{c}{\dot{x}}^{1}\\ {\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\ {x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&1\\ 0&0\\ \end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\ 1\end{array}\right]\,.$

Mamy

$M=\big[B,AB\big]=\left[\begin{array}[]{cc}0&1\\ 1&0\\ \end{array}\right]\,,$

$\mathrm{rank}\, M=2$ i układ jest właściwy. Jedyną (podwójną) wartością własną macierzy $A$ jest $0$ . Z twierdzenia 2.5 wynika, że ${\mathcal{C}}={\mathbb{R}}^{2}$ , czyli każdy stan początkowy może być doprowadzony do celu $0\in{\mathbb{R}}^{2}$ .

W przeciwieństwie do przypadku klasy sterowań $\mathbb{U}_{m}$ o wartościach w $\Omega=[-1,1]^{m}$ , rozważanego w twierdzeniu 2.5, w przypadku sterowań o wartościach w $\Omega={\mathbb{R}}^{m}$ okazuje się, że warunek $\mathrm{rank}\, M=n$ jest równoważny całkowitej sterowalności. W przypadku $\Omega={\mathbb{R}}^{m}$ klasę sterowań definiujemy jako

$\mathbb{U}_{m}^{{\infty}}=\bigcup\limits _{{t_{1}>0}}L^{{\infty}}\Big(0,t_{1};\mathbb{R}^{m}\Big)\,.$

Dla uproszczenia notacji odpowiedni zbiór sterowalny bedziemy oznaczali jako $\mathcal{C}$ , czyli tak samo, jak w przypadku $\Omega=[-1,1]^{m}$ (sens będzie wynikał z kontekstu).

Wówczas można sformułować następujące twierdzenie:

Twierdzenie 2.6

Dla (LA) i klasy sterowań ${\mathbb{U}}_{m}^{{\infty}}$ następujące dwa warunki są równoważne:

(a) $\;\mathrm{rank}\, M=n\,$ ,
(b) $\;{\mathcal{C}}={\mathbb{R}}^{n}$ .

Dowód: por. [14], str. 58; [27], str. 107.

$\quad$

1. Dowód ${(b)}$ $\;\Rightarrow\;$ ${(a)}$ , czyli $\sim{(a)}$ $\;\Rightarrow\;$ $\sim{(b)}$ jest identyczny jak punkt 1 dowodu twierdzenia 2.4.

2. Dowód ${(a)}$ $\;\Rightarrow\;$ ${(b)}$ . Załóżmy, że $\,\mathrm{rank}\, M=n\,$ . Z twierdzenia 2.4 wynika, że istnieje otwarta kula $\mathbb{B}=\mathbb{B}(0,\delta)$ o środku w $0\in\mathbb{R}^{n}$ i promieniu $\delta>0$ , t.ż. $\mathbb{B}\subset\mathcal{C}$ . Dla dowolnego $x_{0}\in\mathbb{R}^{n}$ istnieje stała $\eta\in\,]0,1]$ , t.ż.

$\eta x_{0}\in\mathbb{B}\,,$

czyli istnieje $t_{1}>0$ oraz $u\in\mathbb{U}_{m}[0,t_{1}]$ , t.ż.

$\eta x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}Bu(s)\,\mathrm{d}\, s\,.$

Stąd

$x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}B\bar{u}(s)\,\mathrm{d}\, s\,,$

gdzie $\bar{u}=\frac{u}{\eta}\in\mathbb{U}_{m}^{{\infty}}$ , co kończy dowód.

∎

Okazuje się (por. [31], str. 37), że dla klasy sterowań $\mathbb{U}_{m}$ ,,prawie wszystkie” układy (LA) są lokalnie sterowalne (tzn. spełniają $0\in{\mathcal{C}}$ ), a dla klasy sterowań ${\mathbb{U}}_{m}^{{\infty}}$ ,,prawie wszystkie” układy (LA) są całkowicie sterowalne (tzn. spełniają ${\mathcal{C}}={\mathbb{R}}^{n}$ ).

Odległość między dwoma układami (LA): ( $A_{1},B_{1}$ ) i ( $A_{2},B_{2}$ ), czyli $\dot{x}=A_{1}x+B_{1}u\;$ i $\;\dot{x}=A_{2}x+B_{2}u$ , odpowiednio, określamy jako

$d\Big((A_{1},B_{1}),(A_{2},B_{2})\Big)=|A_{1}-A_{2}|+|B_{1}-B_{2}|\,,$

gdzie $|A|=\sum\limits _{{i,j=1}}^{n}|a^{{ij}}|$ i analogicznie $|B|$ .

Zatem dwa układy są bliskie, jeżeli elementy odpowiednich macierzy są bliskie.

Twierdzenie 2.7

Zbiór wszystkich sterowalnych (LA) jest otwarty i gęsty w przestrzeni metrycznej wszystkich (LA), gdzie ,,sterowalność” rozumiemy w sensie

całkowitej sterowalności dla $\Omega=\mathbb{R}^{m}$ ,
lokalnej sterowalności dla $\Omega=[-1,1]^{m}$ .

Dowód: [31], str. 37.

$\quad$

Z twierdzenia 2.4, lub twierdzenia 2.6, w obu rozważanych przypadkach, sterowalność jest równoważna warunkowi $\;\mathrm{rank}\, M=n\,$ . Ten warunek oznacza, że istnieje ( $n\times n$ )–macierz $N$ , będąca podmacierzą $M$ , t.ż. $\mathrm{det}N\not=0$ .

Jeżeli układ ( $\tilde{A},\tilde{B}$ ) jest bliski ( $A,B$ ), to odpowiednia $n\times n$ podmacierz $\tilde{N}$ macierzy $\tilde{M}$ jest bliska odpowiedniej podmacierzy $N$ macierzy $M$ . Jeżeli $\det N\not=0$ , to $\det\tilde{N}\not=0$ dla $|N-{\tilde{N}}|$ — małego. Zatem układy sterowalne są zbiorem otwartym.

Załóżmy, że $\dot{x}=A_{0}x+B_{0}u$ nie jest sterowalny, tzn. $\;\mathrm{rank}\, M_{0}<n\,$ , gdzie ${M}_{0}=[{B}_{0},\ldots,{A}_{0}^{{n-1}}{B}_{0}]$ . Chcemy pokazać istnienie układu ( $\tilde{A},\tilde{B}$ ) — bliskiego układowi ( ${A}_{0},{B}_{0}$ ) — t.ż. $\det\tilde{N}\not=0$ , dla pewnej $n\times n$ podmacierzy $\tilde{N}$ macierzy $\tilde{M}=[\tilde{B},\ldots,\tilde{A}^{{n-1}}\tilde{B}]$ .

$\det\tilde{N}$ może być traktowany jako wielomian $\mathcal{P}(y^{1},\ldots,y^{k})\,$ elementów macierzy $\tilde{A}$ i $\tilde{B}$ , gdzie $\, k=n^{2}+nm$ . Mamy

$\mathcal{P}(y_{0}^{1},\ldots,y_{0}^{k})=0$

dla $y_{0}^{1},\ldots,y_{0}^{k}$ – elementów macierzy $A_{0}$ , $B_{0}$ .

Wystarczy pokazać, że: dla niezerowego wielomianu $\mathcal{P}=\mathcal{P}(y^{1},\ldots,y^{k})$ , t.ż. $\mathcal{P}(y^{1}_{0},\ldots,y^{k}_{0})=0$ , istnieje $y_{1}\in\mathbb{R}^{k}$ — dowolnie bliskie $y_{0}$ , t.ż.

$\mathcal{P}(y_{1}^{1},\ldots,y_{1}^{k})\not=0\,.$

Powyższe zdanie wynika z faktu, że niezerowy wielomian $k$ zmiennych nie może znikać w żadnej $k$ –wymiarowej kuli: gdyby znikał, to biorąc pochodne cząstkowe pokazalibyśmy, że wszystkie współczynniki się zerują.

∎

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Teoria sterowania

2. Sterowalność

Definicja 2.1

Definicja 2.2

Założenie 2.1

Definicja 2.3

Problem 2.1

Problem 2.2

Definicja 2.4

Definicja 2.5

Problem 2.3

Założenie 2.2

Problem 2.4

Lemat 2.1

Dowód

Definicja 2.6

Twierdzenie 2.1

Dowód: [31] — str. 26–27, [24] — str. 31–32.

Uwaga 2.1

Uwaga 2.2

Definicja 2.7

Twierdzenie 2.2

Dowód: [19] — str. 17, [31] — str. 29, [24] — str. 33.

Przykład 2.1 ([19], str. 18)

Przykład 2.2 ([31], str. 30; [24], str. 34)

Definicja 2.8

Definicja 2.9

Twierdzenie 2.3 (Twierdzenie o hiperpłaszczyźnie podpierającej)

Twierdzenie 2.4

Dowód: [19], str. 18, [31], str. 31, [24], str. 35, [27], str. 108

Lemat 2.2 (Nierówność całkowa)

Dowód: [31], str. 32; [19], str. 21

Wniosek 2.1

Wniosek 2.2

Wniosek 2.3

Dowód

Definicja 2.10

Przykład 2.3 ([31], str. 33)

Twierdzenie 2.5

Dowód: [31], str. 34; [24], str. 37–38; oraz : [27], str. 112, [19], str. 22

Ćwiczenie 2.1

Wniosek 2.4

Przykład 2.4 (Wagon odrzutowy — patrz przykład 1.2)

Twierdzenie 2.6

Dowód: por. [14], str. 58; [27], str. 107.

Twierdzenie 2.7

Dowód: [31], str. 37.

Dowód: [31], str. 34; [24], str. 37–38; oraz $\Rightarrow$ : [27], str. 112, [19], str. 22