2. Sterowalność

Współrzędne wektora x\in{{\mathbb{R}}}^{n} oznaczamy x^{1}, x^{2}, \ldots, x^{n}, n=1,2,\ldots:

x=\left[\begin{array}[]{c}x^{1}\\
.\\
.\\
.\\
x^{n}\end{array}\right]\,.

Dla odróżnienia naturalne potęgi \phi oznaczamy jako \big(\phi\big)^{p}, p=1,2,\ldots\,.

Dla uproszczenia notacji element zerowy w każdej {{\mathbb{R}}}^{n}, dla n=1,2,\ldots, oznaczamy przez 0.

Definicja 2.1

Niech \Omega\subset{{\mathbb{R}}}^{m}, m=1,2,\ldots będzie zadanym zbiorem. Zbiór ten będziemy nazywali zbiorem parametrów sterujących.

Przez większą część wykładu, będziemy przyjmować, że \Omega=[-1,1]^{m}, choć omówimy kilkakrotnie sytuacje \Omega={{\mathbb{R}}}^{m}. Jeżeli nie będzie podane inaczej, będziemy zakładali, że \Omega=[-1,1]^{m}. Niech

{{\mathbb{U}}}_{m}[0,{t_{1}}]=\Big\{\, u\,:\, u(t)\in\Omega\quad{\mathrm{oraz}}\quad u\quad{\mathrm{mierzalna}}\;{\mathrm{na}}\quad[0,{t_{1}}]\,\Big\}
{{\mathbb{U}}}_{m}=\bigcup\limits _{{{t_{1}}>0}}\;{{\mathbb{U}}}_{m}[0,{t_{1}}]

Każdy element u\in{{\mathbb{U}}}_{m} będziemy nazywali sterowaniem (control) (lub strategią). Dla każdego sterowania u istnieje odpowiedni odcinek [0,{t_{1}}(u)], na którym jest określone.

Definicja 2.2

Dla każdego t\geq 0 określamy rodzinę zbiorów celu (target sets) {{\mathcal{T}}}(t)\subset{{\mathbb{R}}}^{n}, gdzie {{\mathcal{T}}}(t) jest zbiorem domkniętym w {\mathbb{R}}^{n}.

Jeżeli nie będzie podane inaczej, to {{\mathcal{T}}}(t)=0\in{{\mathbb{R}}}^{n}, tak jak w przykładach 1.2 i 1.3.

Rozpatrujemy zagadnienie początkowe dla równania różniczkowego zwyczajnego

{\dot{x}}(t)=f(t,x(t),u(t))\,,\qquad x(0)=x_{0}\,, (2.1)

gdzie x_{0}\in{{\mathbb{R}}}^{n}, x:\,[0,{t_{1}}]\,\to{{\mathbb{R}}}^{n} oraz u=u(t), u\in{{\mathbb{U}}}_{m}[0,t_{1}], jest poszukiwanym sterowaniem.

Powyższe zagadnienie dotyczy sterowania w pętli otwartej (control in open–loop form), u=u(t). Można też rozpatrywać sterowanie w zamkniętej pętli (control in closed–loop form), gdy poszukuje się odwzorowania (zwanego sprzężeniem zwrotnym (feedback) \alpha\,:\;{{\mathbb{R}}}^{n}\,\to\,{{\mathbb{U}}}_{m} dla RRZ

{\dot{x}}(t)=f\big(t,x(t),\alpha(x(t))\big)\,,\qquad x(0)=x_{0}\,. (2.2)

Sprowadzenie u=u(t) do u=\alpha(x(t)) nazywa się zagadnieniem syntezy (synthesis) sterowania.

Możliwe jest podejście alternatywne w języku inkluzji różniczkowej (differential inclusion)

{\dot{x}}\in F(t,x) (2.3)

gdzie

F(t,x)=\Big\{ y\,:\, y=f(t,x,u)\,,\quad\mathrm{dla}\;\mathrm{pewnego}\; u\in\Omega\Big\}\,.
Założenie 2.1

Funkcja

f\,:\;[0,\infty[\,\times{\mathbb{R}}^{n}\times\Omega\to{\mathbb{R}}^{n}

jest ciągła wraz z pochodnymi cząstkowymi \frac{\partial f^{i}}{\partial x^{j}}, \frac{\partial f^{i}}{\partial u^{k}} dla i,j=1,\ldots,n, k=1,2,\ldots,m na zbiorze [0,\infty[\,\times{{\mathbb{R}}}^{n}\times\Omega.

Założenie 2.1 gwarantuje lokalne istnienie i jednoznaczność rozwiązania dla u\in{{\mathbb{U}}}_{m} — tw. Picarda–Lindelöfa — por. [14, 17, 23]. Ponieważ jednak funkcja u jest jedynie funkcją mierzalną i ograniczoną, więc prawa strona RRZ (2.1) jest tylko mierzalna i ograniczona jako funkcja t dla każdego x. Zatem rozwiązanie rozumiane jest jako absolutnie ciągła funkcja spełniająca RRZ (2.1) prawie wszędzie — por. [14, 17, 23].

Założenie 2.1 jest mocniejsze, niż jest to jest potrzebne w niektórych wynikach. Do istnienia i jednoznaczności wystarczy Lipschitz–owskość, ciągłość też można osłabić.

Definicja 2.3

Dla zadanego sterowania u\in{{\mathbb{U}}}_{m} rozwiązanie RRZ (2.1) nazywa się odpowiedzią na (response to) u — oznaczamy x(t)=x(t,x_{0},{u(\,.\,)}).

Problem 2.1

Zagadnienie sterowania (control problem): dla zadanego x_{0} znaleźć {t_{1}}>0 oraz u\in{{\mathbb{U}}}_{m}\,[\, 0,t_{1}\,]\,, t.ż. odpowiednia odpowiedź x({t_{1}})\in{{\mathcal{T}}}({t_{1}}).

Jeżeli takie u da się znaleźć, to mówimy, że sterowanie u prowadzi x_{0} do celu {{\mathcal{T}}}({t_{1}}) (control u steers x_{0} to the target {{\mathcal{T}}}({t_{1}})), lub że u jest sterowaniem pomyślnym (successful control).

Problem 2.2

Zagadnienie sterowalności (controllability problem): określić dane początkowe, które można doprowadzić do celu (tzn. dane początkowe, które są sterowalne (controllable)), czyli określić te dane początkowe, dla których istnieje pomyślne sterowanie u\in{{\mathbb{U}}}_{m}.

Definicja 2.4

Zbiór sterowalny (controllable set) {\mathcal{C}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}}), gdzie

{\mathcal{C}}({t_{1}})=\Big\{ x_{0}\in{\mathbb{R}}^{n}\,:\;{\mathrm{istnieje}}\; u\in{\mathbb{U}}_{m}\,,\quad\mathrm{t.{\dot{z}}.}\quad x({t_{1}},x_{0},{u(\,.\,)})\in{\mathcal{T}}({t_{1}})\Big\}\,, (2.4)

{\mathcal{C}}({t_{1}}) jest zbiorem tych stanów, które mogą być doprowadzone do celu w chwili {t_{1}}.

Będziemy badali zbiór {\mathcal{C}}, oraz określimy jak zmienia się {\mathcal{C}} wraz z zawężeniem klasy sterowań.

Definicja 2.5

Jeżeli {\mathcal{C}}={\mathbb{R}}^{n}, to sterowalność jest całkowita (completely controllable). Natomiast przypadek 0\in\,\mathrm{Int}\,{\mathcal{C}} nazywamy sterowalnością lokalną (locally controllable).

Można rozważać węższe klasy sterowań (por. [31]):

  • Klasa sterowań kawałkami stałych (piecewise constant controls) {{\mathbb{U}}}_{{PC}}:

    u\in{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}], jeżeli u jest kawałkami stała na [0,{{t_{1}}}], czyli istnieją 0=s_{0}<s_{1}<\ldots<s_{l}={{t_{1}}}, t. ż, u jest stała na każdym przedziale [s_{{k-1}},s_{k}\,[\,;

    {{\mathbb{U}}}_{{PC}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}]\,.
  • Klasa sterowań gładkich i niezmieniających się nagle (smooth controls that do not change rapidly) {{\mathbb{U}}}_{{\varepsilon}}:

    u\in{{\mathbb{U}}}_{{\varepsilon}}[0,{{t_{1}}}], jeżeli u jest absolutnie ciągła na [0,{{t_{1}}}], u(0)=u(1) oraz |{\dot{u}}(t)|\leq\varepsilon p.w. na [0,{{t_{1}}}]\,;

    {{\mathbb{U}}}_{{\varepsilon}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{\varepsilon}}[0,{{t_{1}}}]\,.
  • Klasa sterowań ,,bang–bang” (bang–bang controls) {{\mathbb{U}}}_{{BB}}:

    u\in{{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}], jeżeli |u^{j}(t)|=1 dla p.k. t\in[0,{t_{1}}]\, oraz każdego j=1,\,\ldots\,,m;

    {{\mathbb{U}}}_{{BB}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}]\,.
  • Klasa sterowań bang–bang kawałkami stałych{{\mathbb{U}}}_{{BBPC}}:

    {{\mathbb{U}}}_{{BBPC}}[0,{{t_{1}}}]={{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}]\bigcap{{\mathbb{U}}}_{{PC}}[0,{{t_{1}}}]\,;
    {{\mathbb{U}}}_{{BBPC}}=\bigcup\limits _{{{{t_{1}}}>0}}\;{{\mathbb{U}}}_{{BBPC}}[0,{{t_{1}}}]\,.

Analogicznie do {\mathcal{C}} określamy zbiory sterowalne {{\mathcal{C}}}_{{PC}}, {{\mathcal{C}}}_{{\varepsilon}}, {{\mathcal{C}}}_{{BB}}, {{\mathcal{C}}}_{{BBPC}} w odniesieniu do odpowiednich klas sterowań.

Problem 2.3

Rozpatrywać będziemy ogólne autonomiczne (autonomous) zagadnienie nieliniowe (NLA)

{\dot{x}}=f(x,u)\,,\qquad x(t)\in{\mathbb{R}}^{n}\,,\qquad u\in{\mathbb{U}}_{m}\,, (2.5)

z warunkiem początkowym

x\Big|_{{t=0}}=x_{0}\in{\mathbb{R}}^{n}\,,

i celem {\mathcal{T}}(t)\equiv 0.

Założenie 2.2

Zakładamy, że funkcja f\,:\;{\mathbb{R}}^{n}\times\Omega\to{\mathbb{R}}^{n} jest klasy C^{1} na {\mathbb{R}}^{n}\times\Omega oraz f(0,0)=0.

Stąd dla zadanego warunku początkowego x_{0} odpowiedź x(t)=x(t;x_{0},{u(\,.\,)}) istnieje (przynajmniej) lokalnie w czasie i jest jednoznaczna.

Będziemy również rozpatrywać zagadnienie liniowe (LA)

Problem 2.4
{\dot{x}}=Ax+Bu\,,\qquad x(t)\in{\mathbb{R}}^{n}\,,\qquad u\in{\mathbb{U}}_{m}\,, (2.6)

gdzie A i B są stałymi macierzami, n\times n i n\times m, odpowiednio,

z warunkiem początkowym

x\Big|_{{t=0}}=x_{0}\in{\mathbb{R}}^{n}\,,

i celem {\mathcal{T}}(t)\equiv 0.

Macierz B ma więc postać:

B=\left[\begin{array}[]{ccc}b_{{11}}&\ldots&b_{{1m}}\\
.&.&.\\
.&.&.\\
.&.&.\\
b_{{n1}}&\ldots&b_{{nm}}\end{array}\right]\,.
Lemat 2.1

Dla (NLA):

  1. Jeżeliu=u(t) prowadzi x_{0} do 0 na [0,{t_{1}}] z odpowiedzią x=x(t) (tzn. x(t_{1})=0), to \bar{u}(t)=u(t-t_{0}) prowadzi x_{0} do 0 na [t_{0},t_{0}+{t_{1}}] z odpowiedzią \bar{x}(t)=x(t-t_{0}).

  2. Jeżelix=x(t) jest odpowiedzią na u\in{\mathbb{U}}_{m}[0,{t_{1}}] prowadzącą x(0)=x_{0} do x({t_{1}})=x_{1}, to z(t)=x({t_{1}}-t) jest odpowiedzią na \bar{u}(t)=u({t_{1}}-t) dla równania (z odwróconym czasem)

    \dot{z}=-f(z(t),\bar{u}(t))\,, (2.7)

    prowadzącą z(0)=x_{1} do z({t_{1}})=x_{0}.

Dowód

\quad

1. Mamy

\dot{\bar{x}}=\dot{x}(t-t_{0})=f({x}(t-t_{0}),u(t-t_{0}))=f(\bar{x}(t),\bar{u}(t))

dla p.w. t\in[t_{0},t_{0}+{t_{1}}]. Ponadto

\bar{x}(t_{0})=x(0)=x_{0}\,,\qquad\bar{x}(t_{0}+{t_{1}})=x({t_{1}})=0\,.

2. Mamy

\dot{z}(t)=\frac{\mathrm{d}}{\mathrm{d}t}{x}({t_{1}}-t)=-f({x}({t_{1}}-t),u({t_{1}}-t))=-f(z(t),\bar{u}(t))

dla p.w. t\in[0,{t_{1}}]. Ponadto

z(0)=x({t_{1}})=x_{1}\,,\qquad z({t_{1}})=x(0)=x_{0}\,.

Zagadnienie (NLA) jest autonomiczne w tym sensie, że punkt 1 lematu 2.1 jest spełniony.

Definicja 2.6

Zbiór jest łukowo spójny (arcwise connected), jeżeli każde dwa punkty zbioru mogą być połączone łukiem (homeomorficznym obrazem odcinka) całkowicie zawartym w zbiorze.

Twierdzenie 2.1

Dla (NLA):

  1. jeżeli x_{0}\in{\mathcal{C}} oraz y jest punktem trajektorii łączącej x_{0} z celem 0, to y\in{\mathcal{C}};

  2. zbiór {\mathcal{C}} jest łukowo spójny;

  3. jeżeli 0\leq\tau _{1}<\tau _{2}, to {\mathcal{C}}(\tau _{1})\subset{\mathcal{C}}(\tau _{2});

  4. {\mathcal{C}} jest otwarty wtedy i tylko wtedy, gdy 0\in\,\mathrm{Int}\,{\mathcal{C}}.

Dowód: [31] — str. 26–27, [24] — str. 31–32.

\quad

1. Niech x_{0}\in{\mathcal{C}}. Istnieje wówczas pomyślne sterowanie u_{1}\in{\mathbb{U}}_{m} oraz odpowiedź x(t)=x(t;x_{0},u_{1}(\,.\,)), t.ż. x({t_{1}})=0 dla pewnego {t_{1}}>0. Dla \bar{t}\in[0,{t_{1}}] chcemy pokazać, że y:=x(\bar{t})\in{\mathcal{C}}. Sterowanie u_{2}(t):=u(t+\bar{t}), określone na t\in[0,{t_{1}}-\bar{t}] jest pomyślne z odpowiedzią x_{2}(t):=x(t+\bar{t}):

\dot{x}_{2}(t)=f(x_{2}(t),u_{2}(t))\,,\qquad x_{2}(0)=x(\bar{t})=y\,,\qquad x_{1}({t_{1}}-\bar{t})=0\,,

a zatem y\in{\mathcal{C}}({t_{1}}-\bar{t}).

2. Jeżeli \bar{x}_{0}, \hat{x}_{0} są w {\mathcal{C}}, to istnieją sterowania \bar{u} i \hat{u} oraz odpowiedzi \bar{x}(t)=x(t;\bar{x}_{0},\bar{u}(\,.\,)), \hat{x}(t)=x(t;\hat{x}_{0},\hat{u}(\,.\,)), t.ż.

\bar{x}(\bar{t})=0=\hat{x}(\hat{t})\qquad\mathrm{dla}\;\mathrm{pewnych}\quad\bar{t}>0\,,\quad\hat{t}>0\,.

Z 1. każdy punkt obu trajektorii jest w {\mathcal{C}}. Zatem istnieje łuk całkowicie zawarty w {\mathcal{C}} łączący punkty \bar{x}_{0}, \tilde{x}_{0}.

3. Niech x_{0}\in{\mathcal{C}}(\tau _{1}). Zatem istnieje sterowanie u\in{\mathbb{U}}_{m}, t.ż. x(\tau _{1})=0 dla odpowiedzi x(t)=x(t;x_{0},{u(\,.\,)}). Dla \tau _{2}>\tau _{1} określmy sterowanie

u_{2}\in{\mathbb{U}}_{m}\;:\qquad u_{2}(t)=\left\{\begin{array}[]{ccc}u(t)&\textrm{dla}&t\in[\, 0,\tau _{1}\,]\\
0&\textrm{dla}&t\in]\,\tau _{1},\tau _{2}\,]\end{array}\right.\,.

Z warunku f(0,0)=0 wynika, że odpowiedż x_{2}(t)=x(t;x_{0},u_{2}(\,.\,)) spełnia

x_{2}(t)=0\,,\qquad t\in[\tau _{1},\tau _{2}]\,,

a zatem u_{2} prowadzi x_{0} do celu 0 w czasie \tau _{2}, czyli x_{0}\in{\mathcal{C}}(\tau _{2}).

4. Implikacja ,,\Rightarrow” jest oczywista, gdyż 0\in{\mathcal{C}}.

Pokażemy implikację ,,\Leftarrow”. Jeżeli 0\in\,\mathrm{Int}\,{\mathcal{C}}, to istnieje otwarta kula \mathbb{B}_{0}=\mathbb{B}(0,\delta _{0}) o środku w 0 i promieniu \delta _{0}>0, t.ż. \mathbb{B}_{0}\subset{\mathcal{C}}. Niech x_{1}\in{\mathcal{C}}. Chcemy pokazać, że istnieje otwarta kula o środku w x_{1} całkowicie zawarta w {\mathcal{C}}. Ponieważ x_{1}\in{\mathcal{C}}, więc istnieje sterowanie u_{1}\in{\mathbb{U}}_{m} oraz odpowiedź x(t)=x(t;x_{1},u_{1}(\,.\,)), t.ż. x({t_{1}})=0 dla pewnego {t_{1}}>0. Funkcja f jest klasy C^{1}, więc z ciągłej zależności od danych początkowych wynika istnienie otwartej kuli \mathbb{B}_{1}=\mathbb{B}(x_{1},\delta _{1}), \delta _{1}>0, t.ż. dla każdego y\in{\mathbb{B}}_{1}:

x_{2}:=x({t_{1}};y,u_{1}(\,.\,))\in\mathbb{B}_{0}\;\Big(\subset{\mathcal{C}}\Big)\,.

Istnieje więc sterowanie u_{2}\in{\mathbb{U}}_{m}, które prowadzi x_{2} do 0 w czasie t_{2}>0.

Zatem dla każdego y\in{\mathbb{B}}_{1} istnieje sterowanie u\in{\mathbb{U}}_{m},

u(t)=\left\{\begin{array}[]{ccc}u_{1}(t)&\textrm{dla}&t\in[\, 0,{t_{1}}\,]\\
u_{2}(t-{t_{1}})&\textrm{dla}&t\in]\,{t_{1}},{t_{1}}+t_{2}\,]\end{array}\right.\,, (2.8)

które prowadzi y do 0. Zatem \mathbb{B}_{1}\subset{\mathcal{C}}.

Uwaga 2.1

Można pokazać, że są prawdziwe twierdzenia analogiczne do twierdzenia 2.1 dla klas {{\mathcal{C}}}_{{PC}} oraz {{\mathcal{C}}}_{{\varepsilon}}. Dla {{\mathcal{C}}}_{{BB}} oraz {{\mathcal{C}}}_{{BBPC}} punkty 1, 2 i 4 wynikają bezpośrednio. Natomiast punkt 3 dla {{\mathcal{C}}}_{{BB}} wynika z zasady bang–bang — por. twierdzenie 5.1.

Uwaga 2.2

Argumentu w dowodzie ,,\Leftarrow” punktu 4 twierdzenia 2.1 nie można przenieść na {\mathcal{C}}({t_{1}}) dla {t_{1}}>0, gdyż sterowanie (2.8) określone jest na t_{1}+t_{2}. Najczęściej brzeg zbioru {\mathcal{C}}({t_{1}}) należy do tego zbioru, więc {\mathcal{C}}({t_{1}}) nie jest otwarty.

Rozważymy teraz zagadnienie liniowe (LA). Rozwiązanie (LA) ma postać

x(t)=x\big(t;x_{0},{u(\,.\,)}\big)=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu(s)\,{\mathrm{d}}s\,. (2.9)

Mamy:

x_{0}\in{\mathcal{C}}({t_{1}})\quad\Leftrightarrow\quad\exists\; u\in{\mathbb{U}}_{m}[0,{t_{1}}]\;:\quad x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}Bu(s)\,{\mathrm{d}}s\,, (2.10)
Definicja 2.7

Zbiór \mathbb{S} jest symetryczny (symmetric), gdy x\in\mathbb{S} \,\Leftrightarrow\, -x\in\mathbb{S}.

Twierdzenie 2.2

Dla (LA): {\mathcal{C}}\subset{\mathbb{R}}^{n} jest symetryczny oraz wypukły.

Dowód: [19] — str. 17, [31] — str. 29, [24] — str. 33.

\quad

Mamy (2.10). Jeżeli x_{0}\in{\mathcal{C}}({t_{1}}) dla u\in{\mathbb{U}}_{m}[0,{t_{1}}], to -x_{0}\in{\mathcal{C}}({t_{1}}) dla -u\in{\mathbb{U}}_{m}[0,{t_{1}}]. Zatem {\mathcal{C}}=\bigcup _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}}) jest symetryczny.

Jeżeli x_{0}\in{\mathcal{C}}({t_{1}}) ze sterowaniem u_{0} i x_{*}\in{\mathcal{C}}({t_{1}}) ze sterowaniem u_{1}, to \alpha x_{0}+(1-\alpha)x_{*}\in{\mathcal{C}}({t_{1}}) ze sterowaniem \alpha u_{0}+(1-\alpha)u_{*}. Zatem {\mathcal{C}}({t_{1}}) jest wypukły. Nie wynika z tego od razu, że {\mathcal{C}}=\bigcup _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}}) jest wypukły (suma zbiorów wypukłych nie musi być wypukła). Jednakże stosując argument z dowodu punktu 3 twierdzenia 2.1 pokazujemy, że \mathcal{C} jest wypukły.

Twierdzenie 2.2 można uogólnić na sytuację, gdy A=A(t), B=B(t) są ciągłymi funkcjami. W dowodzie korzysta się z następujących własności klasy sterowań: symetryczności, wypukłości i możliwości przyjmowania wartości 0. Twierdzenie 2.2 zachodzi więc dla klas {\mathbb{U}}_{{PC}} i {\mathbb{U}}_{{\varepsilon}}, ale nie zachodzi dla {\mathbb{U}}_{{BB}} i {\mathbb{U}}_{{BBPC}}, które nie są wypukłe i nie zawierają 0. W rozdziale 5 (twierdzenie 5.1) pokażemy jednak zasadę ,,bang–bang” dla (LA): {\mathcal{C}}_{{BB}}({t_{1}})={\mathcal{C}}({t_{1}}). Z zasady ,,bang–bang” wynika, że

{\mathcal{C}}_{{BB}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}_{{BB}}({t_{1}})=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}})={\mathcal{C}}\,,

a zatem z wypukłości {\mathcal{C}} wynika wypukłość {\mathcal{C}}_{{BB}}.

Następujące przykłady pokazują, że {\mathcal{C}} może nie zawierać pewnego otoczenia celu, czyli, że nie jest spełniona nawet lokalna sterowalność.

Przykład 2.1 ([19], str. 18)

Niech n=2, m=1,

\begin{array}[]{lll}\dot{x}^{1}&=&0\,,\\
\dot{x}^{2}&=&u\,.\end{array} (2.11)

Zatem

A=\left[\begin{array}[]{cc}0&0\\
0&0\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\
1\end{array}\right]\,.

Rozwiązanie spełniające x(0)=x_{0} ma postać

\begin{array}[]{lll}x^{1}(t)&=&x^{1}_{0}\\
x^{2}(t)&=&x^{2}_{0}+\int\limits _{0}^{t}u(s)\,\mathrm{d}s\end{array}\,. (2.12)

Stąd

{\mathcal{C}}=\Bigg\{\left[\begin{array}[]{c}x^{1}\\
x^{2}\end{array}\right]\,:\quad x^{1}=0\,,\quad x^{2}\in\mathbb{R}^{1}\Bigg\}\,,

czyli \mathcal{C} jest osią x^{2}.

Przykład 2.2 ([31], str. 30; [24], str. 34)

Niech n=2, m=1,

\begin{array}[]{lll}\dot{x}^{1}&=&x^{1}+u\,,\\
\dot{x}^{2}&=&x^{2}+u\,.\end{array} (2.13)

Zatem

A=\left[\begin{array}[]{cc}1&0\\
0&1\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}1\\
1\end{array}\right]\,.

Rozwiązanie spełniające x(0)=x_{0} ma postać

\left[\begin{array}[]{c}x^{1}(t)\\
x^{2}(t)\end{array}\right]=e^{t}\left[\begin{array}[]{c}x_{0}^{1}\\
x_{0}^{2}\end{array}\right]+\Big(e^{t}\int\limits _{0}^{t}e^{{-s}}u(s)\,{\mathrm{d}}s\Big)\left[\begin{array}[]{c}1\\
1\end{array}\right]\,. (2.14)

Jeżeli x^{1}({t_{1}})=x^{2}({t_{1}})=0, to

x_{0}^{1}=x_{0}^{2}=-\int\limits _{0}^{{{t_{1}}}}e^{{-s}}u(s)\,{\mathrm{d}}s

oraz

-\big(1-e^{{-{t_{1}}}}\big)\leq-x_{0}^{1}=-x_{0}^{2}\leq 1-e^{{-{t_{1}}}}\,,

bo u(s)\in\,[\,-1,1\,]\,.

Stąd

{\mathcal{C}}=\Bigg\{\left[\begin{array}[]{c}x^{1}\\
x^{2}\end{array}\right]\,:\quad x^{1}=x^{2}\,,\quad|x^{1}|<1\,,\quad|x^{2}|<1\Bigg\}\,.

Przykłady 2.1 i 2.2 pokazują, że potrzebne są pewne warunki na macierze A i B. Warunki te zostaną wyrażone przez macierz sterowalności.

Definicja 2.8

Dla (LA) wprowadzamy macierz sterowalności (controllability matrix):

M=\underbrace{\Big[\, B,AB,A^{2}B,\ldots,A^{{n-1}}B\,\Big]}_{{\mathrm{macierz}\; n\times nm}}

W dowodzie odpowiedniego twierdzenia (tw. 2.4) korzysta się z pojęcia hiperpłaszczyzny:

Definicja 2.9

(n-1)–wymiarową hiperpłaszczyzną (hyperplane) w {\mathbb{R}}^{n} nazywamy zbiór

{\mathbb{H}}=\Big\{ x\in{{\mathbb{R}}}^{n}\,:\; a^{T}x=\alpha\,\Big\}\,,

gdzie a\in{\mathbb{R}}^{n}, a^{T} oraz \alpha\in{\mathbb{R}}^{1} są zadane, a^{T}x oznacza iloczyn skalarny wektorów a i x.

Istotną rolę odgrywa tu wniosek z twierdzenia Mazura (geometrycznej wersji twierdzenia Hahna-Banacha) - twierdzenie o hiperpłaszczyźnie podpierającej — por. [30], str. 190.

Twierdzenie 2.3 (Twierdzenie o hiperpłaszczyźnie podpierającej)

Jeżeli y\not\in\,\mathrm{Int}\,\mathbb{K}, gdzie \mathbb{K} jest wypukłym zbiorem, t.ż. \mathrm{Int}\,\mathbb{K}\,\not=\emptyset, to istnieje hiperpłaszczyzna podpierająca \mathbb{H} w y (supporting hyperplane \mathbb{H} through y), tzn. \mathbb{K} leży po jednej stronie \mathbb{H}:

a^{T}y=\alpha\,,\qquad\quad a^{T}x\leq\alpha\quad\forall\; x\in\mathbb{K}\,, (2.15)

dla pewnego \alpha\in{\mathbb{R}}^{1}.

\clubsuit

Twierdzenie 2.4

Dla (LA): Następujące trzy warunki są równoważne

  • (a) \;\mathrm{rank}\, M=n

  • (b) \; 0\in{\mathrm{Int}}\,{\mathcal{C}}\; (lokalna sterowalność)

  • (c) \;{\mathcal{C}} — otwarty w {\mathbb{R}}^{n}

Dowód: [19], str. 18, [31], str. 31, [24], str. 35, [27], str. 108

\quad

Zauważmy, że równoważność {(b)} \,\Leftrightarrow\, {(c)} wynika z twierdzenia 2.1.

1. Dowód {(b)} \;\Rightarrow\; {(a)}, czyli \sim{(a)} \;\Rightarrow\; \sim{(b)}. Załóżmy więc \sim{(a)}, czyli \mathrm{rank}\, M<n.

Wówczas istnieje wektor y\in\mathbb{R}^{n}, y\not=0, prostopadły do każdej kolumny macierzy M, czyli

y^{T}M=0\;\Bigg(\in\mathbb{R}^{{nm}}\Bigg)\,.

Stąd

y^{T}B=y^{T}AB=\ldots=y^{T}A^{{n-1}}B=0\;\Bigg(\in\mathbb{R}^{{m}}\Bigg)\,.

Niech \mathcal{P} będzie wielomianem charakterystycznym macierzy A

\mathcal{P}(\lambda)=\det(\lambda I-A)\,,

gdzie I jest macierzą jednostkową n\times n.

Mamy (twierdzenie Cayleya–Hamiltona)

\mathcal{P}(A)=0\,.

Stąd

A^{n}=\beta _{{n-1}}A^{{n-1}}+\ldots+\beta _{0}I\,,

a zatem

y^{T}A^{n}B=\beta _{{n-1}}y^{T}A^{{n-1}}B+\ldots+\beta _{0}y^{T}B=0\,.

Podobnie

A^{{n+1}}=\beta _{{n-1}}A^{{n}}+\ldots+\beta _{0}A

i

y^{T}A^{{n+1}}B=0\,.

Powtarzając to postępowanie

y^{T}A^{k}B=0\,,\qquad\forall\; k=0,1,\ldots\,.

Stąd

y^{T}e^{{-As}}B=y^{T}\sum\limits _{{k=0}}^{{\infty}}(-1)^{k}\frac{A^{k}\, s^{k}}{k!}B=0\,,

dla każdego s\in[0,t_{1}].

Mamy (2.10). Stąd

y^{T}x_{0}=-\int\limits _{0}^{{t_{1}}}y^{T}e^{{-As}}Bu(s)\,\mathrm{d}s=0\,,

czyli istnieje niezerowy wektor y\in\mathbb{R}^{n}, który jest prostopadły do każdego x_{0}\in\mathcal{C}(t_{1}). Stąd wynika, że \mathcal{C}(t_{1}) leży w hiperpłaszczyźnie prostopadłej do y dla każdego t_{1}>0. Zatem \mathcal{C}=\bigcup\limits _{{{t_{1}}>0}}\,\mathcal{C}(t_{1}) leży w hiperpłaszczyźnie prostopadłej do y i

\mathrm{Int}\,\mathcal{C}=\emptyset\,.

Otrzymujemy więc, że 0\not\in{\mathrm{Int}}\,{\mathcal{C}}, czyli \sim{(b)}.

2. Dowód {(a)} \;\Rightarrow\; {(b)}, czyli \sim{(b)} \;\Rightarrow\; \sim{(a)}. Załóżmy więc \sim{(b)}, czyli 0\not\in{\mathrm{Int}}\,{\mathcal{C}}. Stąd dla każdego t_{1}>0: 0\not\in{\mathrm{Int}}\,{\mathcal{C}}(t_{1}), gdyż {\mathcal{C}}(t_{1})\subset\mathcal{C}\; (nie istnieje kula \mathbb{B}(0,\delta)\subset\mathcal{C} \;\Rightarrow\; nie istnieje kula \mathbb{B}(0,\delta)\subset\mathcal{C}(t_{1}) dla każdego t_{1}).

Ale 0\in\mathcal{C}(t_{1}) oraz \mathcal{C}(t_{1}) jest zbiorem wypukłym dla każdego t_{1}>0 (por. dowód twierdzenia 2.2). Zatem istnieje hiperpłaszczyzna przechodząca przez 0, taka że \mathcal{C}(t_{1}) leży po jednej stronie tej hiperpłaszczyzny (twierdzenie 2.3), tzn. istnieje wektor b=b(t_{1})\in\mathbb{R}^{n}, b\not=0, taki że

b^{T}x_{0}\leq 0\qquad\forall\; x_{0}\in\mathcal{C}(t_{1})\,.

Stąd

-b^{T}x_{0}=\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\geq 0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,.

Z lematu 2.2 poniżej wynika, że

b^{T}e^{{-As}}B=0\qquad\forall\; s\in[0,t_{1}]\,.

Wstawiając s=0 otrzymujemy b^{T}B=0. Następnie różniczkując względem s i wstawiając s=0 otrzymujemy

b^{T}A^{k}B=0\qquad\forall\; k=0,1,\ldots\,.

Zatem niezerowy wektor b jest prostopadły do każdej kolumny M i \mathrm{rank}\, M<n, czyli \sim{(a)}.

Lemat 2.2 (Nierówność całkowa)

Jeżeli

\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\geq 0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,, (2.16)

to

b^{T}e^{{-As}}B=0\qquad\forall\; s\in[0,t_{1}]\,.
Dowód: [31], str. 32; [19], str. 21

\quad

Jeżeli u\in\mathbb{U}_{m}[0,t_{1}], to -u\in\mathbb{U}_{m}[0,t_{1}]. Zatem z (2.16) wynika, że

\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}s=0\qquad\forall\; u\in\mathbb{U}_{m}[0,t_{1}]\,.

Niech v(s):=\Big(b^{T}e^{{-As}}B\Big)^{T}. Jeżeli v\not\equiv 0, to istnieje s_{0}\in[0,t_{1}], t.ż. v(s_{0})\not=0. Istnieje wtedy przedział \mathbb{I}\subset[0,t_{1}], t.ż. s_{0}\in\mathbb{I} oraz v\not=0 na \mathbb{I}. Określmy sterowanie

u(t)=\left\{\begin{array}[]{ccc}\frac{v(t)}{|v(t)|}&\textrm{dla}&t\in\mathbb{I}\\
0&\textrm{dla}&t\in[0,t_{1}]\setminus\mathbb{I}\end{array}\right.\,.

Wówczas mamy

0=\int\limits _{0}^{{t_{1}}}v^{T}(s)u(s)\,\mathrm{d}s=\int\limits _{{\mathbb{I}}}v^{T}(s)\frac{v(s)}{|v(s)|}\,\mathrm{d}s=\int\limits _{{\mathbb{I}}}|v(s)|\,\mathrm{d}s\,.

Otrzymujemy więc sprzeczność z założeniem v\not\equiv 0.

Wniosek 2.1

Twierdzenie 2.4 można powtórzyć dla klas \mathbb{U}_{{PC}}, \mathbb{U}_{{\varepsilon}}, gdyż dla tych klas ,,przechodzi” lemat 2.2.

W dowodzie twierdzenia 2.4 pokazaliśmy, że

Wniosek 2.2

\mathrm{rank}\, M<n\quad\Rightarrow\quad istnieje hiperpłaszczyzna w {\mathbb{R}}^{n}, t.ż. {\mathcal{C}}=\bigcup\limits _{{{t_{1}}>0}}{\mathcal{C}}({t_{1}}) leży w tej hiperpłaszczyźnie \quad\Rightarrow\quad 0\not\in\mathrm{Int}\,{\mathcal{C}}\,.

Ponadto

Wniosek 2.3

\mathrm{rank}\, M=n wtedy i tylko wtedy, gdy

\forall\; b\in{\mathbb{R}}^{n}\,,\; b\not=0\,:\qquad b^{T}e^{{-A\, t}}B\not\equiv 0 (2.17)

jako funkcja zmiennej t.

Dowód

Pokazaliśmy, że \mathrm{rank}\, M<n \quad\Rightarrow\quad \exists\; y\in{\mathbb{R}}^{n}, y\not=0, t.ż.

y^{T}e^{{-A\, t}}B\equiv 0

\quad\Rightarrow\quad0\not\in\mathrm{Int}\,{\mathcal{C}}\quad\Rightarrow\quad\mathrm{rank}\, M<n. Zatem otrzymujemy (2.17).

Definicja 2.10

Układ (LA) spełniający (2.17) nazywa się właściwy (proper).

(LA) jest właściwy wtedy i tylko wtedy, gdy

{\mathrm{rank}}\, M=n\,.

W rozpatrywanym tutaj przypadku \Omega=\,[-1,1]^{m}\, warunek {\mathrm{rank}}\, M=n nie gwarantuje całkowitej sterowalności \mathcal{C}=\mathbb{R}^{n}, jak pokazuje prosty przykład

Przykład 2.3 ([31], str. 33)

Niech n=m=1. Rozważmy

\dot{x}=x+u\,.

Jeżeli x_{0}>1 (lub x_{0}<-1), to odpowiedź na dowolne sterowanie rośnie (maleje) wraz z t, a więc żadne sterowanie nie jest pomyślne. Mamy \mathcal{C}=\,]-1,1[\,\not=\mathbb{R}^{1}, choć 0\in\mathrm{Int}\,\mathcal{C}.

Jednakże przy dodatkowym warunku otrzymujemy:

Twierdzenie 2.5

Dla (LA) następujące dwa warunki są równoważne:

  • (a) \;\mathrm{rank}\, M=n\; oraz \;\Re\lambda\leq 0\; dla każdej wartości własnej \lambda macierzy A

  • (b) \;{\mathcal{C}}={\mathbb{R}}^{n}.

Dowód: [31], str. 34; [24], str. 37–38; oraz \Rightarrow: [27], str. 112, [19], str. 22

\quad

1. Dowód {(a)} \;\Rightarrow\; {(b)}. Załóżmy, że \mathrm{rank}\, M=n oraz \Re\lambda\leq 0 dla każdej wartości własnej \lambda macierzy A. Gdyby istniał y\in\mathbb{R}^{n}, t.ż. y\not\in\mathcal{C}, to z wypukłości \mathcal{C} (twierdzenie 2.2) oraz twierdzenia 2.3 wynikałoby, że y mógłby być odseparowany od \mathcal{C} hiperpłaszczyzną, tzn. istniałby b\in\mathbb{R}^{n}, b\not=0, t.ż.

b^{T}x_{0}\leq\alpha\qquad\forall\; x_{0}\in\mathcal{C}\,, (2.18)

dla pewnego \alpha\in\mathbb{R}^{1}.

Pokażemy, że dla każdego \alpha\in\mathbb{R}^{1} oraz każdego b\in\mathbb{R}^{n}, b\not=0 istnieje t_{1}>0 oraz u\in\mathbb{U}_{m}[0,t_{1}], t.ż.

-\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}\, s>\alpha\,, (2.19)

co oznacza sprzeczność z (2.18), a zatem sprzeczność z założeniem istnienia y\in\mathbb{R}^{n}, t.ż. y\not\in\mathcal{C}, a więc dowodzi prawdziwości {(a)} \;\Rightarrow\; {(b)}.

Niech

v(s):=\Big(b^{T}e^{{-As}}B\Big)^{T}\in\mathbb{R}^{m}\,.

Z założenia, że \mathrm{rank}\, M=n oraz uwagi 2.3 wynika, że (LA) jest właściwy, czyli

v\not\equiv 0\qquad\mathrm{na}\qquad[0,t_{1}]\,. (2.20)

Określmy sterowanie

u(t)=\left\{\begin{array}[]{ccc}-\frac{v(t)}{|v(t)|}&\textrm{dla}&v(t)\not=0\\
0&\textrm{dla}&v(t)=0\,.\end{array}\right.

Wówczas mamy

-\int\limits _{0}^{{t_{1}}}b^{T}e^{{-As}}Bu(s)\,\mathrm{d}\, s=-\int\limits _{0}^{{t_{1}}}v^{T}(s)u(s)\,\mathrm{d}\, s=\int\limits _{0}^{{t_{1}}}|v(s)|\,\mathrm{d}s\,.

Pokażemy, że

\int\limits _{0}^{{\infty}}|v(s)|\,\mathrm{d}s=\infty\,, (2.21)

a zatem istnienie takiego t_{1}, że (2.19) jest spełniona.

Załóżmy, że (2.21) nie jest spełniona, czyli

\int\limits _{0}^{{\infty}}|v(s)|\,\mathrm{d}s<\infty\,.

Wówczas \phi(t):=\int\limits _{t}^{{\infty}}v(s)\,\mathrm{d}s spełnia

\dot{\phi}(t)=-v(t)\,,\qquad\lim\limits _{{t\to\infty}}\phi(t)=0\,,\qquad\phi\not\equiv 0\,. (2.22)

Jeżeli \mathcal{P} jest wielomianem charakterystycznym macierzy A, to \mathcal{P}(A)=0. Stąd

\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)v(t)=\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)\Big(b^{T}e^{{-At}}B\Big)^{T}=\Big(b^{T}\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)e^{{-At}}B\Big)^{T}=\Big(b^{T}\mathcal{P}(A)e^{{-At}}B\Big)^{T}\equiv 0\,.

Zatem funkcja \phi=\phi(t) spełnia liniowy układ równań różniczkowych ze stałymi współczynnikami

\frac{\mathrm{d}}{\mathrm{d}t}\mathcal{P}\Big(-\frac{\mathrm{d}}{\mathrm{d}t}\Big)\phi(t)=0\,.

Rozwiązaniem tego równania jest pewna liniowa kombinacja wyrazów postaci

\Bigg(P_{1}(t)\sin(\Im\gamma\, t)+P_{2}(t)\cos(\Im\gamma\, t)\Bigg)e^{{\Re\gamma\, t}}\,,

gdzie \gamma jest pierwiastkiem równania

\gamma\mathcal{P}(-\gamma)=0.

Zatem \gamma=0, lub -\gamma=\lambda, gdzie \lambda jest wartością własną macierzy A. Z założenia wynika, że

\Re\gamma\geq 0

co jest sprzeczne z (2.22). To kończy dowód implikacji {(a)} \;\Rightarrow\; {(b)}.

2. Dowód {(b)} \;\Rightarrow\; {(a)}. Pokażemy, że

  • \mathrm{rank}\, M<n\,,

lub

  • \Re\lambda>0 dla pewnej wartości własnej \lambda macierzy A

implikuje \mathcal{C}\not=\mathbb{R}^{n}.

Jeżeli \mathrm{rank}\, M<n\,, to z wniosku 2.2 wynika, że \mathcal{C}\not=\mathbb{R}^{n}.

Niech \Re\lambda>0, dla pewnej wartości własnej \lambda macierzy A. Jeżeli y\in\mathbb{C}^{n} jest (lewym) wektorem własnym (eigenvector), to

y^{T}A=\lambda y^{T}\,.

Stąd

y^{T}A^{k}=\lambda^{k}y^{T}\qquad\forall\; k=1,2,\ldots\,,

a zatem

y^{T}e^{{-At}}=e^{{-\lambda t}}y^{T}\qquad t>0\,.

Mamy

y^{T}=y^{T}_{{\Re}}+iy^{T}_{{\Im}}\,,\quad y_{{\Re}},y_{{\Im}}\in\mathbb{R}^{n}\,,\quad y_{{\Re}}\not=0\,.

Wówczas

y^{T}_{{\Re}}e^{{-At}}=e^{{-\Re\lambda\, t}}\cos\Big(\Im\lambda\, t\Big)y^{T}_{{\Re}}-e^{{-\Re\lambda\, t}}\sin\Big(\Im\lambda\, t\Big)y^{T}_{{\Im}}\,. (2.23)

Mamy

y^{T}_{{\Re}}x_{0}=-\int\limits _{0}^{{t_{1}}}y^{T}_{{\Re}}e^{{-As}}Bu(s)\,\mathrm{d}\, s\,. (2.24)

Z (2.23) wynika, że prawa strona (2.24) jest ograniczona jednostajnie względem t_{1}>0. Zatem

y^{T}_{{\Re}}x_{0}<\alpha\qquad\forall\; x_{0}\in\mathcal{C}\,,

dla pewnego \alpha\in\mathbb{R}^{1}. Czyli \mathcal{C} leży po jednej stronie pewnej hiperpłaszczyzny, a więc \mathcal{C}\not=\mathbb{R}^{n}. To kończy dowód {(b)} \;\Rightarrow\; {(a)}.

Ćwiczenie 2.1

Czy twierdzenie 2.5 jest prawdziwe dla klas {{\mathcal{C}}}_{{PC}}, {{\mathcal{C}}}_{{\varepsilon}}, {{\mathcal{C}}}_{{BB}} oraz {{\mathcal{C}}}_{{BBPC}}? Dla {{\mathcal{C}}}_{{BB}} można zastosować zasadę bang–bang — por. twierdzenie 5.1.

Z dowodu {(b)} \;\Rightarrow\; {(a)} twierdzenia 2.5 wynika prawdziwość (por. [24], str. 38):

Wniosek 2.4

Jeżeli \mathrm{rank}\, M=n oraz \Re\lambda>0, dla pewnej wartości własnej \lambda macierzy A, to \mathcal{C}\not=\mathbb{R}^{n}.

Przykład 2.4 (Wagon odrzutowy — patrz przykład 1.2)
\left[\begin{array}[]{c}{\dot{x}}^{1}\\
{\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\
{x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&1\\
0&0\\
\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\
1\end{array}\right]\,.

Mamy

M=\big[B,AB\big]=\left[\begin{array}[]{cc}0&1\\
1&0\\
\end{array}\right]\,,

\mathrm{rank}\, M=2 i układ jest właściwy. Jedyną (podwójną) wartością własną macierzy A jest 0. Z twierdzenia 2.5 wynika, że {\mathcal{C}}={\mathbb{R}}^{2}, czyli każdy stan początkowy może być doprowadzony do celu 0\in{\mathbb{R}}^{2}.

W przeciwieństwie do przypadku klasy sterowań \mathbb{U}_{m} o wartościach w \Omega=[-1,1]^{m}, rozważanego w twierdzeniu 2.5, w przypadku sterowań o wartościach w \Omega={\mathbb{R}}^{m} okazuje się, że warunek \mathrm{rank}\, M=n jest równoważny całkowitej sterowalności. W przypadku \Omega={\mathbb{R}}^{m} klasę sterowań definiujemy jako

\mathbb{U}_{m}^{{\infty}}=\bigcup\limits _{{t_{1}>0}}L^{{\infty}}\Big(0,t_{1};\mathbb{R}^{m}\Big)\,.

Dla uproszczenia notacji odpowiedni zbiór sterowalny bedziemy oznaczali jako \mathcal{C}, czyli tak samo, jak w przypadku \Omega=[-1,1]^{m} (sens będzie wynikał z kontekstu).

Wówczas można sformułować następujące twierdzenie:

Twierdzenie 2.6

Dla (LA) i klasy sterowań {\mathbb{U}}_{m}^{{\infty}} następujące dwa warunki są równoważne:

  • (a) \;\mathrm{rank}\, M=n\,,

  • (b) \;{\mathcal{C}}={\mathbb{R}}^{n}.

Dowód: por. [14], str. 58; [27], str. 107.

\quad

1. Dowód {(b)} \;\Rightarrow\; {(a)}, czyli \sim{(a)} \;\Rightarrow\; \sim{(b)} jest identyczny jak punkt 1 dowodu twierdzenia 2.4.

2. Dowód {(a)} \;\Rightarrow\; {(b)}. Załóżmy, że \,\mathrm{rank}\, M=n\,. Z twierdzenia 2.4 wynika, że istnieje otwarta kula \mathbb{B}=\mathbb{B}(0,\delta) o środku w 0\in\mathbb{R}^{n} i promieniu \delta>0, t.ż. \mathbb{B}\subset\mathcal{C}. Dla dowolnego x_{0}\in\mathbb{R}^{n} istnieje stała \eta\in\,]0,1], t.ż.

\eta x_{0}\in\mathbb{B}\,,

czyli istnieje t_{1}>0 oraz u\in\mathbb{U}_{m}[0,t_{1}], t.ż.

\eta x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}Bu(s)\,\mathrm{d}\, s\,.

Stąd

x_{0}=-\int\limits _{0}^{{t_{1}}}e^{{-As}}B\bar{u}(s)\,\mathrm{d}\, s\,,

gdzie \bar{u}=\frac{u}{\eta}\in\mathbb{U}_{m}^{{\infty}}, co kończy dowód.

Okazuje się (por. [31], str. 37), że dla klasy sterowań \mathbb{U}_{m} ,,prawie wszystkie” układy (LA) są lokalnie sterowalne (tzn. spełniają 0\in{\mathcal{C}}), a dla klasy sterowań {\mathbb{U}}_{m}^{{\infty}} ,,prawie wszystkie” układy (LA) są całkowicie sterowalne (tzn. spełniają {\mathcal{C}}={\mathbb{R}}^{n}).

Odległość między dwoma układami (LA): (A_{1},B_{1}) i (A_{2},B_{2}), czyli \dot{x}=A_{1}x+B_{1}u\; i \;\dot{x}=A_{2}x+B_{2}u, odpowiednio, określamy jako

d\Big((A_{1},B_{1}),(A_{2},B_{2})\Big)=|A_{1}-A_{2}|+|B_{1}-B_{2}|\,,

gdzie |A|=\sum\limits _{{i,j=1}}^{n}|a^{{ij}}| i analogicznie |B|.

Zatem dwa układy są bliskie, jeżeli elementy odpowiednich macierzy są bliskie.

Twierdzenie 2.7

Zbiór wszystkich sterowalnych (LA) jest otwarty i gęsty w przestrzeni metrycznej wszystkich (LA), gdzie ,,sterowalność” rozumiemy w sensie

  • całkowitej sterowalności dla \Omega=\mathbb{R}^{m},

  • lokalnej sterowalności dla \Omega=[-1,1]^{m}.

Dowód: [31], str. 37.

\quad

Z twierdzenia 2.4, lub twierdzenia 2.6, w obu rozważanych przypadkach, sterowalność jest równoważna warunkowi \;\mathrm{rank}\, M=n\,. Ten warunek oznacza, że istnieje (n\times n)–macierz N, będąca podmacierzą M, t.ż. \mathrm{det}N\not=0.

Jeżeli układ (\tilde{A},\tilde{B}) jest bliski (A,B), to odpowiednia n\times n podmacierz \tilde{N} macierzy \tilde{M} jest bliska odpowiedniej podmacierzy N macierzy M. Jeżeli \det N\not=0, to \det\tilde{N}\not=0 dla |N-{\tilde{N}}| — małego. Zatem układy sterowalne są zbiorem otwartym.

Załóżmy, że \dot{x}=A_{0}x+B_{0}u nie jest sterowalny, tzn. \;\mathrm{rank}\, M_{0}<n\,, gdzie {M}_{0}=[{B}_{0},\ldots,{A}_{0}^{{n-1}}{B}_{0}]. Chcemy pokazać istnienie układu (\tilde{A},\tilde{B}) — bliskiego układowi ({A}_{0},{B}_{0}) — t.ż. \det\tilde{N}\not=0, dla pewnej n\times n podmacierzy \tilde{N} macierzy \tilde{M}=[\tilde{B},\ldots,\tilde{A}^{{n-1}}\tilde{B}].

\det\tilde{N} może być traktowany jako wielomian \mathcal{P}(y^{1},\ldots,y^{k})\, elementów macierzy \tilde{A} i \tilde{B}, gdzie \, k=n^{2}+nm. Mamy

\mathcal{P}(y_{0}^{1},\ldots,y_{0}^{k})=0

dla y_{0}^{1},\ldots,y_{0}^{k} – elementów macierzy A_{0}, B_{0}.

Wystarczy pokazać, że: dla niezerowego wielomianu \mathcal{P}=\mathcal{P}(y^{1},\ldots,y^{k}), t.ż. \mathcal{P}(y^{1}_{0},\ldots,y^{k}_{0})=0, istnieje y_{1}\in\mathbb{R}^{k} — dowolnie bliskie y_{0}, t.ż.

\mathcal{P}(y_{1}^{1},\ldots,y_{1}^{k})\not=0\,.

Powyższe zdanie wynika z faktu, że niezerowy wielomian k zmiennych nie może znikać w żadnej k–wymiarowej kuli: gdyby znikał, to biorąc pochodne cząstkowe pokazalibyśmy, że wszystkie współczynniki się zerują.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.