7. Liniowe zagadnienie czaso–optymalne

Rozpatrujemy liniowe zagadnienie sterowania optymalnego (LA):

\dot{x}=Ax+Bu\,, (7.1)

gdzie A i B są stałymi macierzami n\times n i n\times m, odpowiednio, a funkcjonał kosztu jest określony przez (6.5).

Definicja 7.1

Niech {\mathbb{K}}(t;x_{0}) będzie zbiorem osiągalnym (reachable set) z x_{0} w chwili t>0:

{\mathbb{K}}(t;x_{0})=\Big\{ x(t,x_{0},{u(\,.\,)})\,:\; u\in{\mathbb{U}}_{m}[0,t]\Big\}\subset{\mathbb{R}}^{n}\,, (7.2)

{\mathbb{K}}(t;x_{0}) może być zanurzony w odpowiedniej hiperpłaszczyźnie (hyperplane) w {\mathbb{R}}^{n}. Wówczas \mathrm{Int}\,{\mathbb{K}}(t;x_{0}) i \partial\,{\mathbb{K}}(t;x_{0}) będą rozumiane w sensie odpowiednich hiperpłaszczyzn.

Z zasady bang–bang 5.1 dla układu liniowego (-LA) (czyli \;\dot{y}=-Ay-Bu\,) wynika, że

\mathcal{C}^{-}(t_{1};x_{0})=\mathcal{C}^{-}_{{BB}}(t_{1};x_{0})

a zatem

\mathbb{K}(t_{1};x_{0})=\mathbb{K}_{{BB}}(t_{1};x_{0})\,. (7.3)

Dla zwartych podzbiorów \mathbb{A}, \mathbb{B} przestrzeni \mathbb{R}^{n} rozważamy metrykę Hausdorffa

d_{H}(\mathbb{A},\mathbb{B})=\inf\Big\{\varepsilon>0\;:\quad\mathbb{A}\subset\mathbb{N}_{{\varepsilon}}(\mathbb{B})\,,\quad\mathbb{B}\subset\mathbb{N}_{{\varepsilon}}(\mathbb{A})\Big\}\,,

\mathbb{N}_{{\varepsilon}}(\mathbb{A}) jest \varepsilon–otoczką zbioru \mathbb{A} (\varepsilon–sack about \mathbb{A})

\mathbb{N}_{{\varepsilon}}(\mathbb{A})=\Big\{ x\in{\mathbb{R}}^{n}\,:\; d(x,\mathbb{A})<\varepsilon\Big\}\,,\qquad d(x,\mathbb{A})=\inf\Big\{|x-y|\,:\; y\in\mathbb{A}\Big\}\,.
Lemat 7.1

Dla (LA): Zbiór {\mathbb{K}}(t;x_{0}) jest wypukły i zwarty (convex and compact). Ponadto odwzorowanie t\;\longrightarrow\;{\mathbb{K}}(t;x_{0}), 0\leq t<\infty, jest ciągłe z topologią w obrazie zdefiniowaną przez metrykę Hausdorffa.

Dowód: [19], str. 32, [31], str. 60.

\quad Mamy

y\in\mathbb{K}(t;x_{0})\quad\Leftrightarrow\quad\exists\, u\in\mathbb{U}_{m}[0,t]\,:\quad y=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu(s)\,\mathrm{d}s\,. (7.4)
  • Wypukłość.

    x_{i}\in\mathbb{K}(t;x_{0})\quad\Leftrightarrow\quad\exists\, u_{i}\in\mathbb{U}_{m}[0,t]\,:\quad x_{i}=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu_{i}(s)\,\mathrm{d}s\,\quad i=1,2\,.

    Wtedy dla \lambda\in[0,1]

    \lambda x_{1}+(1-\lambda)x_{2}=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}B\Big(\lambda u_{1}(s)+(1-\lambda)u_{2}(s)\Big)\,\mathrm{d}s\,\quad i=1,2

    i

    \lambda u_{1}+(1-\lambda)u_{2}\in\mathbb{U}_{m}[0,t]\,.

    Zatem

    \lambda x_{1}+(1-\lambda)x_{2}\in\mathbb{K}(t;x_{0})\,.
  • Zwartość. Pokażemy domkniętość. Niech

    \big\{ x_{j}\big\} _{{j\in\mathbb{N}}}\subset\mathbb{K}(t;x_{0})\qquad\mathrm{oraz}\qquad x_{j}\to y\quad\mathrm{w}\;\mathbb{R}^{n}\,.

    Chcemy pokazać, że y\in\mathbb{K}(t;x_{0}). Ponieważ x_{j}\in\mathbb{K}(t;x_{0}), to istnieje u_{j}\in\mathbb{U}_{m}[0,t], t.ż.

    x_{j}=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu_{j}(s)\,\mathrm{d}s\,.

    Z twierdzenia Alaoglu istnieje podciąg \big\{ j_{k}\big\} _{{k\in\mathbb{N}}}, j_{k}\to\infty, dla k\to\infty oraz istnieje u\in\mathbb{U}_{m}[0,t], t. ż.

    u_{{j_{k}}}\rightharpoonup^{{\ast}}u\quad\mathrm{dla}\quad k\to\infty\,.

    Stąd przechodząc do podciągu (por. rozdział 5)

    y=e^{{At}}x_{0}+\int\limits _{0}^{t}e^{{A(t-s)}}Bu(s)\,\mathrm{d}s\,,

    a zatem y\in\mathbb{K}(t;x_{0}) i \mathbb{K}(t;x_{0}) jest domknięty, ponadto jest ograniczony, a więc zwarty.

  • Ciągłość. Dla x_{0}\in\mathbb{R}^{n}, t_{0}\geq 0 oraz \varepsilon>0 pokażemy, że istnieje \delta\in\,]\, 0,1\,[\,, t.ż. spełniony jest następujący warunek:

    • jeżeli |\tilde{t}-t_{0}|<\delta, to d_{H}\big(\mathbb{K}(\tilde{t};x_{0}),\mathbb{K}(t_{0},x_{0})\big)<\varepsilon.

    Chcemy więc pokazać, że jeżeli |\tilde{t}-t_{0}|<\delta, to

    \mathbb{K}(\tilde{t};x_{0})\subset\mathbb{N}_{{\varepsilon}}\Big(\mathbb{K}(t_{0},x_{0})\Big)\qquad\mathrm{oraz}\qquad\mathbb{K}(t_{0},x_{0})\subset\mathbb{N}_{{\varepsilon}}\Big(\mathbb{K}(\tilde{t};x_{0})\Big)\,.

    Niech T=t_{0}+1, C=\max\limits _{{0\leq s\leq T}}|e^{{-As}}B|.

    \tilde{y}\in\mathbb{K}(\tilde{t};x_{0})\quad\Leftrightarrow\quad\tilde{y}=e^{{A\tilde{t}}}x_{0}+\int\limits _{0}^{{\tilde{t}}}e^{{A(\tilde{t}-s)}}B\tilde{u}(s)\,\mathrm{d}s

    dla pewnego \tilde{u}\in\mathbb{U}_{m}[0,\tilde{t}].

    Przedłużamy \tilde{u} zerem na [0,T] (czyli \tilde{u}(s)=0 dla t\in\,]\tilde{t},T]) oraz określamy

    {y}_{0}=e^{{A{t}_{0}}}x_{0}+\int\limits _{0}^{{{t}_{0}}}e^{{A({t}_{0}-s)}}B\tilde{u}(s)\,\mathrm{d}s\,,

    zatem y_{0}\in\mathbb{K}(t_{0};x_{0}).

    Mamy

    \begin{array}[]{ll}&|\tilde{y}-y_{0}|=|e^{{A\tilde{t}}}x_{0}-e^{{At_{0}}}x_{0}|+\Big|\int\limits _{0}^{{\tilde{t}}}e^{{A(\tilde{t}-s)}}B\tilde{u}(s)\,\mathrm{d}s-\int\limits _{0}^{{{t}_{0}}}e^{{A({t}_{0}-s)}}B\tilde{u}(s)\,\mathrm{d}s\Big|\\
&\leq|e^{{A\tilde{t}}}-e^{{At_{0}}}||x_{0}|+|e^{{A\tilde{t}}}-e^{{At_{0}}}|\Big|\int\limits _{0}^{{\tilde{t}}}e^{{-As}}B\tilde{u}(s)\,\mathrm{d}s\Big|+|e^{{At_{0}}}|\Big|\int\limits _{{t_{0}}}^{{\tilde{t}}}e^{{-As}}B\tilde{u}(s)\,\mathrm{d}s\Big|\,.\end{array}

    Niech \delta>0 będzie t.ż. dla |\tilde{t}-t_{0}|<\delta mamy |e^{{A\tilde{t}}}-e^{{At_{0}}}|<\varepsilon _{1}, gdzie \varepsilon _{1}>0 będzie wybrane później. Mamy

    |\tilde{y}-y_{0}|\leq\varepsilon _{1}|x_{0}|+\varepsilon _{1}TC\sqrt{m}+|e^{{At_{0}}}|\delta C\sqrt{m}\,.

    \delta i \varepsilon _{1} wybieramy takie, aby

    \varepsilon _{1}|x_{0}|+\varepsilon _{1}TC\sqrt{m}+|e^{{At_{0}}}|C\sqrt{m}\delta<\varepsilon\,.

    Stąd wynika, że \tilde{y}\in\mathbb{N}_{{\varepsilon}}(\mathbb{K}(t_{0};x_{0})), a z dowolności \tilde{y}, że

    \mathbb{K}(\tilde{t};x_{0})\subset\mathbb{N}_{{\varepsilon}}\Big(\mathbb{K}(t_{0},x_{0})\Big)\,.

    Identycznie pokazujemy, że

    \mathbb{K}(t_{0},x_{0})\subset\mathbb{N}_{{\varepsilon}}\Big(\mathbb{K}(\tilde{t};x_{0})\Big)\,.

Warto zauważyć, że podobny wynik nie jest prawdziwy dla (NLA) — por. [14], str. 52.

Można teraz sformułować twierdzenie o istnieniu sterowania czaso–optymalnego

Twierdzenie 7.1

Dla (LA): jeżeli istnieje pomyślne sterowanie prowadzące x_{0}\in{\mathbb{R}}^{n} do celu 0\in{\mathbb{R}}^{n}, to istnieje sterowanie czaso–optymalne i jest ono bang-bang.

Dowód: [19], str. 31; [31], str. 60; [36], str. 147; por. [27], str. 173.

\quad

Istnieje pomyślne sterowanie, a zatem 0\in\mathbb{K}(\tilde{t};x_{0}) dla pewnego \tilde{t}\geq 0. Niech

t_{1}=\inf\Big\{ t\geq 0\;:\quad 0\in\mathbb{K}(t;x_{0})\Big\}\,. (7.5)

Zbiór \Big\{ t\geq 0\,:\; 0\in\mathbb{K}(t;x_{0})\Big\} jest więc niepusty i ograniczony z dołu. Istnieje więc \inf. Chcemy pokazać, że

0\in\,\mathbb{K}(t_{1};x_{0})\,,

co oznacza, że istnieje sterowanie prowadzące do celu w najkrótszym czasie t_{1}.

Załóżmy, że 0\not\in\,\mathbb{K}(t_{1};x_{0}). Ponieważ \mathbb{K}(t_{1};x_{0}) jest domknięty, to istnieje otwarta kula \mathbb{B}=\mathbb{B}(0,\varrho), \varrho>0, t.ż.

\mathbb{B}(0,\varrho)\,\cap\,\mathbb{K}(t_{1},x_{0})=\emptyset\,.

Korzystając z ciągłości przekształcenia \; t\,\to\,\mathbb{K}(t;x_{0})\; otrzymujemy

\mathbb{B}(0,\frac{\varrho}{2})\,\cap\,\mathbb{K}(t,x_{0})=\emptyset\qquad\mathrm{dla}\qquad t_{1}\leq t\leq t_{1}+\delta\,,

dla pewnego \delta>0.

To oznacza, że 0\in\mathbb{R}^{n} nie jest osiągalny dla pewnych t>t_{1}, co jest sprzeczne z definicją t_{1}.

Z zasady bang–bang: jeżeli istnieje pomyślne sterowanie z \mathbb{U}_{m} prowadzące x_{0}\in\mathbb{R}^{n} do 0\in\mathbb{R}^{n} w czasie t_{1}, to istnieje sterowanie bang–bang prowadzące x_{0}\in\mathbb{R}^{n} do 0\in\mathbb{R}^{n} w czasie t_{1}. To kończy dowód.

Definicja 7.2

Sterowanie u określone na [0,{\tau}] jest ekstremalne (extremal), jeżeli

x(t;x_{0},{u(\,.\,)})\in\partial\,{\mathbb{K}}(t;x_{0})\qquad\forall\; t\in[0,{\tau}]\,, (7.6)

gdzie \partial oznacza brzeg zbioru.

Należy zauważyć, że sterowanie ekstremalne nie musi być ani optymalne, ani nawet pomyślne!

W momencie dotarcia do celu, odpowiedż na sterowanie czaso–optymalne leży na brzegu zbioru \mathbb{K}(t_{1};x_{0}):

Lemat 7.2

Jeżeli sterowanie u_{{\ast}} jest czaso–optymalne, to w t_{1} — momencie dotarcia do celu 0\in\mathbb{R}^{n} — odpowiedź x(t)=x(t;x_{0},u_{{\ast}}(\,.\,)) leży w \partial\,\mathbb{K}(t_{1};x_{0}) (czyli 0\in\partial\,\mathbb{K}(t_{1};x_{0})).

Dowód

Załóżmy, że u_{{\ast}} jest czaso–optymalnym sterowaniem prowadzącym x_{0}\in\mathbb{R}^{n} do 0\in\mathbb{R}^{n} w czasie t_{1}, czyli

x(t_{1})=x(t_{1};x_{0},u_{{\ast}}(\,.\,))=0\in\mathbb{R}^{n}

i x(t_{1})=0 nie leży w \partial\,\mathbb{K}(t_{1};x_{0}).

Wówczas istnieje (otwarta) kula \mathbb{B}(0,\varrho)\,\subset\,\mathbb{K}(t_{1};x_{0}). Z ciągłości przekształcenia \, t\mapsto\mathbb{K}(t;x_{0})\, istnieje \delta>0, t.ż.

\mathbb{B}(0,{\frac{\varrho}{2}})\,\subset\,\mathbb{K}(t;x_{0})\qquad\mathrm{dla}\qquad t_{1}-\delta\leq t\leq t_{1}\,.

zatem cel 0\in\mathbb{R}^{n} byłby osiągalny w czasie t<t_{1}, co jest sprzeczne z minimalnością t_{1}.

Odpowiedź na dowolne sterowanie nie może przechodzić z wnętrza zbioru osiągalnego na jego brzeg:

Lemat 7.3

Załóżmy, że dla sterowania u\in\mathbb{U}_{m}[0,t_{1}]

\tilde{x}=x(\tilde{t})\in\,\mathrm{Int}\,\mathbb{K}(\tilde{t};x_{0})\qquad\mathrm{dla}\;\mathrm{pewnego}\; 0<\tilde{t}<t_{1}\,,

gdzie x=x(t) jest odpowiedzią x(t)=x(t;x_{0},u(\,.\,)).

Wówczas

x(t)\in\,\mathrm{Int}\,\mathbb{K}(t;x_{0})\qquad\forall\; t\in\,]\tilde{t},t_{1}]\,. (7.7)
Dowód

Jeżeli \tilde{x}=x(\tilde{t})\in\,\mathrm{Int}\,\mathbb{K}(\tilde{t};x_{0}), to istnieje (otwarta) kula \tilde{\mathbb{B}}=\mathbb{B}(\tilde{x},\delta), t.ż. \tilde{\mathbb{B}}\subset\,\mathbb{K}(\tilde{t};x_{0}).

Dla każdego \tilde{x}_{0}\in\tilde{\mathbb{B}} istnieje sterowanie \tilde{u}, które prowadzi x_{0} do \tilde{x}_{0} w czasie \tilde{t} (punkt \tilde{x}_{0} jest osiągalny z x_{0}).

Rozważmy zagadnienie z ustalonym sterowaniem u:

\dot{y}=Ay+Bu\,,\qquad y(\tilde{t})=\tilde{x}_{0}\,,\qquad t>\tilde{t}\,.

Dla \tilde{x}_{0}=\tilde{x} mamy y(t)=x(t) dla t\in[\tilde{t},t_{1}]. Rozwiązanie ma postać

y(t)=e^{{A(t-\tilde{t})}}\tilde{x}_{0}+\int\limits _{{\tilde{t}}}^{t}e^{{A(t-s)}}Bu(s)\,\mathrm{d}s\,,

czyli

y(t)=\mathcal{F}(t)\tilde{x}_{0}+\mathcal{G}(t)\,.

Dla ustalonego t>\tilde{t} odwzorowanie \mathcal{F}(t) jest liniowe ciągłe i przekształca \mathbb{R}^{n} na \mathbb{R}^{n}, bo \mathrm{det}\,\mathcal{F}(t)\not=0. Z twierdzenia o odwzorowaniu otwartym (por. [34], tw. 15.4, str. 147) wynika, że \mathcal{F}(t) przekształca zbiory otwarte na zbiory otwarte. Stąd zbiór

\mathbb{F}_{t}:=\Big\{ y\in\mathbb{R}^{n}\;:\quad y=\mathcal{F}(t)\tilde{x}_{0}+\mathcal{G}(t)\,,\quad\tilde{x}_{0}\in\tilde{\mathbb{B}}\Big\}

jest otwarty w \mathbb{R}^{n} oraz \mathbb{F}_{t}\subset\mathbb{K}(t;x_{0}), a zatem

x(t)\in\mathbb{F}_{t}\,\subset\,\mathrm{Int}\,\mathbb{K}(t;x_{0})\,,

czyli (7.7) jest spełnione, co kończy dowód lematu.

Z lematów 7.2 i 7.3 wynika

Twierdzenie 7.2

Dla (LA): jeżeli sterowanie u_{{\ast}} jest czaso–optymalne, to u_{{\ast}} jest ekstremalne.

Dowód: [31], str. 61.

\quad Z lematu 7.2 wynika, że w t_{1} — momencie przybycia do celu 0 — odpowiedź x(t_{1}) leży na brzegu zbioru osiągalnego \partial\,\mathbb{K}(t_{1};x_{0}). Z lematu 7.3 wynika, że jeżeli odpowiedź x(\bar{t}) leży na brzegu zbioru osiągalnego \partial\,\mathbb{K}(\bar{t};x_{0}) dla pewnego \bar{t}\in\,]0,t_{1}], to

x(t)\in\,\partial\,\mathbb{K}(t;x_{0})\qquad\forall\; t\in\,[0,\bar{t}]\,.

To kończy dowód.

Twierdzenie 7.3

Dla (LA) i u_{e}\in{\mathbb{U}}_{m}[0,t_{e}] następujące warunki są równoważne:

  • u_{e} jest ekstremalne na [0,t_{e}],

  • istnieje h\in{\mathbb{R}}^{n}, h\not=0, t.ż.

    h^{T}e^{{-tA}}Bu_{e}(t)=\max\limits _{{v\in\Omega}}\,\Big(h^{T}e^{{-tA}}Bv\Big)\,,\qquad\mathrm{dla}\;\mathrm{p.k.}\; t\in[0,t_{e}]\,. (7.8)
Dowód: [31], str. 62; [19], str. 33.

\quad

  1. Dowód ,,\Rightarrow”: załóżmy, że u_{e}\in\mathbb{U}_{m}[0,t_{e}] jest ekstremalne, czyli

    x_{e}(t):=x(t;x_{0},u_{e}(\,.\,))\,\in\,\partial\,\mathbb{K}(t;x_{0})\qquad\forall\; t\in[0,t_{e}]\,.

    Ponieważ \mathbb{K}(t_{e};x_{0}) jest wypukły oraz x_{e}(t_{e})\in\partial\,\mathbb{K}(t_{e};x_{0}), to istnieje hiperpłaszczyzna podpierająca \mathbb{K}(t_{e};x_{0}) w punkcie x_{e}(t_{e}), tzn. istnieje b\in\mathbb{R}^{n}, b\not=0, t.ż.

    b^{T}x\leq b^{T}x_{e}(t_{e})\qquad\forall\; x\in\mathbb{K}(t_{e};x_{0})\,.

    Mamy

    x\in\mathbb{K}(t_{e};x_{0})\quad\Leftrightarrow\quad x=e^{{At_{e}}}x_{0}+\int\limits _{0}^{{t_{e}}}e^{{A(t_{e}-s)}}Bu(s)\,\mathrm{d}s\,,\quad u\in\mathbb{U}_{m}[0,t_{e}]\,.

    Zatem

    b^{T}e^{{At_{e}}}x_{0}+b^{T}\int\limits _{0}^{{t_{e}}}e^{{A(t_{e}-s)}}Bu(s)\,\mathrm{d}s\leq b^{T}e^{{At_{e}}}x_{0}+b^{T}\int\limits _{0}^{{t_{e}}}e^{{A(t_{e}-s)}}Bu_{e}(s)\,\mathrm{d}s\quad\forall\; u\in\mathbb{U}_{m}[0,t_{e}]\,.

    Wstawiając h^{T}=b^{T}e^{{At_{e}}} mamy h\in\mathbb{R}^{n}, h\not=0 (bo macierz e^{{At_{e}}} jest nieosobliwa) oraz

    \int\limits _{0}^{{t_{e}}}h^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\leq\int\limits _{0}^{{t_{e}}}h^{T}e^{{-As}}Bu_{e}(s)\,\mathrm{d}s\quad\forall\; u\in\mathbb{U}_{m}[0,t_{e}]\,. (7.9)

    Pokażemy, że stąd wynika

    h^{T}e^{{-As}}Bu_{e}(s)=\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-As}}Bv\Big)\qquad\mathrm{dla}\;\mathrm{p.k.}\; s\in[0,t_{e}]\,. (7.10)

    Załóżmy, że nie! Istnieje wtedy podzbiór \mathbb{I}\subset[0,t_{e}], |\mathbb{I}|>0, t.ż.

    h^{T}e^{{-As}}Bu_{e}(s)<\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-As}}Bv\Big)\qquad\mathrm{dla}\; s\in\mathbb{I}\,.

    Określamy sterowanie

    \tilde{u}(t)=\left\{\begin{array}[]{cc}u_{e}(t)&t\in\mathbb{I}^{{\prime}}:=[0,t_{e}]\setminus\mathbb{I}\\
u_{{\ast}}(t)&t\in\mathbb{I}\,,\end{array}\right.

    gdzie u_{{\ast}} jest t.ż.

    h^{T}e^{{-As}}Bu_{{\ast}}(s)=\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-As}}Bv\Big)\qquad\mathrm{dla}\; s\in\mathbb{I}\,.

    Mamy wtedy

    \int\limits _{0}^{{t_{e}}}h^{T}e^{{-As}}B\tilde{u}(s)\,\mathrm{d}s=\int\limits _{{\mathbb{I}}}h^{T}e^{{-As}}B{u}_{{\ast}}(s)\,\mathrm{d}s+\int\limits _{{\mathbb{I}^{{\prime}}}}h^{T}e^{{-As}}B{u}_{e}(s)\,\mathrm{d}s>\int\limits _{0}^{{t_{e}}}h^{T}e^{{-As}}Bu_{e}(s)\,\mathrm{d}s\,.

    Sprzeczność z (7.9)! Zatem (7.10) jest spełnione, co kończy dowód \Rightarrow.

  2. Dowód \Leftarrow. Załóżmy, że istnieje h\in\mathbb{R}^{n}, h\not=0, t.ż.

    h^{T}e^{{-At}}Bu_{e}(t)=\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-At}}Bv\Big)\qquad\mathrm{dla}\;\mathrm{p.k.}\; t\in[0,t_{e}]\,.

    Stąd

    \int\limits _{0}^{{t}}h^{T}e^{{-As}}Bu(s)\,\mathrm{d}s\leq\int\limits _{0}^{{t}}h^{T}e^{{-As}}Bu_{e}(s)\,\mathrm{d}s\quad\forall\; u\in\mathbb{U}_{m}[0,t_{e}]\,,

    dla dowolnego, ale ustalonego t\in[0,t_{e}]. Wstawiając b^{T}=h^{T}e^{{-At}} i postępując odwrotnie jak poprzednio otrzymujemy

    b^{T}x(t)\leq b^{T}x_{e}(t)\qquad\forall\; x(t)\in\mathbb{K}(t;x_{0})\,,

    co oznacza, że x_{e}(t) leży na brzegu \mathbb{K}(t;x_{0}):

    x_{e}(t)\,\in\partial\,\mathbb{K}(t;x_{0})\,.

    Ponieważ t jest dowolne, więc otrzymujemy wynikanie \Leftarrow.

Z twierdzenia 7.2 i twierdzenie 7.3 wynika zasada maksimum Pontriagina dla liniowego zagadnienia czaso–optymalnego (Pontryagin maximum principle for linear time–optimal control) — szczególny przypadek zasady maksimum Pontriagina rozpatrywanej w rozdziale 9warunku koniecznego (necessary condition) dla sterowania optymalnego.

Twierdzenie 7.4

Dla (LA): jeżeli sterowanie u_{{\ast}} jest czaso–optymalne, to istnieje h\in{\mathbb{R}}^{n}, h\not=0, t.ż.

h^{T}e^{{-tA}}Bu_{{\ast}}(t)=\max\limits _{{v\in\Omega}}\,\Big(h^{T}e^{{-tA}}Bv\Big)\,,\qquad\mathrm{dla}\;\mathrm{p.k.}\; t\in[0,{t_{1}}]\,, (7.11)

\square

Uwaga 7.1

Każda współrzędna wektora h^{T}e^{{-tA}}B\in{\mathbb{R}}^{m} jest funkcją analityczną zmiennej t. Stąd (por. [12] , twierdzenie 6.9, str. 199) na zwartym przedziale w [0,{t_{1}}] jest albo tożsamościowo równa 0, albo znika tylko w skończonej liczbie punktów 0<t\leq{t_{1}}. Jeżeli zachodzi ten drugi przypadek dla każdej współrzędnej, to sterowanie u jest jednoznacznie wyznaczone, poza skończonym (a więc miary 0) zbiorem punktów. Wtedy sterowanie jest bang–bang ze skończoną liczbą przełączeń (switches). Natomiast w pierwszym przypadku sterowanie nie jest określone przez \max\limits _{{v\in\Omega}}\,\Big(h^{T}e^{{-tA}}Bv\Big). Pierwszy przypadek będziemy nazywali osobliwym (singular), a drugi normalnym (normal) — por. [24], str. 52.

Definicja 7.3

(LA) nazywamy normalnym (normal), jeżeli dla każdego h\in{\mathbb{R}}^{n}, h\not=0, żadna współrzędna wektora h^{T}e^{{-tA}}B\in{\mathbb{R}}^{m} nie znika na zbiorze dodatniej miary.

Każdy (LA)normalny jest właściwy (tzn. \mathrm{rank}\, M=n). Warunek w definicji 7.3 jest równoważny warunkowi, że żadna współrzędna nie znika tożsamościowo.

Przykład 7.1

Rozpatrujemy układ RRZ, n=m=2, w postaci macierzowej:

\left[\begin{array}[]{c}{\dot{x}}^{1}\\
{\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\
{x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&0\\
0&0\\
\end{array}\right]\,,\qquad B=\left[\begin{array}[]{cc}1&0\\
0&1\\
\end{array}\right]\,.

h\in\mathbb{R}^{2}, h\not=0,

h^{T}e^{{-tA}}B=[h^{1},h^{2}]\left[\begin{array}[]{cc}1&0\\
0&1\\
\end{array}\right]\left[\begin{array}[]{cc}1&0\\
0&1\\
\end{array}\right]=[h^{1},h^{2}]\,.

Układ jest właściwy, ale nie jest normalny.

Następujący wniosek pokazuje związek pomiędzy sterowaniami ekstremalnymi a sterowaniami bang–bang:

Wniosek 7.1

Jeżeli (LA) jest normalny, to warunek (7.8) jest równoważny warunkowi

u^{i}_{e}(t)=\mathrm{sign}\,\Big(h^{T}e^{{-tA}}B\Big)^{i}\,,\qquad i=1,\ldots,m\,,\qquad\mathrm{dla}\;\mathrm{p.k.}\; t\in[0,t_{e}]\,. (7.12)

Twierdzenie 7.4 można zapisać w ogólnym formalizmie, który będzie później stosowany w rozdziale 9 w ogólnej sytuacji.

Definicja 7.4

Wprowadzamy hamiltonian (Hamiltonian)

H(w,x,u)=w^{T}\Big(Ax+Bu\Big)\,, (7.13)

gdzie w,x\in{\mathbb{R}}^{n}, u\in{\mathbb{U}}_{m}.

Możemy wyrazić twierdzenie 7.4 w następującej postaci

Twierdzenie 7.5

Dla (LA): niech u_{{\ast}}\in{\mathbb{U}}_{m}[0,t_{1}] będzie sterowaniem czaso-optymalnym z odpowiedzią x_{{\ast}}=x_{{\ast}}(t)=x(t;x_{0},{u_{{\ast}}(\,.\,)}). Wówczas istnieje absolutnie ciągła funkcja w\,:\,[0,{t_{1}}]\rightarrow\,{\mathbb{R}}^{n}, t.ż.

\dot{x}^{j}_{{\ast}}=\phantom{-}\frac{\partial}{\partial w^{j}}H(w,x_{{\ast}},u_{{\ast}})\,,\qquad j=1,\ldots,n\,,\qquad\mathrm{p.w.}\;\mathrm{na}\;\,[0,{t_{1}}]\,, (7.14)
\dot{w}^{j}=-\frac{\partial}{\partial x^{j}}H(w,x_{{\ast}},u_{{\ast}})\,,\qquad j=1,\ldots,n\,,\qquad\mathrm{p.w.}\;\mathrm{na}\;\,[0,{t_{1}}]\,, (7.15)

oraz

H\big(w(t),x_{{\ast}}(t),u_{{\ast}}(t)\big)=M\big(w(t),x_{{\ast}}(t)\big)\,,\qquad\mathrm{dla}\;\mathrm{p.w.}\;\, t\in[0,{t_{1}}]\,, (7.16)

gdzie

M(w,x)=\max\limits _{{v\in\Omega}}H\big(w,x,v\big)\,.
Dowód: [19], str. 35.

\quad

Niech h\in{\mathbb{R}}^{n} będzie jak w twierdzeniu 7.4. Rozważmy zagadnienie

\dot{w}=-A^{T}w\,,\qquad w(0)=h\,.

Jego rozwiązaniem jest

w(t)=e^{{-tA^{T}}}h\,,

a zatem

w^{T}(t)=h^{T}e^{{-tA}}\,,\qquad\mathrm{bo}\quad\Big(e^{{-t{A^{T}}}}\Big)^{T}=e^{{-tA}}\,.

Z twierdzenia 7.4 wynika, że

h^{T}e^{{-tA}}Bu_{{\ast}}(t)=\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-tA}}Bv\Big)\,.

Zatem

\begin{array}[]{ll}&H(w(t),x_{{\ast}}(t),u_{{\ast}}(t))=w^{T}(t)\Big(Ax_{{\ast}}(t)+Bu_{{\ast}}(t)\Big)=\\
&h^{T}e^{{-tA}}Ax_{{\ast}}(t)+h^{T}e^{{-tA}}Bu_{{\ast}}(t)=h^{T}e^{{-tA}}Ax_{{\ast}}(t)+\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-tA}}Bv\Big)=\\
&\max\limits _{{v\in\Omega}}\Big(h^{T}e^{{-tA}}Ax_{{\ast}}(t)+h^{T}e^{{-tA}}Bv\Big)=\max\limits _{{v\in\Omega}}\Big(w^{T}(t)Ax_{{\ast}}(t)+w^{T}(t)Bv\Big)=\\
&M(w(t),x_{{\ast}}(t))\,.\end{array} (7.17)

Z definicji H warunek (7.16) oraz równania (7.14) i (7.15) są spełnione.

Definicja 7.5

Równanie (7.15) nazywa się równaniem sprzężonym (adjoint equation), a funkcja wko–stanem (costate).

Przykład 7.2 (wagon odrzutowy, [36], str. 29–34; [19], str. 36; [31], str. 64, 109, 111)

Rozpatrujemy układ RRZ z n=2, m=1 — por. przykłady 1.2, 2.4:

{\dot{x}}^{1}=x^{2}\,,\qquad{\dot{x}}^{2}=u\,,\qquad u=u(t)\in[-1,1]\,, (7.18)

lub w postaci macierzowej:

\left[\begin{array}[]{c}{\dot{x}}^{1}\\
{\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\
{x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&1\\
0&0\\
\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\
1\end{array}\right]\,.
  1. ,,W języku” twierdzenia 7.4:

    Mamy

    e^{{-tA}}=I-tA=\left[\begin{array}[]{cc}1&-t\\
0&1\\
\end{array}\right]\,,\qquad\qquad h=\left[\begin{array}[]{c}h^{1}\\
h^{2}\end{array}\right]\,,\;\qquad\big(h^{1}\big)^{2}+\big(h^{2}\big)^{2}\not=0\,,
    h^{T}e^{{-tA}}B=[h^{1},h^{2}]\left[\begin{array}[]{cc}1&-t\\
0&1\\
\end{array}\right]\left[\begin{array}[]{c}0\\
1\end{array}\right]=[h^{1},-h^{1}t+h^{2}]\left[\begin{array}[]{c}0\\
1\\
\end{array}\right]\;=h^{2}-h^{1}t\,.

    Układ (7.18) jest normalny!

    Z twierdzenia 7.4 i wniosku 7.1 wynika, że każde optymalne sterowanie u_{{\ast}} musi spełniać

    u_{{\ast}}(t)=\mathrm{sign}\big(h^{2}-h^{1}t\big)\,,

    dla pewnego h\in\mathbb{R}^{2}\setminus\{ 0\}.

  2. ,,W języku” twierdzenia 7.5:

    Mamy

    w=\left[\begin{array}[]{c}w^{1}\\
w^{2}\end{array}\right]\,,
    H(w,x,v)=w^{T}\big(Ax+Bv\big)=[w^{1},w^{2}]\Bigg(\left[\begin{array}[]{cc}0&1\\
0&0\\
\end{array}\right]\left[\begin{array}[]{c}x^{1}\\
x^{2}\end{array}\right]+\left[\begin{array}[]{c}0\\
1\end{array}\right]v\Bigg)\,,

    Stąd

    H(w,x,v)=w^{1}x^{2}+w^{2}v

    i

    \dot{w}^{1}=0\,,\qquad\dot{w}^{2}=-w^{1}\,.

    Zatem

    H(w,x,v)=w^{1}_{0}x^{2}+\Big(w^{2}_{0}-w^{1}_{0}t\Big)v\,,

    gdzie w^{1}_{0}=w^{1}(0)\,\in{\mathbb{R}}^{1}, w^{2}_{0}=w^{2}(0)\,\in{\mathbb{R}}^{1}. Dla uproszczenia zapisu nie zaznaczono w sposób jawny zależności zmiennych od t.

    Twierdzenie 7.5 implikuje, że jeżeli u_{{\ast}} jest czaso–optymalne, to istnieją liczby w^{i}_{0}, i=1,2, t.ż.

    H(w,x_{{\ast}},u_{{\ast}})=M(w,x_{{\ast}})=\max\limits _{{-1\leq v\leq 1}}H(w,x_{{\ast}},v)=w^{1}_{0}x^{2}_{{\ast}}+|w^{2}_{0}-w^{1}_{0}t|

    a to jest osiągane dla v=u_{{\ast}}(t), gdzie

    u_{{\ast}}(t)={\mathrm{sign}}\big(w^{2}_{0}-w^{1}_{0}t\big)\,.

    Funkcja liniowa w^{2}_{0}-w^{1}_{0}t nie może być tożsamościowo 0, gdyż w(t)=e^{{-tA^{T}}}h nie może znikać tożsamościowo.

    Z twierdzenia 7.1 i przykładu 2.4 wynika istnienie sterowania czaso–optymalnego (dla każdego punktu x_{0}\in{\mathbb{R}}^{2}). Z powyższych rozważań wynika, że sterowanie czaso–optymalne jest bang–bang, kawałkami stałe, z co najwyżej jednym punktem przełączenia.

Ćwiczenie 7.1

Opisać czaso–optymalne trajektorie.

Przykład 7.3 (Zlinearyzowane równanie kątowego odchylenia od pionu z wymuszeniem, [36], str. 34–42; [31], str. 64)

Rozpatrujemy układ RRZ z n=2, m=1:

{\dot{x}}^{1}=x^{2}\,,\qquad{\dot{x}}^{2}=-x^{1}+u\,,\qquad u=u(t)\in[-1,1]\,, (7.19)

lub w postaci macierzowej:

\left[\begin{array}[]{c}{\dot{x}}^{1}\\
{\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\
{x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&1\\
-1&0\\
\end{array}\right]\,,\qquad B=\left[\begin{array}[]{c}0\\
1\end{array}\right]\,.
  1. ,,W języku” twierdzenia 7.4:

    Mamy

    e^{{-tA}}=\left[\begin{array}[]{cc}\cos t&-\sin t\\
\sin t&\cos t\\
\end{array}\right]\,,\qquad h=\left[\begin{array}[]{c}h^{1}\\
h^{2}\end{array}\right]\,,\qquad\big(h^{1}\big)^{2}+\big(h^{2}\big)^{2}\not=0\,,
    h^{T}e^{{-tA}}B=[h^{1},h^{2}]\left[\begin{array}[]{cc}\cos t&-\sin t\\
\sin t&\cos t\\
\end{array}\right]\left[\begin{array}[]{c}0\\
1\end{array}\right]=
    [h^{1}\cos t+h^{2}\sin t\,,\,-h^{1}\sin t+h^{2}\cos t]\left[\begin{array}[]{c}0\\
1\\
\end{array}\right]\,,

    stąd

    h^{T}e^{{-tA}}B=h^{2}\cos t-h^{1}\sin t=r\sin\big(t+\alpha\big)\,,

    gdzie r=\Big(\big(h^{1}\big)+\big(h^{2}\big)\Big)^{{\frac{1}{2}}}, \alpha=\mathrm{arc}\cos\Big(-\frac{h^{1}}{r}\Big), r\not=0.

    Układ (7.19) jest normalny!

    Z twierdzenia 7.4 wynika, że każde sterowanie optymalne u_{{\ast}} musi spełniać

    u_{{\ast}}(t)=\mathrm{sign}\big(\sin(t+\alpha)\big)\,.
  2. ,,W języku” twierdzenia 7.5:

    Mamy

    w=\left[\begin{array}[]{c}w^{1}\\
w^{2}\end{array}\right]\,,
    H(w,x,v)=w^{T}\big(Ax+Bv\big)=[w^{1},w^{2}]\Bigg(\left[\begin{array}[]{cc}0&1\\
-1&0\\
\end{array}\right]\left[\begin{array}[]{c}x^{1}\\
x^{2}\end{array}\right]+\left[\begin{array}[]{c}0\\
1\end{array}\right]v\Bigg)\,,

    Stąd

    H(w,x,v)=w^{1}x^{2}+w^{2}\big(-x^{1}+v\big)

    i

    \dot{w}^{1}=w^{2}\,,\qquad\dot{w}^{2}=-w^{1}\,.

    Stąd w^{2}(t)=r\sin\big(t+\alpha\big), gdzie r>0 i \alpha są stałymi.

    Twierdzenie 7.5 implikuje, że jeżeli u_{{\ast}} jest czaso–optymalne, to

    H(w,x_{{\ast}},u_{{\ast}})=M(w,x_{{\ast}})=\max\limits _{{-1\leq v\leq 1}}H(w,x_{{\ast}},v)=w^{1}(t)x^{2}_{{\ast}}(t)-w^{2}(t)x^{1}_{{\ast}}(t)+|w^{2}(t)|

    a to jest osiągane jedynie dla v=u_{{\ast}}(t), gdzie

    u_{{\ast}}(t)={\mathrm{sign}}\sin(t+\alpha)\,.

    Zatem każde sterowanie czaso–optymalne jest bang–bang i okresowe o okresie 2\pi.

Ćwiczenie 7.2

Opisać czaso–optymalne trajektorie.

Przykład 7.4 ([31], str. 65.)

W przykładzie 7.1 rozpatrywany był układ właściwy, który nie jest normalny.

\left[\begin{array}[]{c}{\dot{x}}^{1}\\
{\dot{x}}^{2}\end{array}\right]\,=\, A\left[\begin{array}[]{c}{x}^{1}\\
{x}^{2}\end{array}\right]+Bu(t)\,,\qquad\qquad A=\left[\begin{array}[]{cc}0&0\\
0&0\\
\end{array}\right]\,,\qquad B=\left[\begin{array}[]{cc}1&0\\
0&1\\
\end{array}\right]\,.

Niech x_{0}=(-1,0). Wówczas każde ze sterowań u_{{a}}, a\in[0,\frac{1}{2}], gdzie

u_{a}^{1}\equiv 1

oraz

u_{0}^{2}\equiv 0\,,
u_{{a}}^{2}=\left\{\begin{array}[]{cc}1&0\leq t\leq a\\
0&a<t\leq 1-a\\
-1&1-a<t\leq 1\end{array}\right.\,,

dla a\in\,]0,\frac{1}{2}[\,,

u_{{\frac{1}{2}}}^{2}=\left\{\begin{array}[]{cc}1&0\leq t\leq\frac{1}{2}\\
-1&\frac{1}{2}<t\leq 1\end{array}\right.\,,

jest czaso–optymalne z t_{1}=1, ale tylko u_{{\frac{1}{2}}} jest bang–bang.

Twierdzenie 7.6

Jeżeli (LA) jest normalny oraz istnieje pomyślne sterowanie (prowadzące x_{0} do 0), to istnieje jednoznaczne sterowanie czaso–optymalne. To sterowanie jest bang–bang i kawałkami stałe.

Dowód: [31], str. 66.

\quad

Z twierdzenia 7.1 wynika istnienie. Z twierdzenia 7.4 i wniosku 7.1 wynika, że każde sterowanie czaso–optymalne jest bang–bang. Załóżmy, że u_{1} oraz u_{2} są dwoma różnymi sterowaniami czaso–optymalnymi bang–bang. Wówczas sterowanie u_{3}(t)=\frac{u_{1}(t)+u_{2}(t)}{2} jest też czaso–optymalne, ale nie jest bang–bang. Otrzymujemy sprzeczność: zatem sterowanie czaso–optymalne jest jednoznaczne.

Sterowanie czaso–optymalne jest kawałkami stałe, gdyż każda współrzędna zmienia wartość tylko wtedy, gdy ta sama współrzędna h^{T}e^{{-At}}B przyjmuje wartość 0, a to może zdarzyć się tylko w skończonej liczbie punktów odcinka [0,t_{1}].

Definicja 7.6

Niech x_{0}\in{\mathbb{R}}^{n} będzie ustalone, \tau>0 oraz y\in{\mathbb{K}}(\tau;x_{0}). Jeżeli

x(t;x_{0},{u_{1}(\,.\,)})=x(t;x_{0},u_{2}(\,.\,))\qquad\forall\; t\in[0,\tau]\,, (7.20)

dla każdego u_{1}\in{\mathbb{U}}_{m}[0,\tau] i każdego u_{2}\in{\mathbb{U}}_{m}[0,\tau], t.ż.

x(\tau,x_{0},{u_{1}(\,.\,)})=x(\tau,x_{0},u_{2}(\,.\,))=y\,,

to odpowiedź z x_{0} do y jest jednoznaczna (unique).

Twierdzenie 7.7

Załóżmy, ze macierz B nie ma żadnej kolumny złożonej z samych 0, x_{0}\in{\mathbb{R}}^{n} i niech y\in{\mathbb{K}}(\tau,x_{0}). Wówczas następujące warunki są równoważne

  • sterowanie prowadzące x_{0} do y w czasie \tau jest jednoznaczne,

  • odpowiedź z x_{0} do y w czasie \tau jest jednoznaczna,

  • y jest ekstremalnym punktem {\mathbb{K}}(\tau,x_{0}).

Dowód: [31], str. 69–71.\;\clubsuit

Dalej w tym rozdziale będziemy zakładać, że macierz B nie ma żadnej kolumny złożonej z samych 0. Nie zmniejsza to ogólności!

Definicja 7.7

Zbiór \mathbb{A} jest ściśle wypukły jeżeli

\alpha x+(1-\alpha)y\in\mathrm{Int}\,\mathbb{A}\qquad\forall\;\alpha\in\,]0,1[\;,

dla każdych dwóch punktów x,y\in\mathbb{A}.

Twierdzenie 7.8 (Geometryczna charakteryzacja (LA) normalnych)

(LA) jest normalny na [0,\tau] \;\Leftrightarrow\; {\mathbb{K}}(\tau;x_{0}) jest ściśle wypukły dla pewnego x_{0}.

Dowód: [31], str. 71.\;\clubsuit

Twierdzenie 7.9 (Analityczna charakteryzacja (LA) normalnych)

(LA) jest normalny na [0,\tau] \;\Leftrightarrow\; b_{j}\,,\; Ab_{j}\,,\;\ldots\,,A^{{n-1}}b_{j} są liniowo niezależnymi wektorami w {\mathbb{R}}^{n}, dla każdej kolumny b_{j} macierzy B, j=1,\ldots,m.

Dowód: [31], str. 72.\;\clubsuit

Podsumowaniem jest następujący wniosek:

Wniosek 7.2

Dla (LA) normalnego: istnieje otoczenie \mathfrak{N} punktu 0, t.ż. każdy punkt \mathfrak{N} może być doprowadzony do 0 jednoznacznym sterowaniem czaso-optymalnym bang–bang i kawałkami stałym. Jeżeli dodatkowo \Re\lambda\leq 0, dla każdej wartości własnej \lambda macierzy A, to \mathfrak{N}={\mathbb{R}}^{n}.

Twierdzenie 7.10

Dla (LA) normalnego:

jeżeli każda wartość własna (eigenvalue) macierzy A jest rzeczywista,

to każda współrzędna każdego sterowania czaso–optymalnego ma co najwyżej n-1 przełączeń.

Dowód: [31], str. 77; [36], str. 138–140.\;\clubsuit

Poniższe twierdzenie formułuje warunek dostateczny — odwrotność zasady maksimum:

Twierdzenie 7.11

Dla (LA) właściwego: każde (pomyślne) sterowanie u_{{\ast}}, prowadzące x_{0} do 0 w czasie t_{1}>0 i spełniające

\begin{array}[]{l}\mathrm{dla}\;\mathrm{pewnego}\; h\in{\mathbb{R}}^{n}\,,\; h\not=0\,:\\
h^{T}e^{{-tA}}Bu_{{\ast}}(t)=\max\limits _{{v\in\Omega}}(h^{T}e^{{-tA}}Bv)\\
\mathrm{dla}\;\mathrm{p.k.}\; t\in\,]\, 0,\tau\,[\,,\end{array} (7.21)

jest czaso–optymalne na [0,\tau].

Dowód: [31], str. 77.\;\clubsuit

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.