5. Zasada bang–bang

Twierdzenie 5.1 (Zasada bang–bang (bang–bang principle))

Dla (LA): Niech t_{1}>0 oraz x_{0}\in{{\mathcal{C}}}({{t_{1}}}). Wówczas istnieje sterowanie bang-bang u_{{\ast}}, które prowadzi x_{0} do 0 w czasie t_{1}.

Zatem

\mathcal{C}(t_{1})=\mathcal{C}_{{BB}}(t_{1})\qquad\forall\; t_{1}>0\,. (5.1)
Dowód: [19], str. 27–30, [27], str. 171.

\quad

Dowód zostanie przeprowadzony w 3 krokach.

  1. Niech

    L^{{\infty}}(0,t)=\Big\{ u:\,]0,t[\,\to{\mathbb{R}}^{m}\;:\quad\| u\| _{{\infty}}:=\mathrm{ess}\sup\limits _{{0<s<t}}|u(s)|<\infty\Big\}

    dla t>0.

    Definicja 5.1

    Niech u_{j}\in L^{{\infty}}(0,t), dla j=1,\ldots, oraz u\in L^{{\infty}}(0,t). Ciąg \{ u_{j}\}\, jest zbieżny do u słabo{}^{{\ast}} (weakly{}^{{\ast}} convergent) w L^{{\infty}}(0,t) (zapis u_{j}\,\rightharpoonup^{{\ast}}\, u), jeżeli

    \lim\limits _{{j\to\infty}}\int\limits _{0}^{t}u_{j}(s)v(s)\,{\rm d}s=\int\limits _{0}^{t}u(s)v(s)\,{\rm d}s

    dla każdego v\in L^{1}(0,t).

    Niech X będzie przestrzenią Banacha. Mamy

    X\subset X^{{\ast\ast}}\,:\qquad J\,:\; X\to X^{{\ast\ast}}\,,\quad J[x](x^{{\ast}})=x^{{\ast}}(x)\quad\forall\; x^{{\ast}}\in X^{{\ast}}\,.

    W X^{{\ast}} można zdefiniować następujące topologie (poprzez zdefiniowanie zbieżności ciągów)

    • topologię mocną: \;\lim\limits _{{j\to\infty}}\| x^{{\ast}}_{j}-x^{{\ast}}\| _{{X^{{\ast}}}}=0,

    • topologię słabą: \;\lim\limits _{{j\to\infty}}x^{{\ast\ast}}(x^{{\ast}}_{j})=x^{{\ast\ast}}(x^{{\ast}})\; dla każdego x^{{\ast\ast}}\in X^{{\ast\ast}},

    • topologię słabą{}^{{\ast}}: \;\lim\limits _{{j\to\infty}}x^{{\ast}}_{j}(x)=x^{{\ast}}(x)\; dla każdego x\in X.

    Słaba topologia w X^{{\ast}} jest najsłabszą topologią, w której każdy x^{{\ast\ast}}\in X^{{\ast\ast}} pozostaje ciągły.

    Słaba{}^{{\ast}} topologia w X^{{\ast}} jest najsłabszą topologią, przy której funkcjonał J[x], zdefiniowany na X^{{\ast}} jest ciągły dla każdego x\in X.

    Kula jednostkowa w X^{{\ast}} jest zwarta w słabej{}^{{\ast}} topologii (twierdzenie Banacha–Alaoglu–Bourbakiego).

    Mamy (L^{1}(0,t))^{{\ast}}=L^{{\infty}}(0,t), L^{1}(0,t)\subset(L^{{\infty}}(0,t))^{{\ast}}.

    Ćwiczenie 5.1

    Pokazać, że (L^{{\infty}}(0,t))^{{\ast}}\setminus L^{1}(0,t)\not=\emptyset.

    Rozwiązanie ćwiczenia: Niech m=1. Rozważmy ustalony przedział [0,t], 0<t. Niech T będzie przekształceniem C([0,t];\mathbb{R}^{1})\ni f\mapsto f(0). Wówczas mamy

    |Tf|\leq\| f\| _{{L^{{\infty}}(0,t)}}\,.

    Z twierdzenia Hahna–Banacha (por. [34], §17) istnieje rozszerzenie tego funkcjonału liniowego (do L^{{\infty}}(0,t)) zachowujące normę (oznaczamy również przez T):

    |Tg|\leq\| g\| _{{L^{{\infty}}(0,t)}}\qquad\forall\; g\in L^{{\infty}}(0,t)\,.

    Jeżeli (L^{{\infty}}(0,t))^{{\ast}}=L^{1}(0,t), to istnieje h\in L^{1}(0,t), t.ż.

    f(0)=\int\limits _{0}^{t}f(s)h(s)\,\mathrm{d}s\,,

    dla f\in C([0,t];\mathbb{R}^{1}).

    Stąd jeżeli 0<a<b\leq t, to

    \int\limits _{a}^{b}h(s)\,\mathrm{d}s=0\,,

    a zatem h=0 prawie wszędzie. Dla f=1 otrzymujemy sprzeczność: 1=0.

    Twierdzenie 5.2 (Alaoglu)

    Niech t>0 oraz \{ u_{j}\} _{{j=1,\ldots}}\subset{{\mathbb{U}}}_{m}[0,t]. Wówczas istnieje podciąg \{ u_{{j_{k}}}\} _{{k=1,\ldots}} oraz u\in{{\mathbb{U}}}_{m}[0,t], t.ż

    u_{{j_{k}}}\,\rightharpoonup^{{\ast}}\, u\qquad k\to\infty

    Dowód: [30], str. 181; [34], str. 219.\;\clubsuit

    Definicja 5.2

    Punkt z\in{\mathbb{K}} nazywa się ekstremalny (extreme) jeżeli

    \Bigg(z=\lambda x_{1}+(1-\lambda)x_{2}\;\mathrm{dla}\; 0<\lambda<1\;\mathrm{oraz}\; x_{1},x_{2}\in\mathbb{K}\Bigg)\Rightarrow\Big(z=x_{1}=x_{2}\Big)\,,

    czyli nie istnieją punkty x_{1}\,,\, x_{2}\,\in{\mathbb{K}}, x_{1}\not=x_{2} oraz 0<\lambda<1, t.ż. z=\lambda x_{1}+(1-\lambda)x_{2}.

    Twierdzenie 5.3 (Kreina–Milmana)

    Niech t>0 oraz {\mathbb{K}} będzie niepustym, wypukłym podzbiorem L^{{\infty}}(0,t), zwartym w słabej{}^{{\ast}} topologii. Wówczas {\mathbb{K}} ma (przynajmniej jeden) punkt ekstremalny.

    Dowód: [34], str. 212.\;\clubsuit

  2. Rozważamy zagadnienie (LA):

    {\dot{x}}=Ax+Bu\,,\qquad x(0)=x_{0}

    Niech {\Delta _{{t_{1}}}} będzie zbiorem sterowań, które prowadzą x_{0}\in{{\mathcal{C}}}({{t_{1}}}) do 0 w czasie {{t_{1}}}:

    {\Delta _{{t_{1}}}}=\Big\{ u\in{{\mathbb{U}}}_{m}[0,{{t_{1}}}]\,:\quad u\;{\textrm{prowadzi}}\; x_{0}\;{\textrm{do}}\; 0\;{\textrm{w}}\;{{t_{1}}}\,\Big\}

    Pokażemy, że {\Delta _{{t_{1}}}} spełnia założenia tw. Kreina–Milmana, a następnie, że punkt ekstremalny jest sterowaniem bang–bang.

    Lemat 5.1

    Zbiór {\Delta _{{t_{1}}}} spełnia założenia tw. Kreina–Milmana.

    Dowód: [19], str. 27–30, [27], str. 171.

    \quad

    x_{0}\in{{\mathcal{C}}}({{t_{1}}}), więc {\Delta _{{t_{1}}}}\not=\emptyset. Pokażemy, ze {\Delta _{{t_{1}}}} jest wypukły.

    u\in{\Delta _{{t_{1}}}} wtedy i tylko wtedy, gdy

    x_{0}=-\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu(s)\,{\rm d}s

    Niech u\,,\,\bar{u}\,\in{\Delta _{{t_{1}}}} oraz 0\leq\lambda\leq 1.

    Wówczas

    x_{0}=-\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}B\Big(\lambda u(s)+(1-\lambda)\bar{u}(s)\Big)\,{\rm d}s

    Zatem \lambda u+(1-\lambda)\bar{u}\in{\Delta _{{t_{1}}}}.

    Pokażemy zwartość w słabej{}^{{\ast}} topologii. Niech \{ u_{j}\} _{{j=1,2,...}}\subset{\Delta _{{t_{1}}}}.

    Z tw. Alaoglu: ist. j_{k}\to\infty oraz u\in{{\mathbb{U}}}_{m}[0,{{t_{1}}}], t.ż. u_{{j_{k}}}\rightharpoonup^{{\ast}}u dla k\to\infty

    Musimy pokazać, że u\in{\Delta _{{t_{1}}}}. Z u_{{j_{k}}}\in{\Delta _{{t_{1}}}} wynika, że

    x_{0}=-\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu_{{j_{k}}}(s)\,{\rm d}s\quad\to\quad-\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu(s)\,{\rm d}s

    z definicji słabej{}^{{\ast}} zbieżności. Zatem \; u\in{\Delta _{{t_{1}}}}.

    Z twierdzenia Kreina–Milmana istnieje punkt ekstremalny u_{{\ast}} w {\Delta _{{t_{1}}}}.

  3. Pokażemy, że dla prawie każdego t\in\,[0,{{t_{1}}}]\, i każdego j=1,\ldots,m:

    |u_{{\ast}}^{j}(t)|=1

    Załóżmy, że nie! Istnieje więc indeks i oraz podzbiór {\mathbb{G}}\subset\,[0,{{t_{1}}}]\, o dodatniej mierze, t.ż. |u_{{\ast}}^{i}(t)|<1\, dla t\in{\mathbb{G}}\,. Istnieje \varepsilon>0 oraz G\subset{\mathbb{G}}, t.ż.

    |G|>0\,,\qquad|u_{{\ast}}^{i}(t)|\leq 1-\varepsilon\,,\qquad t\in G\,.

    Niech v=v(t)\in{\mathbb{R}}^{m} będzie t.ż. v=(0,\ldots,0,\underbrace{\mathstrut{v^{i}}}_{{i}},0,\ldots,0)^{T}\,, gdzie

    • v^{i}\not=0 na G,

    • |v^{i}|\leq 1,

    • v\Big|_{{[0,{{t_{1}}}]\setminus G}}=0

      oraz

    • \int\limits _{{G}}e^{{-As}}Bv(s)\,{\rm d}s=0\,.

    Niech

    u_{1}=u_{{\ast}}+\varepsilon v\,,\qquad u_{2}=u_{{\ast}}-\varepsilon v\,,

    Mamy u_{1},u_{2}\in{\Delta _{{t_{1}}}}. Rzeczywiście

    \begin{array}[]{ll}-&\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu_{1}(s){\rm d}s=\\
=-&\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu_{{\ast}}(s)\,{\mathrm{d}}s-\varepsilon\underbrace{\mathstrut{\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bv(s){\rm d}s}}_{{=0}}\,=\, x_{0}\end{array}

    Mamy |u_{1}^{i}|\leq 1:

    u_{1}^{i}(t)=u_{{\ast}}^{i}(t)\quad{\rm dla}\; t\not\in G\,,\qquad u_{1}^{i}(t)=u_{{\ast}}(t)+\varepsilon v^{i}(t)\quad{\rm dla}\; t\in G\,,

    Na G mamy |u_{{\ast}}^{i}|\leq 1-\varepsilon, a zatem

    |u_{1}^{i}(t)|\leq|u_{{\ast}}^{i}(t)|+\varepsilon|v^{i}(t)|\leq 1-\varepsilon+\varepsilon=1

    Podobnie u_{2}, zatem u_{1},u_{2}\in{\Delta _{{t_{1}}}}.

    u_{1}=u_{{\ast}}+\varepsilon v\,,\quad u_{1}\not=u_{{\ast}}\,,\qquad u_{2}=u_{{\ast}}-\varepsilon v\,,\quad u_{2}\not=u_{{\ast}}\,,
    \frac{1}{2}u_{1}+\frac{1}{2}u_{2}=u_{{\ast}}

    Sprzeczność: bo u_{{\ast}} jest punktem ekstremalnym {\Delta _{{t_{1}}}}.

Uwaga 5.1

Zasada bang–bang pozostaje bez zmiany w przypadku, gdy celem jest y\not=0, y\in{\mathbb{R}}^{n}. Rzeczywiście:

\displaystyle y \displaystyle\,=\, e^{{A{{t_{1}}}}}\Big(x_{0}+\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu(s){\rm d}s\Big)\qquad\Longleftrightarrow
\displaystyle 0 \displaystyle\,=\, e^{{A{{t_{1}}}}}\Big(y_{0}+\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bu(s){\rm d}s\Big)\;,\qquad y_{0}=x_{0}-e^{{-A{{t_{1}}}}}y

Z zasady bang–bang istnieje v\in{{\mathbb{U}}}_{{BB}}[0,{{t_{1}}}], t.ż.

\displaystyle 0 \displaystyle\,=\, e^{{A{{t_{1}}}}}\Big(y_{0}+\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bv(s){\rm d}s\Big)\qquad\Longleftrightarrow
\displaystyle y \displaystyle\,=\, e^{{A{{t_{1}}}}}\Big(x_{0}+\int\limits _{0}^{{{{t_{1}}}}}e^{{-As}}Bv(s){\rm d}s\Big)
Uwaga 5.2

Analogicznie dla

{\dot{x}}(t)=Ax(t)+Bu(t)+c(t)\,.
Uwaga 5.3

Przykład 4.1 pokazuje, że zasada bang–bang nie zachodzi dla układów nieliniowych. Przykład 2.3 i twierdzenie 2.6 pokazują, że zasada bang–bang nie zachodzi dla sterowań nieograniczonych.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.