6. Zagadnienie optymalnego sterowania

Badanie sterowalności jest jednym z podstawowych aspektów teorii sterowania. Kolejnym jest badanie optymalności pomyślnych sterowań. Wprowadzamy funkcjonał kosztu (cost functional) (lub funkcjonał wypłaty (payoff functional))

{\mathfrak{C}}[u]=\int\limits _{0}^{{{t_{1}}}}{\mathfrak{f}}^{0}\Big(t,x(t),u(t)\Big)\mathrm{d}\, t+{\mathfrak{g}}({t_{1}},x({t_{1}}))\,, (6.1)

gdzie x(t)=x(t;x_{0},{u(\,.\,)}) jest odpowiedzią na sterowanie u\in{\mathbb{U}}_{m}, {\mathfrak{f}}^{0} i \mathfrak{g} są zadanymi funkcjami rzeczywistymi. Pierwszy (całkowy) wyraz lewej strony (6.1) jest bieżącym kosztem (running cost) (lub bieżącą wypłatą (running payoff)), a drugi wyraz (tzn. {\mathfrak{g}}) jest końcowym kosztem (terminal cost) (lub końcową wypłatą (terminal payoff)). W przypadku interpretacji \mathfrak{C}[u] jako kosztu naturalne jest poszukiwanie sterowań u minimalizujących \mathfrak{C}[u], a w przypadku interpretacji jako wypłaty — maksymalizujących. Dalej będziemy mówili o koszcie i minimalizacji.

Rozpatrujemy więc zagadnienie:

\dot{x}=f(t,x,u)\,,\qquad x(t)\in{\mathbb{R}}^{n}\,,\qquad u(t)\in\Omega\,,

z danymi początkowymi x(0)=x_{0} oraz funkcjonałem kosztu zadanym jednym z poniższych wzorów

  • (L) \quad{\mathfrak{C}}[u]=\int\limits _{{0}}^{{{{t_{1}}}}}\mathfrak{f}^{0}(t,x(t),u(t))\,\mathrm{d}t\,,\qquad\qquadzagadnienie Lagrange'a;

  • (M) \quad{\mathfrak{C}}[u]=\mathfrak{g}({t_{1}},x({t_{1}}))\,,\qquad\qquad\qquad\;\;zagadnienie Mayera;

  • (B) \quad{\mathfrak{C}}[u]=\int\limits _{{0}}^{{{{t_{1}}}}}\mathfrak{f}^{0}(t,x(t),u(t))\,\mathrm{d}t+\mathfrak{g}({t_{1}},x({t_{1}}))\,,\qquadzagadnienie Bolzy.

Problem 6.1

Zagadnienie sterowania optymalnego (optimal control problem) polega na tym, by doprowadzić do celu sterowaniem z odpowiedniej klasy, w taki sposób, by {\mathfrak{C}}[u] było możliwie najmniejsze.

Definicja 6.1

Niech klasa pomyślnych sterowań (successful controls) będzie oznaczona przez

\Delta=\Big\{ u\in{\mathbb{U}}_{m}\;:\quad\exists\,{t_{1}}\qquad x({t_{1}};x_{0},{u(\,.\,)})\in{\mathcal{T}}({t_{1}})\Big\}

Sterowanie u_{{\ast}}\in{\mathbb{U}}_{m} jest optymalne (optimal), jeżeli

u_{{\ast}}\in\Delta\qquad\qquad\mathrm{oraz}\qquad{\mathfrak{C}}[u_{{\ast}}]\leq{\mathfrak{C}}[u]\qquad\forall\; u\in\Delta\,. (6.2)

Dla zagadnienia Bolzy (B) (lub zagadnienia Lagrange'a (L)), zadanego sterowania u i odpowiedzi x określamy

x^{0}(t)=\int\limits _{{0}}^{t}\mathfrak{f}^{0}\big(s,x(s),u(s)\big)\,\mathrm{d}s

Jeżeli u jest pomyślne, to x({{t_{1}}})\in{\mathcal{T}}({t_{1}}) (dla pewnego {{t_{1}}}\geq 0) i odpowiedni koszt to x^{0}({{t_{1}}})+\mathfrak{g}({t_{1}},x({t_{1}})). Gdy u jest optymalne, to x^{0}({{t_{1}}})+\mathfrak{g}({t_{1}},x({t_{1}})) jest najmniejsze.

Określamy (n+1)–wymiarowy wektor \mathbf{x}(t)=\big(x^{0}(t),x^{T}(t)\big)^{T} oraz

\mathbf{f}(t,\mathbf{x})=\big(\mathfrak{f}^{0},f^{T}\big)^{T}(t,x)\,.

W ten sposób zagadnienie Bolzy (B) (lub zagadnienie Lagrange'a (L)) można sprowadzić do zagadnienia Mayera (M) dla

\dot{\mathbf{x}}=\mathbf{f}(\mathbf{x},u)\,, (6.3)

z

\mathfrak{C}[u]=x^{0}({t_{1}})+\mathfrak{g}({t_{1}},\mathbf{x}({t_{1}}))\,. (6.4)

Cel może być ustalony, lub nie:

  • (I) Gdy, tak jak w poprzednich rozdziałach, cel jest ustalony mamy do czynienia z zagadnieniem ustalonego punktu końcowego, {{\mathcal{T}}}(t)\equiv x_{1}, x_{1} jest ustalonym punktem w {\mathbb{R}}^{n}, {{t_{1}}} jest wówczas czasem dotarcia do celu x_{1} i nie jest ustalone (fixed–end–point (a target point is given) – free–time problem);

  • (II) Można rozpatrywać zagadnienie, gdy cel {{\mathcal{T}}}(t)=\mathbb{S}, gdzie \mathbb{S} jest l–wym. (l<n) gładką rozmaitością (manifold; por. [12], str. 64) w {\mathbb{R}}^{n} — podobnie jak powyżej {t_{1}} nie jest ustalone;

  • (III) Cel może nie być określony i wtedy mamy do czynienia z zagadnieniem swobodnego punktu końcowego (free–end–point problem; a target point is not given): wtedy {t_{1}}>0 jest ustalone, {\mathcal{T}}(t_{1})={\mathbb{R}}^{n}.

Definicja 6.2

Sterowanie u_{{\ast}} jest czaso–optymalne (time–optimal) (lub optymalno-czasowe), jeżeli jest optymalne dla funkcjonału kosztu

{\mathfrak{C}}[u]={t_{1}}\,, (6.5)

gdzie {t_{1}} jest chwilą przybycia do celu 0\in{\mathbb{R}}^{n}.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.