6. Zagadnienie optymalnego sterowania

Badanie sterowalności jest jednym z podstawowych aspektów teorii sterowania. Kolejnym jest badanie optymalności pomyślnych sterowań. Wprowadzamy funkcjonał kosztu (cost functional) (lub funkcjonał wypłaty (payoff functional))

Cu=0t1f0t,xt,utdt+gt1,xt1, (6.1)

gdzie x(t)=x(t;x0,u(.)) jest odpowiedzią na sterowanie uUm, f0 i g są zadanymi funkcjami rzeczywistymi. Pierwszy (całkowy) wyraz lewej strony (6.1) jest bieżącym kosztem (running cost) (lub bieżącą wypłatą (running payoff)), a drugi wyraz (tzn. g) jest końcowym kosztem (terminal cost) (lub końcową wypłatą (terminal payoff)). W przypadku interpretacji Cu jako kosztu naturalne jest poszukiwanie sterowań u minimalizujących Cu, a w przypadku interpretacji jako wypłaty — maksymalizujących. Dalej będziemy mówili o koszcie i minimalizacji.

Rozpatrujemy więc zagadnienie:

x˙=ft,x,u,xtRn,utΩ,

z danymi początkowymi x0=x0 oraz funkcjonałem kosztu zadanym jednym z poniższych wzorów

  • (L) Cu=0t1f0t,xt,utdt,zagadnienie Lagrange'a;

  • (M) Cu=gt1,xt1,zagadnienie Mayera;

  • (B) Cu=0t1f0t,xt,utdt+gt1,xt1,zagadnienie Bolzy.

Problem 6.1

Zagadnienie sterowania optymalnego (optimal control problem) polega na tym, by doprowadzić do celu sterowaniem z odpowiedniej klasy, w taki sposób, by Cu było możliwie najmniejsze.

Definicja 6.1

Niech klasa pomyślnych sterowań (successful controls) będzie oznaczona przez

Δ={uUm:t1x(t1;x0,u(.))T(t1)}

Sterowanie uUm jest optymalne (optimal), jeżeli

uΔorazCuCuuΔ. (6.2)

Dla zagadnienia Bolzy (B) (lub zagadnienia Lagrange'a (L)), zadanego sterowania u i odpowiedzi x określamy

x0t=0tf0s,xs,usds

Jeżeli u jest pomyślne, to xt1Tt1 (dla pewnego t10) i odpowiedni koszt to x0t1+gt1,xt1. Gdy u jest optymalne, to x0t1+gt1,xt1 jest najmniejsze.

Określamy n+1–wymiarowy wektor xt=x0t,xTtT oraz

ft,x=f0,fTTt,x.

W ten sposób zagadnienie Bolzy (B) (lub zagadnienie Lagrange'a (L)) można sprowadzić do zagadnienia Mayera (M) dla

x˙=fx,u, (6.3)

z

Cu=x0t1+gt1,xt1. (6.4)

Cel może być ustalony, lub nie:

  • (I) Gdy, tak jak w poprzednich rozdziałach, cel jest ustalony mamy do czynienia z zagadnieniem ustalonego punktu końcowego, Ttx1, x1 jest ustalonym punktem w Rn, t1 jest wówczas czasem dotarcia do celu x1 i nie jest ustalone (fixed–end–point (a target point is given) – free–time problem);

  • (II) Można rozpatrywać zagadnienie, gdy cel Tt=S, gdzie S jest l–wym. (l<n) gładką rozmaitością (manifold; por. [12], str. 64) w Rn — podobnie jak powyżej t1 nie jest ustalone;

  • (III) Cel może nie być określony i wtedy mamy do czynienia z zagadnieniem swobodnego punktu końcowego (free–end–point problem; a target point is not given): wtedy t1>0 jest ustalone, Tt1=Rn.

Definicja 6.2

Sterowanie u jest czaso–optymalne (time–optimal) (lub optymalno-czasowe), jeżeli jest optymalne dla funkcjonału kosztu

Cu=t1, (6.5)

gdzie t1 jest chwilą przybycia do celu 0Rn.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.