Zagadnienia

8. Istnienie sterowania optymalnego

W tym rozdziale zajmiemy się warunkiem wystarczającym istnienia sterowania optymalnego. W całym rozdziale zakładamy, że Ω=-1,1.

8.1. Zagadnienie Mayera

Rozważamy najpierw zagadnienie Mayera (M):

x˙=ft,x,u,x0=x0,uUm (8.1)

z funkcjonałem kosztu

Cu=gt1,xt1, (8.2)

gdzie x(t1)=x(t1;x0,u(.)) oraz f i g są zadanymi funkcjami o wartościach w Rn i R1, odpowiednio.

Sformułujemy twierdzenia mówiące o istnieniu sterowania optymalnego, tzn. takiego u*Um, że warunek (6.2) jest spełniony.

Analogia: Zagadnienie minimum rzeczywistej funkcji h w obszarze DRn. Warunkiem wystarczającym (the sufficient condition) istnienia minimum jest:

D jest zbiorem zwartym (compact) i h jest funkcją ciągłą.

Wprowadzamy następujące oznaczenie

Definicja 8.1

Dla T>0 zbiór ΔTUm jest zbiorem sterowań, które prowadzą x0 do Tt1 w czasie t1, gdzie 0<t1T.

Podstawowymi założeniami są

Założenie 8.1

Funkcja

f:0,TRnΩRn

jest ciągła względem wszystkich zmiennych, różniczkowalna w sposób ciągły

względem xRn oraz spełnia

ft,x,vconst.1+x,t,x,v0,TRnΩ. (8.3)

Założenie (8.3) może byc zastąpione innym, gwarantującym jednostajne oszacowanie odpowiedzi.

Założenie 8.2

Zbiór

ft,x,Ω=ft,x,v:vΩ (8.4)

jest zbiorem wypukłym (convex) dla wszystkich t0,T, xRn.

Założenie 8.2 gwarantuje domkniętość zbioru trajektorii — por. [14].

Przy powyższych założeniach można sformułować twierdzenie o istnieniu sterowania optymalnego dla zagadnienia Mayera:

Twierdzenie 8.1 (Istnienie sterowania optymalnego dla zagadnienia Mayera)

Niech będą spełnione następujące warunki dla T>0:

  1. funkcja f spełnia założenia 8.1 oraz 8.2;

  2. funkcja g:0,TRnR1 jest ciągła;

  3. zbiór Tt jest domknięty dla każdego t0,T

  4. ΔT

Wówczas istnieje optymalne sterowanie.

Szkic dowodu

[14], str. 89.

Ogólna idea dowodu istnienia sterowania optymalnego jest następująca: bada się (skomplikowane, nieliniowe) przekształcenie

C:UmR1

i pokazuje następujące fakty

  1. istnieje ciąg uj ,,minimalizujący” z odpowiedziami xjt,

  2. pewien podciąg xjk ciągu xj zbiega do pewnej granicy x*,

  3. istnieje u*Um, dla którego x* jest odpowiedzią,

  4. odpowiedź x* spełnia wszystkie określone warunki.

Uwaga 8.1

W ogólnym przypadku nie wiemy czy ujk zbiega do u*. Dla zagadnień z liniową zależnością od sterowania można pokazać zbieżność ujk do u*.

Przykład 8.1 ([14], str. 91)

Zagadnienie optymalnego sterowania dla

x˙=x2u,x0=1,

z

gt1,xt1=-xt1.

Cel nie jest ustalony, (zagadnienie swobodnego punktu końcowego), czas dotarcia t1>0 jest ustalony.

Dla każdego ε] 0,1[ określamy sterowanie

uεt=1dlat0,1-ε0dlat>1-ε.

Wówczas odpowiedź

xεt=11-tdlat 0,1-ε1εdlat>1-ε..

Jeżeli t1>1, to xεt1=1ε. Zatem

gt1,xt1=-1ε.

Nie ma więc sterowania optymalnego (ε może być dowolnie małe). To pokazuje, że oszacowanie (8.3) w założeniu 8.1, lub inne gwarantujące jednostajne oszacowanie, jest potrzebne.

Przykład 8.2 ([14], str. 92)

Zagadnienie optymalnego sterowania dla

x˙=u,x0=1,

z

gt1,xt1=xt1-1signxt1.

Infimium g to -1, ale nie jest nigdy osiągane. Funkcja g nie jest ciągła!

Założenie o wypukłości 8.2 można odrzucić dla układu liniowego względem stanu

x˙=Atx+bt,u.
Twierdzenie 8.2

Niech będą spełnione następujące warunki dla T>0:

  1. At i bt,v są macierzami n×n i n×1, odpowiednio, dla t0,T, vΩ oraz A, b są ciągłe;

  2. funkcja g:0,TRnR1 jest ciągła;

  3. zbiór Tt jest domknięty dla każdego t0,T

  4. ΔT

Wówczas istnieje optymalne sterowanie.

Dowód: [14], str. 92.

8.2. Zagadnienie Bolzy

Dla zagadnienia Bolzy (B) (lub zagadnienia Lagrange'a (L)) określamy

x0t=0tf0s,xs,usds,

wprowadzamy n+1–wymiarowy wektor

xt=x0t,xTtT

oraz

ft,x=f0,fTTt,x.

W ten sposób sprowadzamy zagadnienie Bolzy (B) do zagadnienia Mayera (M) dla

x˙=fx,u, (8.5)

z Cu=x0t1+gt1,xt1.

Twierdzenie o istnieniu sterowania optymalnego dla zagadnienia Bolzy wynika z twierdzenia 8.1. Założenie 8.2 jest zastąpione następującym:

Założenie 8.3

Zbiór

f(t,x,Ω)={(f0(t,x,v),fT(t,x,v))T,vΩ} (8.6)

jest zbiorem wypukłym w Rn+1 dla wszystkich 0tT, xRn.

Można sformułować twierdzenie o istnieniu sterowania optymalnego dla zagadnienia Bolzy:

Twierdzenie 8.3 (Istnienie sterowania optymalnego dla zagadnienia Bolzy)

Niech będą spełnione następujące warunki dla T>0:

  1. funkcja f spełnia założenie 8.1;

  2. funkcje f0:0,TRnΩR1 oraz g:0,TRnR1 są ciągłe;

  3. jest spełniony założenie wypukłości 8.3;

  4. zbiór Tt jest domknięty dla każdego t0,T

  5. ΔT

Wówczas istnieje optymalne sterowanie.

Dowód twierdzenia 8.3: [14], str. 94; [31], str. 92–95.

Założenie 8.3 o wypukłości ft,x,Ω dotyczy geometrii związku pomiędzy f0 i f, a nie odnosi się do wypukłości f0 i f.

Przykład 8.3 ([31], str. 91)
x˙=u12,Cu=0t1us12xsds,
ft,x,Ω=v12x,v12:-1v1

jest wypukły, choć f nie jest funkcją wypukłą.

Przykład 8.4 ([31], str. 91)
x˙=u,Cu=0t1us2ds,
ft,x,Ω=v2,v:-1v1

nie jest wypukły, choć f jest liniowa, a f0 — wypukła.

Założenie 8.1 jest istotne. W poniższym przykładzie nieliniowość względem zmiennej x2 powoduje nieistnienie optymalnego sterowania.

Przykład 8.5 ([31], str. 83)

Niech n=2, m=1,

x=x1x2,x˙1=1,x˙2=x2+12u,x0=-2
Cu=0t1f0t,x,udt
f0t,x,u= 1gdyx2<01x2+12gdyx20

Cel jest ustalony Tt0.

Mamy x1t=t-2, zatem musi być t1=2. Dla u+1 mamy x1t=t-2, x2t=t1-t, 0t<1, więc nie jest to odpowiedź pomyślna. Dla α] 0,1[ określmy

uαt=αdla 0t1-αdla 1<t2

Odpowiedzią (pomyślną) jest

xα1t=t-2,xα2t=αt1-αtdla 0t1α2-t1-2-tαdla 1t2

Rzeczywiście: na 0t1:

dx21+x22=αdt-1+x2-1-2x2=αt
-11+x2+11-2=αtx2=αt1-αt

Na 1<t2: warunek początkowy dla t=1 ma postać x2=α1-α

-1+x2-1α1-αx2=-αt+α
-11+x2+11+α1-α=-αt-1-11+x2=2α-1-αt
x2=-αt-21+αt-2
Cuα=0t111+x22dt=0111+αt1-αt2dt+1211+α2-t1-α2-t2dt=
=01(αt)2dt+12(1-(2-t)α)2=α23+12((1-2α)+αt)2dt=
=8α23+1-2α2+31-2αα.

Gdy α1 funkcja xα2t zbiega do pewnej funkcji osobliwej w t=1.

Ponadto Cuα23 gdy α1. Zatem optymalne sterowanie u* powinno spełniać warunek

Cu*23.

Pokażemy, że każde pomyślne sterowanie daje koszt >23.

Dla pomyślnego sterowania mamy x20=x22=0 oraz bezpośrednio z równania, dla -1ut1 otrzymujemy

-x2t+12x˙2tx2t+12.

Stąd, z nierówności po prawej stronie (całkując od 0 do t<1),

-1x2t+1+1t,czyli1x2t+11-t,

dla 0t<1.

Z nierówności po lewej stronie (całkując od t1 do 2),

-2+t-1+1x2+1,czylit-11x2+1,

dla 1t2.

Ale pomyślna odpowiedź musi być ograniczona (jako funkcja ciągła na zbiorze zwartym), więc pierwsza nierówność jest ostra. Zatem

Cu>011-t2dt+12t-12dt=23.

Wniosek: nie istnieje optymalne sterowanie!

Następujący przykład pokazuje, ze nawet dla ograniczonych odpowiedzi, zależność od sterowania u może powodować nieistnienie optymalnego sterowania. Potrzebne jest więc dodatkowe założenie, n.p. o wypukłości 8.3.

Przykład 8.6 ([31], str. 85)

Niech n=3, m=1,

x=x1x2x3,x˙=sin2πucos2πu-1,x0=001.
Cu=0t1x1t2+x2t2dt.

Cel jest ustalony Tt0.

Mamy x3t=1-t, zatem musi być t1=1

Każda odpowiedź spełnia x˙c, a zatem xtx0+ctc+1 dla 0t1.

Skonstruujemy ciąg sterowań ujjN, t.ż. Cuj0 dla j.

Ponieważ zawsze Cu0, każde sterowanie optymalne u* musiałoby spełniać Cu*=0

To prowadzi do sprzeczności, gdyż wtedy

x*1t=x*2t=0,p.w.,

a zatem x˙*1t=x˙*2t=0, co jest niemożliwe, gdyż

x˙*1t=sin2πu*t,x˙*2t=cos2πu*t.

W.w. ciąg sterowań ma postać ujt=jt-jt, j=1,2,.

Wówczas

sin2πujt=sin2πjt,cos2πujt=cos2πjt.

Odpowiedź ma postać

xj1t=1-cos2πjt2πj,xj2t=sin2πjt2πj,xj3t=1-t.

Mamy więc

Cuj=0121-cos2πjtdt2πj2=12π2j2,

czyli rzeczywiście Cuj0 dla j.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.