Zagadnienia

10. Zadania

Tomasz Cieślak

10.1. Sterowalność — rozdział 2

Definicja 10.1

O sterowalności regularnej mówimy, jeśli jesteśmy w stanie sterować naszym układem za pomocą każdego pojedyńczego sterowania ze zbioru możliwych sterowań.

Ćwiczenie 10.1

Pokazać, że układ sterowalny nie musi być regularnie sterowalny.

Ćwiczenie 10.2

Niech x:0,TR3 będzie dane przez x1tx2tx3t, natomiast u:0,TR2 przez u1tu2t.

Macierze A oraz B dane są odpowiednio przez 101012100 i 100101.

Czy układ

x˙=Ax+Bu (10.1)

jest sterowalny? Czy jest on regularnie sterowalny?

Ćwiczenie 10.3

Czy układ (10.1) jest regularnie sterowalny dla x:0,TR2 oraz A=1201, B=2011?

Ćwiczenie 10.4

Niech x:0,TR2 oraz u:0,T-1,13, czy wówczas układ (10.1), dla którego

A=100021101,B=101010100 jest sterowalny całkowicie oraz czy jest sterowalny lokalnie?

10.2. Obserwowalność — rozdział 3

Ćwiczenie 10.5

Niech x:0,TR2, natomiast u:0,TR. Czy układ (10.1) wraz z równaniem yt=x1+x2+u jest wówczas obserwowalny dla

A=1102,B=01?

Ćwiczenie 10.6

Na ciało o masie m, poruszające się w środowisku bez tarcia, działa zmienna w czasie siła ut. Należy zbadać obserwowalność całkowitą tego układu, gdy wielkością wyjściową jest

1) przebyta przez ciało droga,

2) prędkość tego ciała.

10.3. Sterowania bang-bang

Ćwiczenie 10.7

Niech x:0,TR2, natomiast u:0,TR. Dodatkowo niech A=1102 i B=01. Znaleźć sterowanie bang-bang układu (10.1) ze stanu początkowego x0R2 do stanu końcowego wynoszącego 0 w czasie t0.

10.4. Sterowalność ukladów nieliniowych — rozdział 4

Ćwiczenie 10.8

Rozważmy układ równań

x˙1=-2x13+2x1x2+u1,x˙2=-6x2+x12+u2,

gdzie x1t, x2t to funkcje o wartościach rzeczywistych, podobnie sterowania u1,u2 mogą przyjmować wartości rzeczywiste. Czy możliwe jest lokalne i globalne sterowanie xt=x1tx2t do 0 za pomocą wektora sterowań ut=u1tu2t?

Ćwiczenie 10.9

Rozważmy układ równań

x˙1=-ex1-2x1ex2-1+1-u12-u2,x˙2=-x12ex2-1-u1,

gdzie x1t,x2t to funkcje o wartościach rzeczywistych, podobnie sterowania u1,u2 mogą przyjmować wartości rzeczywiste. Czy możliwe jest lokalne i globalne sterowanie xt=x1tx2t do 0 za pomocą wektora sterowań ut=u1tu2t?

10.5. Zasada maksimum — rozdziały 7, 9

Ćwiczenie 10.10

Rozważyć układ o równaniach stanu

x˙1=x2+u1,x˙2=-x1+u2

gdzie wartości sterowań u1,u2 są ograniczone do zbioru -1,1. Przedyskutować sterowanie czasooptymalne przejścia od x10,x20 do 0.

Ćwiczenie 10.11

Rozważyć układ o równaniach stanu

x˙i=xi+3,x˙i+3=ui

dla i=1,2,3, gdzie wartości sterowań ui podlegają więzom 0i=13ui21. Przedyskutować sterowanie czasooptymalne przejścia od x10,x20,,x60 do 0.

Ćwiczenie 10.12

Rozważyć układ o równaniach stanu

x˙1=x2+u,x˙2=-u

gdzie wartości sterowań u1,u2 są ograniczone do zbioru -1,1. Chcemy przeprowadzić ten układ z x10,x20 do 0 minimalizując funkcjonał t0t1x1t2dt. Przedyskutować sterowanie ekstremalne.

Ćwiczenie 10.13

Następujące równania stanu oddają opis zachowania się samolotu w locie płaskim

x˙1=x2u,x˙2=Fx1,x2-u,

gdzie F jest funkcją klasy C1, sterowanie u spełnia u1. Chcemy przeprowadzić układ ze stanu x10,x20 do stanu x11,x12 minimalizując czas przejścia. Przedyskutować sterowanie ekstremalne.

Ćwiczenie 10.14

Następujące równania opisują zachowanie się rakiety w prostoliniowym locie poziomym pod wpływem sił ciężkości

x˙1=x2,x˙2=u,

gdzie sterowanie u-1,1. Chcemy minimalizować zużycie paliwa t0t11+u2tdt przy przejściu układu ze stanu x10,x20 do 0. Przedyskutować sterowanie optymalne.

Ćwiczenie 10.15

Równania ruchu prostoliniowego rakiety o stałej mocy dane są układem równań

x˙1=u,x˙2=u2.

Sterowanie jest znormalizowane przez warunek u1. Znaleźć sterowanie czasooptymalne przejścia układu ze stanu x10,x20 do stanu x11,x12, czy takie sterowania są w tym przypadku jednoznaczne?

10.6. Przykłady

Przykład 10.1

(czasooptymalny problem nawigacji, [42]). Przedyskutujmy teraz klasyczne zagadnienie teorii sterowania. Nawigujemy łódką o prędkości v, takiej że v=1 niezależnie od czasu. Woda płynie ze stałą prędkością s. Chcemy dostać się do ustalonego punktu w jak najkrótszym czasie. Zagadnienie rozpatrujemy w dwuwymiarowej płaszczyźnie x1,x2, gdzie osie są dobrane tak, by przepływ był prostopadły do jednej (x1), a równoległy do drugiej (x2). Niech kąt sterowania pomiędzy s i v będzie oznaczany przez ψ. Równania ruchu statku mają postać

x1˙=s+cosψ,x2˙=sinψ. (10.2)

Równoważnie

x1˙=s+u1,x2˙=u2, (10.3)

wraz z więzami sterowania

u12+u22=1. (10.4)

Po pierwsze, wykorzystując postać zagadnienia (10.2) można sprawdzić, że założenia twierdzenia 8.1, włącznie z założeniami 8.1, 8.2 są spełnione, czyli spośród sterowań ekstremalnych można wybrać optymalne.

Dzięki postaci (10.3), (10.4) rozważanego zagadnienia posłużymy się teraz zasadą maksimum Pontriagina dla ustalenia sterowań optymalnych.

Hamiltonian dany jest przez Hλ,x,u:=λ0+λ1s+u1+λ2u2, gdzie λ1,λ2 to współrzędne sprzężone. Mamy następujące równania Hamiltona na kostany

λi˙t=0,,i=1,2.

Zatem

λi=λi0,,i=1,2, (10.5)

i pszukujemy sterowań, przy których wyrażenie

λ10u1+λ20u2+λ0+λ10s

osiąga kres górny przy więzach (10.4). Widzimy, że kres górny osiągany jest, gdy wektory u1,u2 i λ10,λ20 mają ten sam kierunek i zwrot, czyli dla

uiu12+u22=λi0λ102+λ202,i=1,2.

W świetle (10.4) sterowanie ekstremalne jest dane wzorem

uit=λi0λ102+λ202=const,i=1,2.

Widzimy, że sterowanie ekstremalne to takie, dla którego kąt między wektorem prędkości przepływu oraz wektorem prędkości statku jest stały. Mamy zatem jakościowy wniosek, iż trajektorie sterowań ekstremalnych są liniami prostymi. Możemy automatycznie wyznaczyć ewentualny czas przejścia naszej łódki τ. Otóż

τ21-s2+2x1end-x10sτ-x1end-x102-x2end-x202=0. (10.6)

Ponadto dla danej wartości czasu τ sterowanie ekstremalne jest jednoznaczne, dane przez

u1t=x1end-x10-τsτ,u2t=x2end-x20τ.

Wyznaczmy teraz najlepsze spośród sterowań ekstremalnych, będące optymalnym sterowaniem w problemie nawigacji. W tym celu rozróżniamy trzy przypadki.

Przypadek pierwszy, s<1. Uwzględniając warunek τ0, wobec (10.6) mamy

τ=-x1end-x10s+x1end-x102+x2end-x2021-s21-s2.

Widać, że jest tylko jedno sterowanie ekstremalne, zatem istnieje tor optymalny niezależnie od punktów, w których zaczynamy i kończymy nawigację.

Przypadek drugi, s=1. Tutaj rozwiązanie (10.6) to

τ=x1end-x102+x2end-x2022x1end-x10.

Znów mamy tylko jedno sterowanie ekstremalne, zatem jednocześnie optymalne. Tym razem jednak wobec warunku τ0 od razu widać, że x1end-x10>0, co zawęża zbór punktów początkowych oraz końcowych, pomiędzy którymi możemy nawigować. Musi zachodzić x1end>x10.

Przypadek trzeci, s<1. Tutaj (10.6) ma dwa pierwiastki. Naturalnie ten o większej wielkości nie jest czasem przepływu odpowiadającym sterowaniu optymalnemu. Zatem sterowanie optymalne jest realizowalne w czasie

τ=x1end-x10s-x1end-x102+x2end-x2021-s2s2-1.

Uwzględnienie warunku τ0 prowadzi tym razem do wniosku, iż punkty x10,x20, z których optymalna nawigacja jest wykonalna zajdują się w prawej części płaszczyzny oraz w lewej na prawo od półprostych przechodzących przez punkt x10,x20, takich że ich współczynniki kierunkowe dane są przez liczby -s-112 i s-112.

Przykład 10.2

(Leitman, maksymalny zasięg rakiety o ograniczonym ciągu przy zaniedbaniu aerodynamiki) Naszym celem będzie znalezienie ekstremalnych sterowań maksymalizujących zasięg rakiety o ciągach nie przekraczających określonej wartości. Ustalając model matematyczny zjawiska przyjmiemy, że jesteśmy w stałym (ziemskim) polu grawitacyjnym. Ograniczymy się do badania lotu płaskiego. Dodatkowo zaniedbamy zjawiska aerodynamiczne. W ten sposób dostaniemy model, który z jednej strony dzięki swojej prostocie umożliwi nam analizę. Z drugiej jednak będziemy pamiętać, że chcąc dostać wyniki wartościowe z punktu widzenia praktyki uwzględnić trzeba chociażby siłę nośną jaka wpłynie na rakietę.

Rozpatrujemy proces we współrzędnych kartezjańskich x1,x2. Składowe prędkości x1˙,x2˙ będziemy często oznaczać przez x3,x4. Masę rakiety oznaczać będziemy przez x5t, jest ona funkcją czasu. Zależy od ilości paliwa w zbiorniku. Przyspieszenie ziemskie to g, natomiast u1 i u2 oznaczają kosinusy kierunkowe wektora ciągu. Prędkość wypływu masy będziemy oznaczać przez przez u3:=x3˙. Skuteczną prędkość wylotu spalin będziemy oznaczać przez c, jest to dodatnia stała.

Z jednej strony na rakietę działa ściągająca ją w dół siła grawitacji, z drugiej prowadząca ją siła ciągu równa co do wartości cu3, a działająca pod kątem Ψ do osi Ox1. Wtedy u1=cosΨ, a u2=sinΨ.

Wówczas stan układu opisany jest równaniami:

x1˙=x3,
x2˙=x4,
x3˙=cx5u1u3, (10.7)
x4˙=cx5u2u3-g, (10.8)
x5˙=-u3. (10.9)

Jak zaznaczyliśmy, cią jest ograniczony, zatem 0cu3cu3max. Mamy wobec tego pierwsze więzy

0u3u3max. (10.10)

Dodatkowo, wobec jedynki trygonometrycznej,

u12+u22=1. (10.11)

Nasze zagadnienie dotyczy przeniesienia rakiety o danych masie i prędkości początkowej z punktu x10,x20 do położenia o danej wyskości h przy użyciu ograniczonej ilości paliwa. Przy czym zależy nam na maksymalnym zasięgu. Nasze sterowanie to zmienne ui dla i=1,2,3, czyli kąt ustawienia rakiety oraz prędkość wypływu masy. Przeprowadzamy układ z punktu x10,,x50 do miejsca określonego przez

x2=x2end,x5=x5end>0.

Dodatkowo minimalizujemy funkcjonał kosztu

-0t1x3sds. (10.12)

Użyjemy zasady maksimum Pontriagina. Naszym hamiltonianem będzie

Hλ,x,u=u3cx5λ1u1+λ4u2-λ5-λ0x3+λ1x3+λ2x4-λ4g.

Wobec sformułowania zagadnienia kostany spełniają równanie

λ1˙=λ2˙=0,
λ3˙=λ0-λ1,λ4˙=-λ2,
λ5˙=cu3x52λ1u1+λ4u2.

Wykonujemy oczywiste całkowania i mamy

λ1t=λ1t1,λ2t=λ2t1,λ3t=λ1t1-λ0t1-t+λ3t1,
λ4t=λ2t1t1-t+λ4t1.

Teraz warunek (iv) twierdzenia 9.3 mówi nam, że

j=15λjt1ηj=0

dla wszystkich rzeczywistych liczb ηj,j=1,,5 takich że η2=η5=0. Mamy zatem

λ1t1=λ3t1=λ4t1=0.

A wówczas

λ1t=0,λ2t=λ2t1, (10.13)
λ3t=-λ0t1-t,λ4t=λ2t1t1-t. (10.14)

Wobec (i) twierdzenia 9.3 wiemy, że sterowanie ekstremalne jest takie, że związana z nim odpowiedź maksymalizuje hamiltonian dla dowolnego kostanu λ. Zatem musimy dobrać sterowanie u takie, aby zależna od niego część hamiltonianu

u3cx5tλ1tu1t+λ4tu2t-λ5t (10.15)

przyjmowała wartość najwięszą.

Wyznaczymy sterowania ekstremalne przy założeniu, że u3t0 dla 0tt1. Wówczas (10.15) przyjmuje wartość maksymalną w sytuacji, gdy wektor λ1,λ2 jest równoległy do u1,u2 i mają one taki sam zwrot. Dodatkowo, z (10.11) wiemy, że w takim razie

u1t=λ3tλ3t2+λ4t2

i

u2t=λ4tλ3t2+λ4t2.

Następnie (10.14) implikuje λ3t2+λ4t2=t1-t2λ02+λ2t2, natomiast (10.13) daje λ2t=λ2t1 dla każdego 0tt1. Zatem

u1t=-λ0λ02+λ22t1=const, (10.16)
u2t=λ2t1λ02+λ22t1=const. (10.17)

Czyli kąt między rakietą, a Ox1 jest stały.

Pozostaje jeszcze kwestia wielkości ciągu ekstremalnego cu3t. Nie będziemy tu jej rozważać.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.