Współrzędne wektora oznaczamy , , , , :
Dla odróżnienia naturalne potęgi oznaczamy jako , .
Dla uproszczenia notacji element zerowy w każdej , dla , oznaczamy przez .
Niech , będzie zadanym zbiorem. Zbiór ten będziemy nazywali zbiorem parametrów sterujących.
Przez większą część wykładu, będziemy przyjmować, że , choć omówimy kilkakrotnie sytuacje . Jeżeli nie będzie podane inaczej, będziemy zakładali, że . Niech
Każdy element będziemy nazywali sterowaniem (control) (lub strategią). Dla każdego sterowania istnieje odpowiedni odcinek , na którym jest określone.
Dla każdego określamy rodzinę zbiorów celu (target sets) , gdzie jest zbiorem domkniętym w .
Rozpatrujemy zagadnienie początkowe dla równania różniczkowego zwyczajnego
(2.1) |
gdzie , oraz , , jest poszukiwanym sterowaniem.
Powyższe zagadnienie dotyczy sterowania w pętli otwartej (control in open–loop form), . Można też rozpatrywać sterowanie w zamkniętej pętli (control in closed–loop form), gdy poszukuje się odwzorowania (zwanego sprzężeniem zwrotnym (feedback) dla RRZ
(2.2) |
Sprowadzenie do nazywa się zagadnieniem syntezy (synthesis) sterowania.
Możliwe jest podejście alternatywne w języku inkluzji różniczkowej (differential inclusion)
(2.3) |
gdzie
Funkcja
jest ciągła wraz z pochodnymi cząstkowymi , dla , na zbiorze .
Założenie 2.1 gwarantuje lokalne istnienie i jednoznaczność rozwiązania dla — tw. Picarda–Lindelöfa — por. [14, 17, 23]. Ponieważ jednak funkcja jest jedynie funkcją mierzalną i ograniczoną, więc prawa strona RRZ (2.1) jest tylko mierzalna i ograniczona jako funkcja dla każdego . Zatem rozwiązanie rozumiane jest jako absolutnie ciągła funkcja spełniająca RRZ (2.1) prawie wszędzie — por. [14, 17, 23].
Założenie 2.1 jest mocniejsze, niż jest to jest potrzebne w niektórych wynikach. Do istnienia i jednoznaczności wystarczy Lipschitz–owskość, ciągłość też można osłabić.
Dla zadanego sterowania rozwiązanie RRZ (2.1) nazywa się odpowiedzią na (response to) — oznaczamy .
Zagadnienie sterowania (control problem): dla zadanego znaleźć oraz , t.ż. odpowiednia odpowiedź .
Jeżeli takie da się znaleźć, to mówimy, że sterowanie prowadzi do celu (control steers to the target ), lub że jest sterowaniem pomyślnym (successful control).
Zagadnienie sterowalności (controllability problem): określić dane początkowe, które można doprowadzić do celu (tzn. dane początkowe, które są sterowalne (controllable)), czyli określić te dane początkowe, dla których istnieje pomyślne sterowanie .
Zbiór sterowalny (controllable set) , gdzie
(2.4) |
jest zbiorem tych stanów, które mogą być doprowadzone do celu w chwili .
Będziemy badali zbiór , oraz określimy jak zmienia się wraz z zawężeniem klasy sterowań.
Jeżeli , to sterowalność jest całkowita (completely controllable). Natomiast przypadek nazywamy sterowalnością lokalną (locally controllable).
Można rozważać węższe klasy sterowań (por. [31]):
Klasa sterowań kawałkami stałych (piecewise constant controls) :
, jeżeli jest kawałkami stała na , czyli istnieją , t. ż, jest stała na każdym przedziale ;
Klasa sterowań gładkich i niezmieniających się nagle (smooth controls that do not change rapidly) :
, jeżeli jest absolutnie ciągła na , oraz p.w. na ;
Klasa sterowań ,,bang–bang” (bang–bang controls) :
, jeżeli dla p.k. oraz każdego ;
Klasa sterowań bang–bang kawałkami stałych:
Analogicznie do określamy zbiory sterowalne , , , w odniesieniu do odpowiednich klas sterowań.
Rozpatrywać będziemy ogólne autonomiczne (autonomous) zagadnienie nieliniowe (NLA)
(2.5) |
z warunkiem początkowym
i celem .
Zakładamy, że funkcja jest klasy na oraz .
Stąd dla zadanego warunku początkowego odpowiedź istnieje (przynajmniej) lokalnie w czasie i jest jednoznaczna.
Będziemy również rozpatrywać zagadnienie liniowe (LA)
(2.6) |
gdzie i są stałymi macierzami, i , odpowiednio,
z warunkiem początkowym
i celem .
Macierz ma więc postać:
Dla (NLA):
Jeżeli prowadzi do na z odpowiedzią (tzn. ), to prowadzi do na z odpowiedzią .
Jeżeli jest odpowiedzią na prowadzącą do , to jest odpowiedzią na dla równania (z odwróconym czasem)
(2.7) |
prowadzącą do .
1. Mamy
dla p.w. . Ponadto
2. Mamy
dla p.w. . Ponadto
Zagadnienie (NLA) jest autonomiczne w tym sensie, że punkt 1 lematu 2.1 jest spełniony.
Zbiór jest łukowo spójny (arcwise connected), jeżeli każde dwa punkty zbioru mogą być połączone łukiem (homeomorficznym obrazem odcinka) całkowicie zawartym w zbiorze.
Dla (NLA):
jeżeli oraz jest punktem trajektorii łączącej z celem , to ;
zbiór jest łukowo spójny;
jeżeli , to ;
jest otwarty wtedy i tylko wtedy, gdy .
1. Niech . Istnieje wówczas pomyślne sterowanie oraz odpowiedź , t.ż. dla pewnego . Dla chcemy pokazać, że . Sterowanie , określone na jest pomyślne z odpowiedzią :
a zatem .
2. Jeżeli , są w , to istnieją sterowania i oraz odpowiedzi , , t.ż.
Z 1. każdy punkt obu trajektorii jest w . Zatem istnieje łuk całkowicie zawarty w łączący punkty , .
3. Niech . Zatem istnieje sterowanie , t.ż. dla odpowiedzi . Dla określmy sterowanie
Z warunku wynika, że odpowiedż spełnia
a zatem prowadzi do celu w czasie , czyli .
4. Implikacja ,,” jest oczywista, gdyż .
Pokażemy implikację ,,”. Jeżeli , to istnieje otwarta kula o środku w i promieniu , t.ż. . Niech . Chcemy pokazać, że istnieje otwarta kula o środku w całkowicie zawarta w . Ponieważ , więc istnieje sterowanie oraz odpowiedź , t.ż. dla pewnego . Funkcja jest klasy , więc z ciągłej zależności od danych początkowych wynika istnienie otwartej kuli , , t.ż. dla każdego :
Istnieje więc sterowanie , które prowadzi do w czasie .
Zatem dla każdego istnieje sterowanie ,
(2.8) |
które prowadzi do . Zatem .
∎Można pokazać, że są prawdziwe twierdzenia analogiczne do twierdzenia 2.1 dla klas oraz . Dla oraz punkty 1, 2 i 4 wynikają bezpośrednio. Natomiast punkt 3 dla wynika z zasady bang–bang — por. twierdzenie 5.1.
Argumentu w dowodzie ,,” punktu 4 twierdzenia 2.1 nie można przenieść na dla , gdyż sterowanie (2.8) określone jest na . Najczęściej brzeg zbioru należy do tego zbioru, więc nie jest otwarty.
Rozważymy teraz zagadnienie liniowe (LA). Rozwiązanie (LA) ma postać
(2.9) |
Mamy:
(2.10) |
Zbiór jest symetryczny (symmetric), gdy .
Dla (LA): jest symetryczny oraz wypukły.
Mamy (2.10). Jeżeli dla , to dla . Zatem jest symetryczny.
Jeżeli ze sterowaniem i ze sterowaniem , to ze sterowaniem . Zatem jest wypukły. Nie wynika z tego od razu, że jest wypukły (suma zbiorów wypukłych nie musi być wypukła). Jednakże stosując argument z dowodu punktu 3 twierdzenia 2.1 pokazujemy, że jest wypukły.
∎Twierdzenie 2.2 można uogólnić na sytuację, gdy , są ciągłymi funkcjami. W dowodzie korzysta się z następujących własności klasy sterowań: symetryczności, wypukłości i możliwości przyjmowania wartości . Twierdzenie 2.2 zachodzi więc dla klas i , ale nie zachodzi dla i , które nie są wypukłe i nie zawierają . W rozdziale 5 (twierdzenie 5.1) pokażemy jednak zasadę ,,bang–bang” dla (LA): . Z zasady ,,bang–bang” wynika, że
a zatem z wypukłości wynika wypukłość .
Następujące przykłady pokazują, że może nie zawierać pewnego otoczenia celu, czyli, że nie jest spełniona nawet lokalna sterowalność.
Niech , ,
(2.11) |
Zatem
Rozwiązanie spełniające ma postać
(2.12) |
Stąd
czyli jest osią .
Niech , ,
(2.13) |
Zatem
Rozwiązanie spełniające ma postać
(2.14) |
Jeżeli , to
oraz
bo .
Stąd
Przykłady 2.1 i 2.2 pokazują, że potrzebne są pewne warunki na macierze i . Warunki te zostaną wyrażone przez macierz sterowalności.
Dla (LA) wprowadzamy macierz sterowalności (controllability matrix):
W dowodzie odpowiedniego twierdzenia (tw. 2.4) korzysta się z pojęcia hiperpłaszczyzny:
–wymiarową hiperpłaszczyzną (hyperplane) w nazywamy zbiór
gdzie , oraz są zadane, oznacza iloczyn skalarny wektorów i .
Istotną rolę odgrywa tu wniosek z twierdzenia Mazura (geometrycznej wersji twierdzenia Hahna-Banacha) - twierdzenie o hiperpłaszczyźnie podpierającej — por. [30], str. 190.
Jeżeli , gdzie jest wypukłym zbiorem, t.ż. , to istnieje hiperpłaszczyzna podpierająca w (supporting hyperplane through ), tzn. leży po jednej stronie :
(2.15) |
dla pewnego .
Dla (LA): Następujące trzy warunki są równoważne
(a)
(b) (lokalna sterowalność)
(c) — otwarty w
Zauważmy, że równoważność wynika z twierdzenia 2.1.
1. Dowód , czyli . Załóżmy więc , czyli .
Wówczas istnieje wektor , , prostopadły do każdej kolumny macierzy , czyli
Stąd
Niech będzie wielomianem charakterystycznym macierzy
gdzie jest macierzą jednostkową .
Mamy (twierdzenie Cayleya–Hamiltona)
Stąd
a zatem
Podobnie
i
Powtarzając to postępowanie
Stąd
dla każdego .
Mamy (2.10). Stąd
czyli istnieje niezerowy wektor , który jest prostopadły do każdego . Stąd wynika, że leży w hiperpłaszczyźnie prostopadłej do dla każdego . Zatem leży w hiperpłaszczyźnie prostopadłej do i
Otrzymujemy więc, że , czyli .
2. Dowód , czyli . Załóżmy więc , czyli . Stąd dla każdego : , gdyż (nie istnieje kula nie istnieje kula dla każdego ).
Ale oraz jest zbiorem wypukłym dla każdego (por. dowód twierdzenia 2.2). Zatem istnieje hiperpłaszczyzna przechodząca przez , taka że leży po jednej stronie tej hiperpłaszczyzny (twierdzenie 2.3), tzn. istnieje wektor , , taki że
Stąd
Z lematu 2.2 poniżej wynika, że
Wstawiając otrzymujemy . Następnie różniczkując względem i wstawiając otrzymujemy
Zatem niezerowy wektor jest prostopadły do każdej kolumny i , czyli .
∎Jeżeli
(2.16) |
to
Jeżeli , to . Zatem z (2.16) wynika, że
Niech . Jeżeli , to istnieje , t.ż. . Istnieje wtedy przedział , t.ż. oraz na . Określmy sterowanie
Wówczas mamy
Otrzymujemy więc sprzeczność z założeniem .
∎Twierdzenie 2.4 można powtórzyć dla klas , , gdyż dla tych klas ,,przechodzi” lemat 2.2.
W dowodzie twierdzenia 2.4 pokazaliśmy, że
istnieje hiperpłaszczyzna w , t.ż. leży w tej hiperpłaszczyźnie .
Ponadto
wtedy i tylko wtedy, gdy
(2.17) |
jako funkcja zmiennej .
Układ (LA) spełniający (2.17) nazywa się właściwy (proper).
(LA) jest właściwy wtedy i tylko wtedy, gdy
W rozpatrywanym tutaj przypadku warunek nie gwarantuje całkowitej sterowalności , jak pokazuje prosty przykład
Niech . Rozważmy
Jeżeli (lub ), to odpowiedź na dowolne sterowanie rośnie (maleje) wraz z , a więc żadne sterowanie nie jest pomyślne. Mamy , choć .
Jednakże przy dodatkowym warunku otrzymujemy:
Dla (LA) następujące dwa warunki są równoważne:
(a) oraz dla każdej wartości własnej macierzy
(b) .
1. Dowód . Załóżmy, że oraz dla każdej wartości własnej macierzy . Gdyby istniał , t.ż. , to z wypukłości (twierdzenie 2.2) oraz twierdzenia 2.3 wynikałoby, że mógłby być odseparowany od hiperpłaszczyzną, tzn. istniałby , , t.ż.
(2.18) |
dla pewnego .
Pokażemy, że dla każdego oraz każdego , istnieje oraz , t.ż.
(2.19) |
co oznacza sprzeczność z (2.18), a zatem sprzeczność z założeniem istnienia , t.ż. , a więc dowodzi prawdziwości .
Niech
Z założenia, że oraz uwagi 2.3 wynika, że (LA) jest właściwy, czyli
(2.20) |
Określmy sterowanie
Wówczas mamy
Pokażemy, że
(2.21) |
a zatem istnienie takiego , że (2.19) jest spełniona.
Załóżmy, że (2.21) nie jest spełniona, czyli
Wówczas spełnia
(2.22) |
Jeżeli jest wielomianem charakterystycznym macierzy , to . Stąd
Zatem funkcja spełnia liniowy układ równań różniczkowych ze stałymi współczynnikami
Rozwiązaniem tego równania jest pewna liniowa kombinacja wyrazów postaci
gdzie jest pierwiastkiem równania
Zatem , lub , gdzie jest wartością własną macierzy . Z założenia wynika, że
co jest sprzeczne z (2.22). To kończy dowód implikacji .
2. Dowód . Pokażemy, że
,
lub
dla pewnej wartości własnej macierzy
implikuje .
Jeżeli , to z wniosku 2.2 wynika, że .
Niech , dla pewnej wartości własnej macierzy . Jeżeli jest (lewym) wektorem własnym (eigenvector), to
Stąd
a zatem
Mamy
Wówczas
(2.23) |
Mamy
(2.24) |
Z (2.23) wynika, że prawa strona (2.24) jest ograniczona jednostajnie względem . Zatem
dla pewnego . Czyli leży po jednej stronie pewnej hiperpłaszczyzny, a więc . To kończy dowód .
∎Czy twierdzenie 2.5 jest prawdziwe dla klas , , oraz ? Dla można zastosować zasadę bang–bang — por. twierdzenie 5.1.
Jeżeli oraz , dla pewnej wartości własnej macierzy , to .
Mamy
i układ jest właściwy. Jedyną (podwójną) wartością własną macierzy jest . Z twierdzenia 2.5 wynika, że , czyli każdy stan początkowy może być doprowadzony do celu .
W przeciwieństwie do przypadku klasy sterowań o wartościach w , rozważanego w twierdzeniu 2.5, w przypadku sterowań o wartościach w okazuje się, że warunek jest równoważny całkowitej sterowalności. W przypadku klasę sterowań definiujemy jako
Dla uproszczenia notacji odpowiedni zbiór sterowalny bedziemy oznaczali jako , czyli tak samo, jak w przypadku (sens będzie wynikał z kontekstu).
Wówczas można sformułować następujące twierdzenie:
Dla (LA) i klasy sterowań następujące dwa warunki są równoważne:
(a) ,
(b) .
1. Dowód , czyli jest identyczny jak punkt 1 dowodu twierdzenia 2.4.
2. Dowód . Załóżmy, że . Z twierdzenia 2.4 wynika, że istnieje otwarta kula o środku w i promieniu , t.ż. . Dla dowolnego istnieje stała , t.ż.
czyli istnieje oraz , t.ż.
Stąd
gdzie , co kończy dowód.
∎Okazuje się (por. [31], str. 37), że dla klasy sterowań ,,prawie wszystkie” układy (LA) są lokalnie sterowalne (tzn. spełniają ), a dla klasy sterowań ,,prawie wszystkie” układy (LA) są całkowicie sterowalne (tzn. spełniają ).
Odległość między dwoma układami (LA): () i (), czyli i , odpowiednio, określamy jako
gdzie i analogicznie .
Zatem dwa układy są bliskie, jeżeli elementy odpowiednich macierzy są bliskie.
Zbiór wszystkich sterowalnych (LA) jest otwarty i gęsty w przestrzeni metrycznej wszystkich (LA), gdzie ,,sterowalność” rozumiemy w sensie
całkowitej sterowalności dla ,
lokalnej sterowalności dla .
Z twierdzenia 2.4, lub twierdzenia 2.6, w obu rozważanych przypadkach, sterowalność jest równoważna warunkowi . Ten warunek oznacza, że istnieje ()–macierz , będąca podmacierzą , t.ż. .
Jeżeli układ () jest bliski (), to odpowiednia podmacierz macierzy jest bliska odpowiedniej podmacierzy macierzy . Jeżeli , to dla — małego. Zatem układy sterowalne są zbiorem otwartym.
Załóżmy, że nie jest sterowalny, tzn. , gdzie . Chcemy pokazać istnienie układu () — bliskiego układowi () — t.ż. , dla pewnej podmacierzy macierzy .
może być traktowany jako wielomian elementów macierzy i , gdzie . Mamy
dla – elementów macierzy , .
Wystarczy pokazać, że: dla niezerowego wielomianu , t.ż. , istnieje — dowolnie bliskie , t.ż.
Powyższe zdanie wynika z faktu, że niezerowy wielomian zmiennych nie może znikać w żadnej –wymiarowej kuli: gdyby znikał, to biorąc pochodne cząstkowe pokazalibyśmy, że wszystkie współczynniki się zerują.
∎Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.