Zagadnienia

14.1 Algorytm Zoutendijk'a dla ograniczeń liniowych
14.2 Algorytm Zoutendijk'a dla ograniczeń nieliniowych
14.3 Modyfikacja Topkis'a-Veinott'a
14.4 Podsumowanie
14.5 Zadania

14. Metody optymalizacji z ograniczeniami

W tym rozdziale skupimy się na metodach numerycznych rozwiązywania problemów optymalizacyjnych z ograniczeniami nierównościowymi. Pokażemy problemy z zastosowaniem metody największego spadku i jej naiwnych modyfikacji oraz zaproponujemy skuteczne aczkolwiek bardziej skomplikowane podejście.

Problem optymalizacyjny na następującą postać:

f⁢x→min,gi⁢x≤0,⁢i=1,…,m,x∈Rn,

(14.1)

gdzie f,g1,…,gm:Rn→R. A zatem zbiór punktów dopuszczalnych jest zadany przez

W=x∈Rn:g1⁢x≤0,…,gm⁢x≤0.

(14.2)

W rozważaniach tego rozdziału będziemy odwoływać się często do pojęcia zbioru kierunków dopuszczalnych zdefiniowanego następująco

A⁢x=d∈Rn:⁢d≠0 oraz istnieje λ*>0 taka że x+λ⁢d∈W ⁢∀⁢λ∈0,λ*.

14.1. Algorytm Zoutendijk'a dla ograniczeń liniowych

Rozważmy bardzo prostą modyfikację algorytmu największego spadku. Otóż jeśli punkt znajduje się wewnątrz zbioru W, to istnieje możliwość poruszania się wzdłuż kierunku największego spadku aż do uderzenia w brzeg. Jeśli punkt już jest na brzegu, to naturalne jest wybrać taki kierunek ruchu, by pozwalał on na jak największy spadek wartości funkcji celu a jednocześnie na ruch w jego kierunku. Kierunek taki nazywamy dopuszczalnym kierunkiem spadku w punkcie x i definiujemy jako kierunek dopuszczalny d, taki że D⁢f⁢x⁢d<0.

Okazuje się, że pomysł ten działa całkiem dobrze, jeśli ograniczenia są liniowe i nosi nazwę algorytm Zoutendijk'a. Przypomnijmy, że liniowość ograniczeń znacznie upraszcza problem, co pozwoli nam na rozszerzenie analizy w tym podrozdziale do zagadnień z ograniczeniami nierównościowymi i równościowymi, tzn.

f⁢x→min,A⁢x≤b,Q⁢x=a,x∈Rn.

(14.3)

Tutaj A jest macierzą m×n, Q jest macierzą l×n, zaś b∈Rm i a∈Rl. Poniższy lemat charakteryzuje zbiór dopuszczalnych kierunków spadku. Jego dowód pozostawiamy jako ćwiczenie.

Lemat 14.1

Niech x będzie punktem dopuszczalnym dla zagadnienia (14.3) i załóżmy, że macierz A i wektor b mogą być podzielone w zależności od aktywności ograniczeń na A1, A2 i b1,b2 (z dokładnością do przenumerowania ograniczeń), tzn. A1⁢x=b1 oraz A2⁢x<b2. Wektor d∈Rn jest kierunkiem dopuszczalnym w x, jeśli A1⁢d≤b1 oraz Q⁢d=0. Jeśli, ponadto, D⁢f⁢x⁢d<0, to d jest dopuszczalnym kierunkiem spadku.

Jak wybrać najlepszy dopuszczalny kierunek spadku w punkcie x? Najprościej byłoby rozwiązać zagadnienie

D⁢f⁢x⁢d→min,⁢d∈A⁢x,⁢d≤1.

(14.4)

Ograniczenie na normę wektora d jest konieczne. Jeśli byśmy je opuścili, to dla dowolnego dopuszczalnego kierunku spadku d jego wielokrotność λ⁢d, λ>0, jest również kierunkiem spadku. Co więcej, D⁢f⁢x⁢d<0, czyli limλ→∞⁡D⁢f⁢x⁢λ⁢d=-∞ i problem powyższy nie ma jednoznacznego rozwiązania.

Korzystając z lematu 14.1 powyższe zagadnienie (14.4) można wyrazić jako

D⁢f⁢x⁢d→min,A1⁢d≤0,Q⁢d=0,dT⁢d≤1.

Zauważmy, że jedyna nieliniowość związana jest z ograniczeniem na normę wektora d. W praktyce, bez większych strat dla jakości algorytmu, zamienia się ją na ograniczenia liniowe, które pozwalają skorzystać z szybkich metod optymalizacji liniowej (np. algorytmu sympleks – patrz monografie Bazaraa, Jarvis'a, Shetty [2], Gass'a [8] lub Luenberger'a [9]). Najpopularniejsze są następujące dwa zamienniki normy euklidesowej d:

norma l∞, tzn. supi⁡di≤1, co zapisuje się jako

-1≤di≤1,⁢i=1,…,n.
norma l1, tzn. ∑idi≤1, co zapisuje się jako

∑i=1nηi≤1,-ηi≤di≤ηi,⁢i=1,…,n,

gdzie η1,…,ηn są nowymi zmiennymi (pomocniczymi).

Oto pełny algorytm:

Inicjalizacja: Wybierz punkt początkowy x0.
Krok k-ty:
1. Wybierz kierunek ruchu dk jako rozwiązanie problemu optymalizacyjnego:
  
  D⁢f⁢x⁢d→min,A1⁢d≤0,Q⁢d=0,-1≤di≤1,⁢i=1,…,n. (14.5)
2. Jeśli dk=0, to zakończ działanie algorytmu. Punkt xk spełnia warunek konieczny pierwszego rzędu. W przeciwnym przypadku kontynuuj.
3. Połóż αk=argminα∈0,Ak⁢f⁢xk+α⁢dk, gdzie Ak jest największą liczbą o tej własności, że odcinek łączący xk i xk+Ak⁢dk zawarty jest w W.
4. Połóż xk+1=xk+αk⁢dk.

Przyjrzyjmy się jeszcze raz wyborowi kierunku dk. Wektor d=0 spełnia wszystkie ograniczenia, a zatem optymalna wartość funkcji celu D⁢f⁢x⁢dk jest co najwyżej równa zeru. Wówczas punkt xk spełnia warunek konieczny pierwszego rzędu, czego dowodzimy w poniższym lemacie.

Lemat 14.2

W xk spełniony jest warunek konieczny pierwszego rzędu wtw, gdy dk=0.

Dowód

Przypomnijmy najpierw notację. Przez D⁢xk oznaczamy stożek kierunków spadku, tzn.

D⁢xk=d∈Rn:⁢D⁢f⁢xk⁢d<0,

zaś przez Tl⁢i⁢n⁢xk – stożek kierunków stycznych dla ograniczeń zlinearyzowanych w punkcie xk, który dla ograniczeń liniowych danych jest wzorem

Tl⁢i⁢n⁢xk=d∈Rn:⁢A1⁢d≤0,⁢Q⁢d=0.

Zauważmy, że dk=0 jest rozwiązaniem zagadnienia (14.5) wtw, gdy D⁢xk∩Tl⁢i⁢n⁢xk=∅. Postępując dalej jak w dowodzie twierdzenia 8.1 dostajemy implikację w lewo. Implikacja w drugą stronę wynika faktu, że na mocy lematu Farkasa, lemat 5.3, istnienie rozwiązania (8.5) pociąga brak rozwiązania (8.4), co jest równoważne temu, że D⁢xk∩Tl⁢i⁢n⁢xk=∅.

∎

14.2. Algorytm Zoutendijk'a dla ograniczeń nieliniowych

Zastanówmy się, czy algorytm Zoutendijk'a działa równie dobrze dla ograniczeń nieliniowych:

Inicjalizacja: Wybierz punkt początkowy x0.
Krok k-ty:
1. Wybierz kierunek ruchu dk jako rozwiązanie problemu optymalizacyjnego:
  
  D⁢f⁢x⁢d→min,⁢d∈A⁢x,⁢d≤1.
2. Jeśli dk=0, to zakończ działanie algorytmu. Punkt xk spełnia warunek konieczny pierwszego rzędu. W przeciwnym przypadku kontynuuj.
3. Połóż αk=argminα∈0,Ak⁢f⁢xk+α⁢dk, gdzie Ak jest największą liczbą o tej własności, że odcinek łączący xk i xk+Ak⁢dk zawarty jest w W.
4. Połóż xk+1=xk+αk⁢dk.

Rys. 14.1. Ilustracja szybkiej zbieżności metody największego spadku.

Rys. 14.2. Ilustracja zakleszczenia metody największego spadku dla zbioru niewypukłego.

Rys. 14.3. Ilustracja problemu ze znalezieniem kierunku dopuszczalnego największego spadku.

W poniższych przykładach rozważamy minimalizowanie funkcji f⁢x1,x2=-2⁢x1-x2 na różnych zbiorach. Punkt minimum oznaczamy zawsze przez x¯. Na rysunku 14.1 widać, że już w kroku drugim osiągamy minimum. Jeśli zbiór W nie jest wypukły algorytm prowadzi nas w kozi róg, z którego już nie możemy się uwolnić, patrz 14.2. Jest to niestety cecha wszystkich algorytmów tego typu, więc musimy zawsze wymagać, by zbiór punktów dopuszczalnych był wypukły. Czy to już wystarczy? Niestety nie. Na rysunku 14.3 możemy zobaczyć, że nawet w przypadku zbioru wypukłego algorytm nie działa. Problem wyboru kierunku d1 nie ma rozwiązania, gdyż zbiór D⁢x1 nie jest domknięty. Intuicyjnie łatwo jest podać rozwiązanie tego problemu. Należy wybrać taki kierunek dk, aby nie tylko spadek był jak największy, ale również, żeby dość duży fragment półprostej poprowadzonej w tym kierunku zawierał się w zbiorze W. Co więcej, zależy nam na prostocie, czytaj liniowości, zagadnienia optymalizacyjnego wyznaczającego kierunek dk. Rozwiązanie podpowiada następujący lemat, którego dowód pozostawiamy jako ćwiczenie.

Lemat 14.3

Niech x będzie punktem dopuszczalnym. Jeśli f,gi, i∈I⁢x są różniczkowalne w x i gi, i∉I⁢x są ciągłe w x, to kierunek d∈Rn spełniający D⁢f⁢x⁢d<0 i D⁢gi⁢x⁢d<0, i∈I⁢x, jest dopuszczalnym kierunkiem spadku.

Lemat powyższy podaje tylko warunek dostateczny. Łatwo znaleźć przykład zagadnienia optymalizacyjnego z ograniczeniami nierównościowymi, dla którego jeden z dopuszczalnym kierunków spadku nie spełnia założeń lematu (ćwiczenie 14.5).

Znalezienie wektora d∈Rn spełniającego D⁢f⁢x⁢d<0 i D⁢gi⁢x⁢d<0, i∈I⁢x sprowadza się do rozwiązania zagadnienia

max{Df(x)d,Dgi(x)d,i∈I(x)}→min,-1≤dk≤1,⁢k=1,…,n.

Trudną w implementacji funkcję celu można sprowadzić do znacznie prostszej formy problemu optymalizacji liniowej:

η→min,D⁢f⁢x⁢d≤η,D⁢gi⁢x⁢d≤η,⁢i∈I⁢x,-1≤dk≤1,⁢k=1,…,n.

(14.6)

Optymalizacji dokonuje się tutaj względem dwóch zmiennych: d∈Rn oraz η∈R. Zauważmy, że η≤0, gdyż para d=0, η=0 rozwiązuje powyższy układ. Jeśli wartość funkcji celu jest mniejsza od zera, to, na mocy lematu 14.1, rozwiązanie jest dopuszczalnym kierunkiem spadku. Jeśli η=0 jest rozwiązaniem i w punkcie x spełniony jest warunek liniowej niezależności ograniczeń, to wówczas w x zachodzi warunek konieczny pierwszego rzędu. Prawdziwa jest również odwrotna implikacja.

Lemat 14.4

Jeśli w punkcie dopuszczalnym x spełniony jest warunek liniowej niezależności ograniczeń i rozwiązaniem problemu (14.6) jest η=0, to w x zachodzi warunek konieczny pierwszego rzędu. I odwrotnie, jeśli w x spełniony jest warunek konieczny pierwszego rzędu, to rozwiązaniem (14.6) jest η=0 (nie jest tu konieczne założenie o regularności punktu x).

Dowód

Jeśli η=0 jest rozwiązaniem, to układ A⁢d<0, gdzie A składa się wierszowo z gradientów D⁢f⁢x i D⁢gi⁢x, i∈I⁢x, nie ma rozwiązania. Na mocy lematu 6.2 istnieje y≥0, y≠0, dla którego AT⁢y=0. Połóżmy (μ⌃0,μ⌃i,i∈I(x))=y i μ⌃i=0, i∉I⁢x. Równość AT⁢y=0 zapisać można w następujący sposób:

μ⌃0⁢D⁢f⁢x+∑i∈I⁢xμ⌃i⁢D⁢gi⁢x=0T.

Z założenia o liniowej niezależności gradientów ograniczeń aktywnych wnioskujemy, że μ⌃0≠0. Kładąc μi=μ⌃i/μ⌃0, i=1,…,m, dostajemy wektor mnożników Lagrange'a z warunku koniecznego pierwszego rzędu.

Aby dowieść implikacji odwrotnej, zauważmy, że jeśli w x spełniony jest warunek konieczny pierwszego rzędu, to y=(1,μi,i∈I(x)) spełnia następujące warunki: y≥0, y≠0 i AT⁢y=0. Na mocy lematu 6.2 nie istnieje d∈Rn, dla którego A⁢d<0. A zatem rozwiązaniem 14.6 jest η=0.

∎

Zapiszmy w pełni algorytm zaproponowany przez Zoutendijka dla problemów z nieliniowymi ograniczeniami nierównościowymi:

Inicjalizacja: Wybierz punkt początkowy x0.
Krok k-ty:
1. Wybierz kierunek ruchu dk jako rozwiązanie problemu optymalizacyjnego (14.6)
2. Jeśli η=0, to zakończ działanie algorytmu. Punkt xk spełnia warunek konieczny pierwszego rzędu. W przeciwnym przypadku kontynuuj.
3. Połóż αk=argminα∈0,Ak⁢f⁢xk+α⁢dk, gdzie Ak jest największą liczbą o tej własności, że odcinek łączący xk i xk+Ak⁢dk zawarty jest w W.
4. Połóż xk+1=xk+αk⁢dk.

Przykład 14.1

Rozważmy problem optymalizacji z ograniczeniami nieliniowymi:

2⁢x12+2⁢x22-2⁢x1⁢x2-4⁢x1-6⁢x2→m⁢i⁢n,x1+5⁢x2≤5,2⁢x12-x2≤0,x1≥0,⁢x2≥0.

Pokażemy, w jaki sposób postępując iteracje metody Zoutendijka. Weźmy punkt startowy x0=0,0.75T. Dostajemy następujący ciąg punktów:

		x1=0,2083,0.5477T,⁢x2=0.5555,0.8889T,
		x3=0.6479,0.8397T,⁢x4=0.6302,0.8740T.

Widzimy, że ciąg ten dość znacznie oscyluje w zbiorze punktów dopuszczalnych, patrz rys. 14.4. Jest to charakterystyczne zachowanie metody kierunków spadku dla problemów z ograniczeniami.

Rys. 14.4. Oscylacja ciągu generowanego przez metodę Zoutendijka.

Rys. 14.5. Ilustracja zbieżności algorytmu Zoutendijka do punktu nie będącego rozwiązaniem.

Algorytm Zoutendijka może polec nawet na dość prostych prostych problemach optymalizacyjnych. Rozważmy minimalizowanie funkcji liniowej f⁢x=-2⁢x1-x2 na zbiorze zaznaczonym na rysunku 14.5. Minimum znajduje się w punkcie x¯=1,1T. Rozpoczynając od punktu x0=-1,0T, kolejne iteracje algorytmu Zoutendijka wygenerują ciąg punktów zbiegający do 1,0T. Algorytm ten nie pozwoli nam na przybliżenie właściwego rozwiązania x¯. Co więcej, wartość funkcji celu w punkcie 1,0T wynosi -2, w porównaniu do f⁢x¯=-3. W następnym podrozdziale pokażemy jak mała modyfikacja pozwoli naprawić algorytm Zoutendijka.

14.3. Modyfikacja Topkis'a-Veinott'a

Topkis i Veinott zaproponowali w roku 1967 niewielką modyfikację wyznaczania kierunku dk w algorytmie Zoutendijka:

η→min,D⁢f⁢x⁢d≤η,D⁢gi⁢x⁢d≤η-gi⁢x,⁢i=1,…,m,-1≤dk≤1,⁢k=1,…,n.

(14.7)

Linia dotycząca warunku na gradienty ograniczeń obejmuje teraz wszystkie ograniczenia. Dla ograniczeń aktywnych, i∈I⁢x, mamy gi⁢x=0, a więc warunki te są identyczne jak w (14.6). W przypadku ograniczeń nieaktywnych gi⁢x<0, czyli prawa strona jest większa niż η. O ile dla dużych wartości gi⁢x ograniczenie takie jest prawie niezauważalne, to dla ograniczeń, które są ”prawie aktywne”, odgrywa znaczną rolę. Poza tym, z punktu widzenia implementacji, rozwiązuje to kwestię znajdowania zbioru ograniczeń aktywnych (ze względu na niedokładności zapisu liczb, prawie nigdy nie będzie spełniony warunek gi⁢x=0).

O skuteczności modyfikacji (14.7) świadczy następujące twierdzenie, które podamy bez dowodu:

Twierdzenie 14.1

Załóżmy, że f,gi, i=1,…,m, są klasy C1. Jeśli ciąg xk wygenerowany przez algorytm Zoutendijka z modyfikacją Topkis'a-Veinott'a posiada punkt skupienia, w którym spełniony jest warunek liniowej niezależności, to zachodzi w nim warunek konieczny pierwszego rzędu.

14.4. Podsumowanie

Metody numeryczne opisane w tym rozdziale pozwalają na znalezienie aproksymacji punktów, w których spełniony jest warunek konieczny pierwszego rzędu. Twierdzenie 7.6 zagwarantuje dopiero optymalność tych punktów. W szczególności, jeśli ograniczenia są liniowe, to wystarczy założyć pseudowypukłość funkcji f. Zwróćmy uwagę, że wymagaliśmy podobnych założeń w poprzednim rozdziale, dla optymalizacji bez ograniczeń. Wymóg wypukłości okazuje się bardzo naturalnym i, co więcej, koniecznym dla sprawnego działania tych metod.

14.5. Zadania

Ćwiczenie 14.1

Znajdź graficznie zbiór dopuszczalnych kierunków spadku w punkcie x=2,3T dla zagadnienia

x1-62+x2-22→min,-x1+2⁢x2≤4,3⁢x1+2⁢x2≤12,x1≥0,⁢x2≥0.

Ćwiczenie 14.2

Udowodnij lemat 14.1.

Ćwiczenie 14.3

Rozwiąż następujące zagadnienie optymalizacyjne z ograniczeniami liniowymi:

2⁢x12+2⁢x22-2⁢x1⁢x2-4⁢x1-6⁢x2→m⁢i⁢n,x1+x2≤2,x1+5⁢x2≤5,x1≥0,⁢x2≥0.

Zastosuj algorytm Zoutendijka i weź jako punkt początkowy x0=0.

Wskazówka:

Algorytm kończy się w trzeciej iteracji (optymalna wartość funkcji celu w zagadnieniu poszukiwania kierunku dk wynosi wówczas 0).

Ćwiczenie 14.4

Udowodnij lemat 14.3.

Ćwiczenie 14.5

Podaj przykład problemu optymalizacyjnego z ograniczeniami nierównościowymi, dla którego istnieje dopuszczalny kierunek spadku, który nie spełnia założeń lematu 14.3.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Optymalizacja II

Zagadnienia

14. Metody optymalizacji z ograniczeniami

14.1. Algorytm Zoutendijk'a dla ograniczeń liniowych

Lemat 14.1

Lemat 14.2

Dowód

14.2. Algorytm Zoutendijk'a dla ograniczeń nieliniowych

Lemat 14.3

Lemat 14.4

Dowód

Przykład 14.1

14.3. Modyfikacja Topkis'a-Veinott'a

Twierdzenie 14.1

14.4. Podsumowanie

14.5. Zadania

Ćwiczenie 14.1

Ćwiczenie 14.2

Ćwiczenie 14.3

Ćwiczenie 14.4

Ćwiczenie 14.5