11.1. Ograniczenia równościowe
Rozważmy problem optymalizacyjny z ograniczeniami równościowymi:
| fx→min,hjx=0,j=1,…,l,x∈X, | | (11.1) |
gdzie X∈Rn jest zbiorem otwartym i f,h1,…,hl:X→R. Dla uproszczenia notacji połóżmy hx=h1x,…,hlxT. Rozważmy problem zaburzony, tzn.
gdzie z∈Rl.
Twierdzenie 11.1
Niech x¯ będzie rozwiązaniem lokalnym problemu (11.1), zaś λ¯ wektorem jego mnożników Lagrange'a. Załóżmy, że funkcje f,h1,…,hl są klasy C2 na otoczeniu x¯, gradienty ograniczeń są liniowo niezależne (spełniony jest warunek liniowej niezależności) oraz
dla d∈Rn∖0 spełniających Dhjx¯d=0, j=1,…,l. Wówczas istnieje otoczenie O~ punktu 0∈Rl oraz funkcja x:O~→X klasy C1, taka że x0=x¯ oraz xz jest ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Ponadto,
Dowód
Na mocy tw. 8.1 punkt x¯ rozwiązuje układ równań:
gdzie
| DxLx¯,λ¯=Dfx¯+λ¯TDhx¯=Dfx¯+∑j=1lλ¯jDhjx¯. | |
Zaburzając prawą stronę drugiej równości przez z będziemy chcieli pokazać, że istnieje rozwiązanie, które jest funkcją z klasy C1. Rozważmy więc układ:
gdzie niewiadomymi są λ oraz x.
Zdefiniujmy funkcję G:Rn×Rl×Rl→Rn×Rl wzorem
Zaburzony układ możemy wówczas zapisać jako
Wiemy, że Gx¯,λ¯,0=0. Skorzystamy z twierdzenia o funkcji uwikłanej, aby rozwikłać pierwsze dwie zmienne w zależności od trzeciej. W tym celu rozważamy macierz pochodnych DGx¯,λ¯,0:
| DGx¯,λ¯,0=Dx2Lx¯,λ¯,Dhx¯T,0Dhx¯,0,-I. | |
Warunek liniowej niezależności gradientów ograniczeń implikuje nieosobliwość podmacierzy
| Dx2Lx¯,λ¯,Dhx¯TDhx¯,0. | |
Spełnione są zatem założenia twierdzenia 8.4 i istnieje otoczenie O punktu 0∈Rl oraz funkcje x:O→X i λ:O→Rl klasy C1, takie że dla z∈O zachodzi Gxz,λz,z=0, czyli
| DxLxz,λz=0T,hxz=z. | |
Korzystając z faktu, iż funkcje Dx2L,Dh,x,λ są ciągłe oraz nierówność (11.3) spełniona jest dla niezaburzonego problemu, wnioskujemy, że istnieje być może mniejsze otoczenie O~ punktu 0∈Rl, takie że
dla z∈O~ i d∈Rn∖0 spełniających Dhjxzd=0, j=1,…,l. Kluczowa dla tego wyniku jest ostra nierówność w warunku (11.3). Na mocy tw. 9.3 punkt xz jest zatem ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Przypomnijmy, że funkcja x jest klasy C1. Możemy zatem zdefiniować pochodną złożenia
Od zakończenia dowodu dzielą nas dwa spostrzeżenia. Po pierwsze, mnożąc obie strony warunku koniecznego pierwszego rzędu dla problemu niezaburzonego
przez Dx0 dostajemy
| Dfx¯Dx0+λ¯TDhx¯Dx0=0T. | |
Po drugie, rózniczkując hxz=z po z otrzymujemy w punkcie z=0 następującą pochodną Dh∘x0=I, czyli Dhx¯Dx0=I. Upraszcza to powyższe równanie do
Stąd już teza wynika natychmiast.
∎
Twierdzenie 11.1 można rozumieć następująco: nieznaczna zmiana j-tego ograniczenia z zera do ε prowadzi do zmiany optymalnej wartości funkcji f o -λ¯jε+oε, tzn. dla małych ε zmiana ta jest w przybliżeniu równa -λ¯jε.
11.2. Ograniczenia nierównościowe
W przypadku ograniczeń nierównościowych zastosujemy inne podejście. Skoncentrujemy się na zadaniu optymalizacji wypukłej:
| fx→min,gix≤0,i=1,…,m,x∈X, | | (11.4) |
gdzie X⊂Rn jest wypukły, f,g1,…,gm:X→R są wypukłe. Dla uproszczenia notacji będziemy pisać gx=g1x,…,gmxT. Problem (11.4) zapisujemy więc jako
| fx→min,gx≤0,x∈X. | | (11.5) |
Rozważmy zadanie zaburzone: dla z∈Rm
| fx→min,gx≤z,x∈X, | | (11.6) |
Definicja 11.1
Niech DM będzie zbiorem takich z∈Rm, dla których zbiór punktów dopuszczalnych Wz=x∈X:gx≤z jest niepusty.
Funkcją perturbacji nazywamy funkcję
określoną dla z należących do dziedziny DM.
Zauważmy, że Mz<∞ dla z∈DM, ale może się zdarzyć, że Mz=-∞.
Twierdzenie 11.2
-
-
Funkcja M:DM→R∪-∞ jest wypukła.
-
Jeśli istnieje punkt x*∈X, taki że gix*<0, i=1,…,m, to intDM≠∅ i 0∈intDM.
Dowód
Z wypukłości g wynika następująca implikacja:
| gx1≤z1,gx2≤z2⟹∀λ∈0,1gλx1+1-λx2≤λz1+1-λz2. | | (11.7) |
Będziemy korzystać z tego spostrzeżenia wielokrotnie w dowodzie.
(1) Niech z1,z2∈DM i λ∈0,1. Wówczas istnieją x1,x2∈X takie że gx1≤z1 i gx2≤z2. Z wzoru (11.7) dostajemy gλx1+1-λx2≤λz1+1-λz2, skąd wynika λz1+1-λz2∈DM.
(2) Niech z1,z2∈DM i λ∈0,1. Wówczas
| λMz1+1-λMz2 | =infx1∈X,gx1≤z1λfx1+infx2∈X,gx2≤z21-λfx2 | |
| | =infx1∈X,gx1≤z1,x2∈X,gx2≤z2λfx1+1-λfx2 | |
| | ≥infx1∈X,gx1≤z1,x2∈X,gx2≤z2fλx1+1-λx2 | |
| | ≥infx∈X,gx≤λz1+1-λz2fx, | |
gdzie pierwsza nierówność wynika z wypukłości f, zaś ostatnia – z własności (11.7):
| λx1+1-λx2:x1∈X,gx1≤z1,x2∈X,gx2≤z2⊆x∈X:gx≤λz1+1-λz2. | |
(3) Musimy udowodnić, że zbiór dopuszczalny Wz jest niepusty dla z z pewnego otoczenia 0∈Rm. Wiemy, że istnieje punkt x*∈X, taki że gix*<0, i=1,…,m. Weźmy a=min-gix*:i=1,…,m. Wówczas dla każdego z∈-a,am mamy x*∈Wz. Zatem -a,am⊂DM.
∎
Uwaga 11.1
-
Jeśli Mz¯=-∞ dla pewnego z¯∈DM, to dla dowolnego z∈DM i λ∈0,1 mamy z wypukłości Mλz¯+1-λz=-∞.
-
Jeśli Mz¯=-∞ dla pewnego z¯∈DM, to Mz=-∞ dla z∈intDM. Wynika to wprost z powyższej uwagi.
-
Jeśli istnieje z¯∈intDM taki że Mz¯>-∞, to Mz>-∞ dla każdego z∈DM. Inaczej mielibyśmy sprzeczność z punktem (2).
Twierdzenie 11.3
Jeśli w problemie optymalizacji wypukłej istnieje punkt x*∈X, taki że gix*<0, i=1,…,m, oraz M0>-∞, to Mz>-∞ dla każdego z∈DM oraz istnieje wektor μ∈0,∞m wyznaczający płaszczyznę podpierającą M:
Dowód
Z tw. 11.2 wynika, że M jest funkcją wypukłą i 0∈intDM. Zatem na mocy ostatniej z powyższych uwag mamy Mz>-∞ dla z∈DM. Istnienie płaszczyzny podpierającej wynika z tw. 3.8:
dla pewnego μ∈Rm. Udowodnimy teraz, że wszystkie współrzędne μ muszą być nieujemne. Przypuśćmy przeciwnie, tzn. μi<0 dla pewnego i∈1,…,m. Ponieważ 0∈intDM, to dla dostatecznie małego a>0 punkt z¯=0,…,0,a,0,…,0T, gdzie a jest na i-tej pozycji, należy do DM. Korzystając z ujemności μi mamy
Z drugiej strony W0⊆Wz¯, czyli Mz¯≤M0. To daje sprzeczność, czyli dowiedliśmy, że μ∈0,∞m.
∎
Wektor μ nazywamy wektorem wrażliwości dla problemu (11.4). Z tw. 3.8 wynika, że jeśli funkcja M jest różniczkowalna w punkcie 0, to μ=-DM0T. Zatem μ oznacza szybkość i kierunek zmian wartości minimalnej f przy zmianie ograniczeń, podobnie jak w przypadku ograniczeń równościowych omawianych wcześniej w tym rozdziale.
Zbadajmy teraz relacje pomiędzy wektorem wrażliwości a punktem siodłowym i warunkiem pierwszego rzędu. Zauważmy, że powiązanie punktu siodłowego z wektorem wrażliwości nie wymaga wypukłości problemu optymalizacyjnego.
Twierdzenie 11.4
-
Jeśli x¯,μ¯ jest punktem siodłowym funkcji Lagrange'a na zbiorze X×0,∞m, to μ¯ jest wektorem wrażliwości (tzn. wyznacza płaszczyznę podpierającą). Teza ta nie wymaga założenia o wypukłości problemu optymalizacyjnego.
-
Załóżmy, że funkcje f,g1,…,gm są różniczkowalne w x¯, i wypukłe. Jeśli w x¯ spełniony jest warunek pierwszego rzędu z mnożnikami Lagrange'a μ¯∈0,∞m, to μ¯ jest wektorem wrażliwości.
Dowód
(1) Oznaczmy przez Lzx,μ funkcję Langrange'a dla problemu zaburzonego. Wówczas
| Lzx,μ=fx+∑i=1mμigix-zi=Lx,μ-μTz. | |
Z faktu, że x¯,μ¯ jest punktem siodłowym wynika, że
| M0=Lx¯,μ¯=infx∈XLx,μ¯. | |
Zatem
| M0=infx∈XLx,μ¯=infx∈XLzx,μ¯+μ¯Tz=infx∈XLzx,μ¯+μ¯Tz. | | (11.8) |
Zauważmy, że dla dowolnego x∈Wz i μ∈0,∞m mamy fx≥Lzx,μ, czyli, w szczególności,
| Mz=infx∈Wzfx≥infx∈WzLzx,μ¯≥infx∈XLzx,μ¯. | |
Wstawiając tą zależność do (11.8) otrzymujemy
(2) Z zadania 10.1 wynika, iż punkt x¯,μ¯ jest punktem siodłowym funkcji Lagrange'a. Tezę dostajemy z pierwszej części niniejszego twierdzenia.
∎
11.3. Zadania
Ćwiczenie 11.1
Dla problemu
| x12+2x22→min,x12+x22≤0,x1≤0. | |
-
-
Znaleźć wektor wrażliwości.
-
Znaleźć funkcję perturbacji.
Wskazówka:
Umieszczenie ograniczenia x12+x22≤0 było intencją autora zadania.
Ćwiczenie 11.2
Znajdź funkcję perturbacji i wektor wrażliwości dla problemu
Ćwiczenie 11.3
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje f i gi są klasy C1 oraz X=Rn. Czy funkcja perturbacji musi być wówczas klasy C1? Udowodnij lub podaj kontrprzykład.
Ćwiczenie 11.4
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje f i gi są ciągłe oraz X=Rn. Czy funkcja perturbacji musi być wówczas ciągła? Udowodnij lub podaj kontrprzykład.
Ćwiczenie 11.5
Rozważmy problem producenta. Dysponuje on budżetem b>0, który może spożytkować na wytworzenie dwóch rodzajów towarów. Pierwszy z towarów sprzedaje po cenie p1>0, zaś drugi – po cenie p2>0. Cena produkcji opisana jest funkcją cx1,x2, gdzie wektor x opisuje wielkość produkcji każdego z towarów. Celem producenta jest maksymalizacja przychodów ze sprzedaży bez przekroczenia budżetu produkcyjnego:
| p1x1+p2x2→max,cx1,x2≤b. | |
-
Podaj warunki konieczne istnienia rozwiązania powyższego problemu.
-
Załóżmy, że c jest funkcją wypukłą. Jak należy zmodyfikować wielkość produkcji, jeśli budżet produkcyjny b wrośnie nieznacznie?
Ćwiczenie 11.6
Rozważmy funkcję f:0,∞→R zadaną wzorem
| ft=minx,y∈Rex2-y+y2-x:x2+x4-2xy+3y2≤t. | |
Uzasadnij, że funkcja f jest dobrze określona i wypukła.