Zagadnienia

11. Teoria wrażliwości

Dotychczas mnożniki Lagrange'a wydawały się techniczną sztuczką służącą do znajdowania rozwiązania problemu optymalizacyjnego z ograniczeniami. W tym rozdziale pokażemy, że pełnią one rolę kosztu związanego ze zmianą ograniczeń. Oddzielnie zajmiemy się ograniczeniami równościowymi i nierównościowymi.

11.1. Ograniczenia równościowe

Rozważmy problem optymalizacyjny z ograniczeniami równościowymi:

fxmin,hjx=0,j=1,,l,xX,(11.1)

gdzie XRn jest zbiorem otwartym i f,h1,,hl:XR. Dla uproszczenia notacji połóżmy hx=h1x,,hlxT. Rozważmy problem zaburzony, tzn.

fxmin,hx=z,xX,(11.2)

gdzie zRl.

Twierdzenie 11.1

Niech x¯ będzie rozwiązaniem lokalnym problemu (11.1), zaś λ¯ wektorem jego mnożników Lagrange'a. Załóżmy, że funkcje f,h1,,hl są klasy C2 na otoczeniu x¯, gradienty ograniczeń są liniowo niezależne (spełniony jest warunek liniowej niezależności) oraz

dTDx2Lx¯,λ¯d>0(11.3)

dla dRn0 spełniających Dhjx¯d=0, j=1,,l. Wówczas istnieje otoczenie O~ punktu 0Rl oraz funkcja x:O~X klasy C1, taka że x0=x¯ oraz xz jest ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Ponadto,

Dfx0=-λ¯T.
Dowód

Na mocy tw. 8.1 punkt x¯ rozwiązuje układ równań:

DxLx¯,λ¯=0T,hx¯=0,

gdzie

DxLx¯,λ¯=Dfx¯+λ¯TDhx¯=Dfx¯+j=1lλ¯jDhjx¯.

Zaburzając prawą stronę drugiej równości przez z będziemy chcieli pokazać, że istnieje rozwiązanie, które jest funkcją z klasy C1. Rozważmy więc układ:

DxLx,λ=0T,hx=z,

gdzie niewiadomymi są λ oraz x. Zdefiniujmy funkcję G:Rn×Rl×RlRn×Rl wzorem

Gx,λ,z=DxLx,λThx-z.

Zaburzony układ możemy wówczas zapisać jako

Gx,λ,z=0.

Wiemy, że Gx¯,λ¯,0=0. Skorzystamy z twierdzenia o funkcji uwikłanej, aby rozwikłać pierwsze dwie zmienne w zależności od trzeciej. W tym celu rozważamy macierz pochodnych DGx¯,λ¯,0:

DGx¯,λ¯,0=Dx2Lx¯,λ¯,Dhx¯T,0Dhx¯,0,-I.

Warunek liniowej niezależności gradientów ograniczeń implikuje nieosobliwość podmacierzy

Dx2Lx¯,λ¯,Dhx¯TDhx¯,0.

Spełnione są zatem założenia twierdzenia 8.4 i istnieje otoczenie O punktu 0Rl oraz funkcje x:OX i λ:ORl klasy C1, takie że dla zO zachodzi Gxz,λz,z=0, czyli

DxLxz,λz=0T,hxz=z.

Korzystając z faktu, iż funkcje Dx2L,Dh,x,λ są ciągłe oraz nierówność (11.3) spełniona jest dla niezaburzonego problemu, wnioskujemy, że istnieje być może mniejsze otoczenie O~ punktu 0Rl, takie że

dTDx2Lxz,λzd>0

dla zO~ i dRn0 spełniających Dhjxzd=0, j=1,,l. Kluczowa dla tego wyniku jest ostra nierówność w warunku (11.3). Na mocy tw. 9.3 punkt xz jest zatem ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Przypomnijmy, że funkcja x jest klasy C1. Możemy zatem zdefiniować pochodną złożenia

Dfx0=Dfx¯Dx0.

Od zakończenia dowodu dzielą nas dwa spostrzeżenia. Po pierwsze, mnożąc obie strony warunku koniecznego pierwszego rzędu dla problemu niezaburzonego

Dfx¯+λ¯TDhx¯=0T.

przez Dx0 dostajemy

Dfx¯Dx0+λ¯TDhx¯Dx0=0T.

Po drugie, rózniczkując hxz=z po z otrzymujemy w punkcie z=0 następującą pochodną Dhx0=I, czyli Dhx¯Dx0=I. Upraszcza to powyższe równanie do

Dfx¯Dx0+λ¯T=0T.

Stąd już teza wynika natychmiast.

Twierdzenie 11.1 można rozumieć następująco: nieznaczna zmiana j-tego ograniczenia z zera do ε prowadzi do zmiany optymalnej wartości funkcji f o -λ¯jε+oε, tzn. dla małych ε zmiana ta jest w przybliżeniu równa -λ¯jε.

11.2. Ograniczenia nierównościowe

W przypadku ograniczeń nierównościowych zastosujemy inne podejście. Skoncentrujemy się na zadaniu optymalizacji wypukłej:

fxmin,gix0,i=1,,m,xX,(11.4)

gdzie XRn jest wypukły, f,g1,,gm:XR są wypukłe. Dla uproszczenia notacji będziemy pisać gx=g1x,,gmxT. Problem (11.4) zapisujemy więc jako

fxmin,gx0,xX.(11.5)

Rozważmy zadanie zaburzone: dla zRm

fxmin,gxz,xX,(11.6)
Definicja 11.1

Niech DM będzie zbiorem takich zRm, dla których zbiór punktów dopuszczalnych Wz=xX:gxz jest niepusty. Funkcją perturbacji nazywamy funkcję

Mz=infxX,gxzfx

określoną dla z należących do dziedziny DM.

Zauważmy, że Mz< dla zDM, ale może się zdarzyć, że Mz=-.

Twierdzenie 11.2

  1. Zbiór DM jest wypukły.

  2. Funkcja M:DMR- jest wypukła.

  3. Jeśli istnieje punkt x*X, taki że gix*<0, i=1,,m, to intDM i 0intDM.

Dowód

Z wypukłości g wynika następująca implikacja:

gx1z1,gx2z2λ0,1gλx1+1-λx2λz1+1-λz2.(11.7)

Będziemy korzystać z tego spostrzeżenia wielokrotnie w dowodzie.

(1) Niech z1,z2DM i λ0,1. Wówczas istnieją x1,x2X takie że gx1z1 i gx2z2. Z wzoru (11.7) dostajemy gλx1+1-λx2λz1+1-λz2, skąd wynika λz1+1-λz2DM.

(2) Niech z1,z2DM i λ0,1. Wówczas

λMz1+1-λMz2=infx1X,gx1z1λfx1+infx2X,gx2z21-λfx2
=infx1X,gx1z1,x2X,gx2z2λfx1+1-λfx2
infx1X,gx1z1,x2X,gx2z2fλx1+1-λx2
infxX,gxλz1+1-λz2fx,

gdzie pierwsza nierówność wynika z wypukłości f, zaś ostatnia – z własności (11.7):

λx1+1-λx2:x1X,gx1z1,x2X,gx2z2xX:gxλz1+1-λz2.

(3) Musimy udowodnić, że zbiór dopuszczalny Wz jest niepusty dla z z pewnego otoczenia 0Rm. Wiemy, że istnieje punkt x*X, taki że gix*<0, i=1,,m. Weźmy a=min-gix*:i=1,,m. Wówczas dla każdego z-a,am mamy x*Wz. Zatem -a,amDM.

Uwaga 11.1

  1. Jeśli Mz¯=- dla pewnego z¯DM, to dla dowolnego zDM i λ0,1 mamy z wypukłości Mλz¯+1-λz=-.

  2. Jeśli Mz¯=- dla pewnego z¯DM, to Mz=- dla zintDM. Wynika to wprost z powyższej uwagi.

  3. Jeśli istnieje z¯intDM taki że Mz¯>-, to Mz>- dla każdego zDM. Inaczej mielibyśmy sprzeczność z punktem (2).

Twierdzenie 11.3

Jeśli w problemie optymalizacji wypukłej istnieje punkt x*X, taki że gix*<0, i=1,,m, oraz M0>-, to Mz>- dla każdego zDM oraz istnieje wektor μ0,m wyznaczający płaszczyznę podpierającą M:

MzM0-μTz,zDM.
Dowód

Z tw. 11.2 wynika, że M jest funkcją wypukłą i 0intDM. Zatem na mocy ostatniej z powyższych uwag mamy Mz>- dla zDM. Istnienie płaszczyzny podpierającej wynika z tw. 3.8:

MzM0-μTz,zDM,

dla pewnego μRm. Udowodnimy teraz, że wszystkie współrzędne μ muszą być nieujemne. Przypuśćmy przeciwnie, tzn. μi<0 dla pewnego i1,,m. Ponieważ 0intDM, to dla dostatecznie małego a>0 punkt z¯=0,,0,a,0,,0T, gdzie a jest na i-tej pozycji, należy do DM. Korzystając z ujemności μi mamy

Mz¯M0-μia>M0.

Z drugiej strony W0Wz¯, czyli Mz¯M0. To daje sprzeczność, czyli dowiedliśmy, że μ0,m.

Wektor μ nazywamy wektorem wrażliwości dla problemu (11.4). Z tw. 3.8 wynika, że jeśli funkcja M jest różniczkowalna w punkcie 0, to μ=-DM0T. Zatem μ oznacza szybkość i kierunek zmian wartości minimalnej f przy zmianie ograniczeń, podobnie jak w przypadku ograniczeń równościowych omawianych wcześniej w tym rozdziale.

Zbadajmy teraz relacje pomiędzy wektorem wrażliwości a punktem siodłowym i warunkiem pierwszego rzędu. Zauważmy, że powiązanie punktu siodłowego z wektorem wrażliwości nie wymaga wypukłości problemu optymalizacyjnego.

Twierdzenie 11.4

  1. Jeśli x¯,μ¯ jest punktem siodłowym funkcji Lagrange'a na zbiorze X×0,m, to μ¯ jest wektorem wrażliwości (tzn. wyznacza płaszczyznę podpierającą). Teza ta nie wymaga założenia o wypukłości problemu optymalizacyjnego.

  2. Załóżmy, że funkcje f,g1,,gm są różniczkowalne w x¯, i wypukłe. Jeśli w x¯ spełniony jest warunek pierwszego rzędu z mnożnikami Lagrange'a μ¯0,m, to μ¯ jest wektorem wrażliwości.

Dowód

(1) Oznaczmy przez Lzx,μ funkcję Langrange'a dla problemu zaburzonego. Wówczas

Lzx,μ=fx+i=1mμigix-zi=Lx,μ-μTz.

Z faktu, że x¯,μ¯ jest punktem siodłowym wynika, że

M0=Lx¯,μ¯=infxXLx,μ¯.

Zatem

M0=infxXLx,μ¯=infxXLzx,μ¯+μ¯Tz=infxXLzx,μ¯+μ¯Tz.(11.8)

Zauważmy, że dla dowolnego xWz i μ0,m mamy fxLzx,μ, czyli, w szczególności,

Mz=infxWzfxinfxWzLzx,μ¯infxXLzx,μ¯.

Wstawiając tą zależność do (11.8) otrzymujemy

M0Mz+μ¯Tz.

(2) Z zadania 10.1 wynika, iż punkt x¯,μ¯ jest punktem siodłowym funkcji Lagrange'a. Tezę dostajemy z pierwszej części niniejszego twierdzenia.

11.3. Zadania

Ćwiczenie 11.1

Dla problemu

x12+2x22min,x12+x220,x10.
  1. Znaleźć DM.

  2. Znaleźć wektor wrażliwości.

  3. Znaleźć funkcję perturbacji.

Wskazówka: 

Umieszczenie ograniczenia x12+x220 było intencją autora zadania.

Ćwiczenie 11.2

Znajdź funkcję perturbacji i wektor wrażliwości dla problemu

x12+x22min,x1+x20.
Ćwiczenie 11.3

Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje f i gi są klasy C1 oraz X=Rn. Czy funkcja perturbacji musi być wówczas klasy C1? Udowodnij lub podaj kontrprzykład.

Ćwiczenie 11.4

Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje f i gi są ciągłe oraz X=Rn. Czy funkcja perturbacji musi być wówczas ciągła? Udowodnij lub podaj kontrprzykład.

Ćwiczenie 11.5

Rozważmy problem producenta. Dysponuje on budżetem b>0, który może spożytkować na wytworzenie dwóch rodzajów towarów. Pierwszy z towarów sprzedaje po cenie p1>0, zaś drugi – po cenie p2>0. Cena produkcji opisana jest funkcją cx1,x2, gdzie wektor x opisuje wielkość produkcji każdego z towarów. Celem producenta jest maksymalizacja przychodów ze sprzedaży bez przekroczenia budżetu produkcyjnego:

p1x1+p2x2max,cx1,x2b.
  1. Podaj warunki konieczne istnienia rozwiązania powyższego problemu.

  2. Załóżmy, że c jest funkcją wypukłą. Jak należy zmodyfikować wielkość produkcji, jeśli budżet produkcyjny b wrośnie nieznacznie?

Ćwiczenie 11.6

Rozważmy funkcję f:0,R zadaną wzorem

ft=minx,yRex2-y+y2-x:x2+x4-2xy+3y2t.

Uzasadnij, że funkcja f jest dobrze określona i wypukła.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.