Zagadnienia

8. Warunek konieczny dla ograniczeń mieszanych

W tym rozdziale wyprowadzimy warunek konieczny pierwszego rzędu dla problemu optymalizacyjnego w następującej formie:

fxmin,gix0,i=1,,m,hjx=0,j=1,,l,xX,(8.1)

gdzie XRn jest zbiorem otwartym i f,g1,,gm,h1,,hl:XR. Zbiór punktów dopuszczalnych zadany jest następująco:

W=xX:g1x0,,gmx0,h1x=0,,hlx=0.(8.2)

Przypomnijmy, że funkcje gi nazywane są ograniczeniami nierównościowymi, funkcje hjograniczeniami równościowymi, zaś cały problem (8.1) nazywa się zadaniem optymalizacyjnym z ograniczeniami mieszanymi.

Przykład 8.1

Rozważmy następujący problem optymalizacyjny:

fxmin,aTx+b=0,xRn,

dla pewnego aRn i bR. Ograniczenie równościowe możemy zamienić na dwa ograniczenia nierównościowe:

fxmin,aTx+b0,-aTx-b0,xRn.

Ograniczenia są afiniczne, czyli w każdym punkcie spełniony jest warunek afiniczności. Jeśli x¯ jest rozwiązaniem lokalnym, to istnieje wektor mnożników Lagrange'a μ=μ1,μ2T i spełnione są warunki Kuhna-Tuckera (5.5):

Dfx¯+μ1aT+μ2-aT=0T,μ1aTx+b=0,μ2-aTx-b=0,μ1,μ20.

Punkt x¯ jest dopuszczalny (jako że jest rozwiązaniem), czyli spełnia ograniczenia: aTx+b=0. Stąd trywialnie spełnione są druga i trzecia równość. Możemy zatem powyższe warunki równoważnie zapisać jako:

Dfx¯+μ1-μ2aT=0T,μ1,μ20.

Oznaczmy λ=μ1-μ2. Warunki nieujemności μ1,μ2 implikują, że λR. Dostajemy więc finalnie:

Dfx¯+λaT=0T,λR.

Jest to warunek Kuhna-Tuckera dla ograniczeń równościowych.

Powyższy przykład sugerowałby, że teoria dla problemów z ograniczeniami nierównościowymi, zbudowana w poprzednich rozdziałach, pozwala poradzić sobie z ograniczeniami równościowymi. Niestety nie jest to prawda. Ograniczenia afiniczne są szczególnym przypadkiem. Jeśli któreś z ograniczeń równościowych nie jest afiniczne i rozbijemy je na dwie nierówności, jak powyżej, to w żadnym punkcie zbioru W nie jest spełniony ani warunek liniowej zależności ograniczeń ani warunek Slatera.

8.1. Warunek konieczny pierwszego rzędu

Teoria wprowadzana w tym podrozdziale jest prostym rozszerzeniem tego, co już zrobiliśmy dla problemu optymalizacyjnego z ograniczeniami nierównościowymi. Rozpoczniemy od rozszerzenia Tlin:

Definicja 8.1

Niech x¯W, gi różniczkowalne w x¯ dla ograniczeń aktywnych iIx¯ oraz hj są różniczkowalne w x¯ dla j=1,,l. Stożkiem kierunków stycznych dla ograniczeń zlinearyzowanych nazywamy zbiór

Tlinx¯=dRn:iIx¯Dgix¯d0,j=1,,lDhjx¯d=0.

Podobnie jak poprzednio zauważmy, że stożek kierunków stycznych dla ograniczeń zlinearyzowanych jest zbiorem wielościennym, a zatem wypukłym i domkniętym. Jeśli jest choć jedno ograniczenie równościowe, to ma on puste wnętrze.

Warunek konieczny istnienia rozwiązania lokalnego problemu z ograniczeniami mieszanymi jest sformułowany poniżej. Identycznie jak w twierdzeniu 5.2 zakładamy równość stożka kierunków stycznych dla ograniczeń oryginalnych i zlinearyzowanych. Później uogólnimy warunki regularności, które będą taką równość pociągały.

Twierdzenie 8.1 (Twierdzenia Kuhna-Tuckera)

Niech x¯ będzie rozwiązaniem lokalnym (8.1). Jeśli funkcje f, gi, iIx¯, oraz hj, j=1,,l, są różniczkowalne w x¯ oraz Tx¯=Tlinx¯, to istnieją μ0,m oraz λRl takie że

Dfx¯+iIx¯μiDgix¯+j=1lλjDhjx¯=0T,μigix¯=0,i=1,2,,m.(8.3)
Dowód

Na mocy twierdzenia 5.1 mamy Dx¯Tx¯=. Dalej, korzystając z założenia, dostajemy Dx¯Tlinx¯=, co innymi słowy oznacza, że nie istnieje rozwiązanie zRn układu

Dfx¯z<0,Dgix¯z0,iIx¯.Dhjx¯z0,j=1,,l,-Dhjx¯z0,j=1,,l.(8.4)

Stosujemy lemat Farkasa, lemat 5.3, z d=-Dfx¯ i macierzą A następującej postaci:

A=Dhjx¯,j=1,,l-Dhjx¯,j=1,,lDgix¯,iIx¯

Istnieje zatem y0,Ix¯+2l takie że yTA=-Dfx¯ lub inaczej

Dfx¯+yTA=0T.(8.5)

Zdefiniujmy λj=yj-yl+j, j=1,,l. Przypiszmy współrzędnym μ odpowiadającym ograniczeniom aktywnym, iIx¯, ostatnie Ix¯ wartości wektora y. Na pozostałych współrzędnych połóżmy zera. Wówczas równość (8.5) jest równoważna następującej

Dfx¯+iIx¯mμiDgix¯+j=1lλjDhjx¯=0T.

Z definicji μi oczywiste jest, że μigix¯=0.

8.2. Warunki regularności

Sformułujemy teraz trzy warunki dostateczne równości Tx¯=Tlinx¯, zwane warunkami regularności.

Definicja 8.2

W punkcie x¯W spełniony jest:

  • warunek liniowej niezależności, jeśli funkcje gi, iIx¯, są ciągłe w x¯, pozostałe ograniczenia nierównościowe i wszystkie równościowe są klasy C1 na otoczeniu x¯ oraz wektory Dgix¯ dla iIx¯ i Dhjx¯ dla j=1,,l są liniowo niezależne,

  • warunek afiniczności, jeśli funkcje gi, iIx¯, oraz hj, j=1,,l, są afiniczne,

  • warunek Slatera, jeśli

    • funkcje gi, iIx¯ są pseudowypukłe w x¯, funkcje gi, iIx¯, są ciągłe w x¯,

    • funkcje hj, j=1,,l, są afiniczne,

    • istnieje xX, dla którego gix<0 dla iIx¯ oraz hjx=0 dla j=1,,l.

Zaczniemy od najprostszego przypadku.

Twierdzenie 8.2

Jeśli w punkcie x¯W spełniony jest warunek afiniczności, to zachodzi równość Tx¯=Tlinx¯.

Dowód

Postępując jak w przykładzie 8.1 zamieniamy ograniczenia afiniczne równościowe na ograniczenia afiniczne nierównościowe. Teza wynika z twierdzenia 6.1.

Twierdzenie 8.3

Jeśli w punkcie x¯W spełniony jest warunek Slatera, to zachodzi równość Tx¯=Tlinx¯.

Dowód

Zapiszmy najpierw funkcje hj dla j=1,,l:

hjy=ajTy+bj,ajRn,bjR.

Wprowadźmy uogólnienie zbioru Tintx¯ do przypadku ograniczeń mieszanych:

Tintx¯=dRn:iIx¯Dgix¯d<0,j=1,,lDhjx¯d=0.

(1) Tintx¯. Weźmy punkt x z warunku Slatera. Na mocy pseudowypukłości, patrz uwaga 4.3, mamy

Dgix¯x-x¯<0,iIx¯.

Dla każdego j mamy także

ajTx-x¯=ajTx+bj-ajTx¯-bj=hjx-hjx¯=0.

Wnioskujemy więc, że wektor x-x¯Tintx¯.

(2) Tintx¯Tx¯. W tym celu weźmy dowolny dTintx¯. Wystarczy pokazać, że pewien odcinek o końcu x¯ i kierunku d zawiera się w całości w zbiorze W. Rozważmy w tym celu funkcję yλ=x+λd. Na mocy ciągłości funkcji opisujących ograniczenia nieaktywne istnieje ε>0 taki że giyλ0 dla λ0,ε oraz iIx¯. Z faktu, że dTintx¯ dostajemy również, że hjyλ=0 dla j=1,,l i dowolnego λ. Pozostaje tylko zająć się ograniczeniami aktywnymi. Z faktu, że gi są różniczkowalne w x¯ dla iIx¯ mamy

limλ0giyλ-gix¯λ=Dgix¯d<0,

gdzie ostatnia nierówność wynika z tego, że dTintx¯. A zatem giyλ-gix¯<0 dla dostatecznie małych λ.

(3) clTintx¯=Tlinx¯. Zbiory Tintx¯ i Tlinx¯ leżą na hiperpłaszczyźnie H wyznaczonej przez afiniczne ograniczenia liniowe. Możemy zatem znaleźć przekształcenie liniowe P o pełnym rzędzie przekształcające tą hiperpłaszczyznę w przestrzeń Rn, gdzie n jest wymiarem rzeczonej hiperpłaszczyzny (jeśli funkcje hj są parami różne, to n=n-l). Przekształcenie to jest wzajemnie jednoznaczne rozpatrywane jako funkcja określona na H. A zatem topologie w Rn i na H są identyczne. Wystarczy więc udowodnić tezę tego podpunktu na obrazach Tintx¯ i Tlinx¯ zbiorów Tintx¯ i Tlinx¯. Zauważmy, że zbiór Tintx¯ jest otwarty. Wykazaliśmy, że jest niepusty. Jest również wnętrzem zbioru Tlinx¯. Na mocy lematu 6.1 mamy clTintx¯=Tlinx¯.

(4) Tx¯Tlinx¯. Identycznie jak dowód lematu 5.2.

Pozostaje już tylko przypomnieć, że Tx¯ jest zbiorem domkniętym. A zatem

clTintx¯Tx¯Tlin=clTintx¯.

Zanim przejdziemy do rozważań nad trzecim warunkiem regularności, warunkiem liniowej niezależności, przypomnijmy twierdzenie o funkcji uwikłanej, by, korzystając z niego, podać opis stożka kierunków stycznych do powierzchni zadanej przez ograniczenia równościowe.

Twierdzenie 8.4 (Twierdzenie o funkcji uwikłanej)

Niech f:XRn, gdzie XRn+m otwarty, będzie odwzorowaniem klasy Ck. Załóżmy, że fa,b=0, gdzie a,bX. Przyjmujemy tutaj notację, że aRn, zaś bRm. Oznaczmy przez Ax macierz pochodnych cząstkowych, w punkcie a,b, względem pierwszych n zmiennych: AxRn×n zadana jest wzorem Axij=fiuja,b.

Jeśli macierz Ax jest odwracalna, to istnieje zbiór otwarty WRm zawierający b oraz funkcja g:WRn klasy Ck, taka że gy,yX dla yW, gb=a oraz fgy,y=0 dla yW. Ponadto, Dgb=-Ax-1Ay, gdzie Ay jest pochodną f w punkcie a,b względem ostatnich m zmiennych: AyRn×m zadana jest wzorem Ayij=fiun+ja,b.

Rozważmy powierzchnię opisaną przez układ m* równań:

S=xX:cix=0,i=1,,m*,

gdzie XRn otwarty. Przez TSx¯ oznaczmy stożek kierunków stycznych do S punkcie x¯S.

Twierdzenie 8.5

Załóżmy, że funkcje ci, i=1,,m*, są klasy Ck, k1, na otoczeniu x¯ oraz gradienty Dcix¯, i=1,,m*, są liniowo niezależne. Wówczas

TSx¯=TlinSx¯:=dRn:Dcix¯d=0,i=1,,m*.

Ponadto, dla każdego dTSx¯ istnieje ε>0 i krzywa y:-ε,εS klasy Ck o tej własności, że y0=x¯ oraz y0=d.

Dowód

Pokażemy najpierw, że TSx¯TlinSx¯. Niech dTSx¯. Wówczas d=limkλkxk-x¯ dla xkS, xkx. Z definicji pochodnej dostajemy dla każdego i=1,,m*:

cixk=0=cix¯=0+Dcix¯λnxk-x¯d+λkxk-x¯doxk-x¯xk-x¯0,

czyli Dcix¯d=0. Stąd wynika, że dTlinSx¯.

Pozostało jeszcze zawieranie w drugą stronę. Dowód tej części będzie zdecydowanie trudniejszy. Ustalmy dTlinSx¯. Skonstruujemy krzywą przechodzącą przez x¯ i zawartą w S, której pochodna w punkcie x¯ jest równa d. Oznaczmy cx=c1x,,cm*x i zdefiniujmy funkcję Φ:Rm*×RRm* wzorem

Φu,t=cx¯+td+Dcx¯Tu.

Zauważmy, że Φ0,0=0. Oznaczmy przez DuΦ macierz pochodnych cząstkowych względem zmiennych wektora u: DuΦ=Φiuji,j=1m*. W 0,0 mamy DuΦ0,0=Dcx¯Dcx¯T. Przypomnijmy, że zgodnie z założeniem macierz Dcx¯ ma maksymalny rząd (równy m*), czyli DuΦ0,0 jest odwracalna. Na mocy twierdzenia o funkcji uwikłanej istnieje zatem ε>0 oraz funkcja u:-ε,εRm* klasy Ck, taka że Φut,t=0. Połóżmy

yt=x¯+td+Dcx¯Tut.

Krzywa ta, zgodnie z konstrukcją, leży na powierzchni S, tzn. cyt=0 dla t-ε,ε oraz y0=x¯. Różniczkując złożenie cyt dostajemy

ddtcyt=Dcytd+Dcx¯Tut.

czyli w t=0 mamy

ddtcytt=0=Dcx¯d+Dcx¯Tu0.

Z drugiej strony wiemy, że cyt=0, czyli powyższa pochodna jest równa zero: Dcx¯d+Dcx¯Tu0=0. Przypomnijmy, że dTlinSx¯, co w naszym zapisie oznacza Dcx¯d=0. Wynika stąd, że Dcx¯Dcx¯Tu0=0. Korzystając z faktu, że Dcx¯ ma rząd m* dostajemy u0=0. Jesteśmy już teraz gotowi, aby dokończyć dowód. Różniczkując funkcję y dostajemy

yt=d+Dcx¯Tut,

co w t=0 daje y0=d. Możemy stąd już łatwo wywnioskować, że dTSx¯.

Uwaga 8.1

Powyższe twierdzenie dowodzi powszechnie znanego faktu dotyczącego przestrzeni stycznej do rozmaitości. Otóż, z założeń wynika, że S jest lokalnie wokół punktu x¯ rozmaitością różniczkową klasy Ck. Przestrzeń styczna do rozmaitości w punkcie x¯ definiowana jest jako zbiór wektorów, które są pochodnymi (w punkcie x¯) krzywych leżących na tej rozmaitości i przechodzących przez x¯ (jest to równoważne definicji Tx¯). Równość Tlinx¯=Tx¯ oznacza, że przestrzeń styczna jest jądrem przekształcenia liniowego Dcx¯.

Z powyższego twierdzenia będziemy wielokrotnie korzystać w następnych rozdziałach. Będzie ono głównym narzędziem przy dowodzeniu warunku koniecznego drugiego rzędu. W tym rozdziale pozwoli łatwo wykazać równość Tx¯=Tlinx¯ przy założeniu warunku liniowej niezależności.

Twierdzenie 8.6

Jeśli w punkcie x¯W spełniony jest warunek liniowej niezależności, to zachodzi równość Tx¯=Tlinx¯.

Dowód

Ustalmy dTlinx¯. Niech Ix¯=iIx¯:Dgix¯d=0. Na mocy twierdzenia 8.5 istnieje krzywa y:-ε,εRn, taka że y0=x¯, y0=d oraz giyt=0, iIx¯, i hjyt=0, j=1,,l. Ustalmy iIx¯Ix¯. Połóżmy git=giyt, t-ε,ε. Wówczas gi0=Dgix¯d<0, czyli istnieje εi>0, takie że git<0 dla t0,εi. Z ciągłości, giyt<0 na pewnym otoczeniu 0 dla iIx¯. Podsumowując, istnieje ε¯>0, takie że ytW dla t0,ε¯. Stąd trywialnie dTx¯.

Dowód zawierania Tx¯Tlinx¯ jest identyczny do dowodu lematu 5.2.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.