W tym rozdziale przedstawimy warunki konieczne i dostateczne drugiego rzędu, tzn. warunki sformułowane w języku drugich pochodnych oraz podsumujemy dotychczasową wiedzę dotyczącą rozwiązywania problemów optymalizacyjnych z ograniczeniami mieszanymi.
Rozważmy problem optymalizacyjny z ograniczeniami mieszanymi (8.1). Załóżmy, że pewnym punkcie spełniony jest warunek pierwszego rzędu, tzn. istnieją wektory i , takie że
Funkcją Lagrange'a nazywamy funkcję
Możemy teraz zapisać warunek pierwszego rzędu w skróconej formie:
gdzie oznacza różniczkowanie względem zmiennej .
Zbiór
nazywamy zbiorem ograniczeń nierównościowych mocno aktywnych.
Zbiór
nazywamy zbiorem ograniczeń nierównościowych słabo aktywnych.
Załóżmy, że punkt jest lokalnym rozwiązaniem problemu z ograniczeniami mieszanymi i spełniony jest w nim warunek liniowej niezależności. Niech , będą mnożnikami Lagrange'a z warunku pierwszego rzędu. Jeśli , , oraz , , są klasy w otoczeniu , to
dla każdego spełniającego
Ustalmy jak w warunkach twierdzenia. Na mocy twierdzenia 8.5 istnieje i krzywa klasy o następujących własnościach: , , oraz dla mamy , , i , Wynika stąd, że funkcja równa jest dla w otoczeniu . Z ciągłości ograniczeń nieaktywnych wnioskujemy, że dla w otoczeniu . Zatem ma minimum lokalne w , gdyż jest minimum lokalnym na Na mocy założeń, jest klasy . Istnienie minimum w zerze implikuje, że , a więc
To kończy dowód, gdyż w punkcie spełnione są warunki pierwszego rzędu: .
∎Bez dowodu pozostawiamy następujące uogólnienie powyższego twierdzenia:
Podamy teraz warunek dostateczny istnienia rozwiązania lokalnego. Zwróćmy uwagę na to, że warunek ten implikuje, iż rozwiązanie jest ścisłe. Pozostaje więc szara strefa, gdzie jest spełniony warunek konieczny drugiego rzędu, lecz nie zachodzi warunek dostateczny drugiego rzędu. Podobnie jak w przypadku optymalizacji bez ograniczeń, na to nie ma niestety rady.
Załóżmy, że w punkcie spełniony jest warunek pierwszego rzędu, tzn. istnieją wektory i , takie że
(9.1) |
Załóżmy ponadto, że funkcje , , oraz , są dwukrotnie różniczkowalne w . Jeśli
dla każdego spełniającego
(9.2) |
to jest ścisłym rozwiązaniem lokalnym.
Zanim przejdziemy do dowodu podkreślmy, iż w powyższym twierdzeniu nie zakłada się regularności punktu ograniczeń.
Przeprowadzimy dowód przez zaprzeczenie. Załóżmy mianowicie, że nie jest ścisłym rozwiązaniem lokalnym. Istnieje zatem ciąg punktów dopuszczalnych , takich że oraz . Zdefiniujmy
Wówczas . Zauważmy, że . Z faktu wynika, że istnieje podciąg zbieżny do pewnego o normie jednostkowej. Aby uprościć notację zakładamy, że od początku był zbieżny do . Oczywiście z definicji wynika, że
W dalszej części dowodu wykażemy dwie własności : (a) oraz (b) spełnia warunki (9.2). A to przeczy założeniom twierdzenia.
Rozpocznijmy od dowodu własności (a). Z definicji drugiej pochodnej:
Przypomnijmy, że , bo oraz dla . Z warunku pierwszego rzędu (9.1) wynika również, że . Zatem
Przypomnijmy, że . Wstawiając tą reprezentację do powyższego wzoru dostajemy:
Dzielimy obie strony przez :
Przypomnijmy, że . A zatem w granicy, gdy , drugi składnik powyższej sumy dąży do . Korzystając z faktu, że dostajemy
co kończy dowód faktu (a).
W dowodzie własności (b) zastosujemy podobne podejście jak powyżej. Z różniczkowalności funkcji w punkcie mamy
Przypomnijmy, że , co implikuje
Korzystając znów z reprezentacji dostajemy
Zatem w granicy, przy , otrzymujemy . Zauważając, że dla i postępując podobnie jak powyżej dostajemy , . Analogicznie również dowodzimy, że dla
Pomnóżmy obie strony pierwszej równości w (9.1) przez :
Suma ta składa się z wyrazów nieujemnych. Ponieważ sumują się one do zera, to wszystkie muszą być zerowe. W szczególności
Dowiedliśmy zatem, że spełnia warunki (9.2).
∎Opiszemy teraz ogólny algorytm postępowania w przypadku rozwiązywania problemów optymalizacyjnych z ograniczeniami mieszanymi.
Krok 1. Szukamy punktów podejrzanych:
w punkcie zachodzi warunek regularności | |||
Krok 2. Sprawdzamy, czy w punktach ze zbiorów spełnione są założenia tw. 7.6, tzw. warunki dostateczne pierwszego rzędu. Jeśli tak, to w punktach tych są rozwiązania globalne. Pozostałe kroki podejmujemy, jeśli
nie znaleźliśmy żadnego rozwiązania globalnego, lub
chcemy znaleźć wszystkie rozwiązania globalne, lub
chcemy znaleźć wszystkie rozwiązania lokalne.
Usuwamy ze zbiorów punkty, które są rozwiązaniami globalnymi. Oznaczmy nowe zbiory .
Krok 3. Eliminujemy ze zbioru te punkty, gdzie nie zachodzi warunek konieczny drugiego rzędu. Pozostałe punkty oznaczamy
Krok 4. W każdym punkcie ze zbioru sprawdzamy warunek dostateczny drugiego rzędu. Punkty, w których jest spełniony, są rozwiązaniami lokalnymi.
Krok 5. Optymalność punktów ze zbioru , w których nie jest spełniony warunek dostateczny drugiego rzędu sprawdzamy innymi metodami.
W tym podrozdziale opiszemy bardzo dokładnie rozwiązanie następującego problemu optymalizacyjnego:
gdzie jest parametrem.
Zauważmy, że w każdym punkcie, gdzie aktywne jest ograniczenie, spełniony jest warunek liniowej niezależności ograniczeń: pierwsza pochodna ograniczenia wynosi . Wynika stąd, że
Funkcja Lagrange'a dla powyższego problemu ma postać:
Zapiszmy warunek pierwszego rzędu:
(9.3) | ||||
(9.4) | ||||
Sprawdźmy, czy możliwe jest . Wówczas z równania (9.3) dostajemy
co pociąga Punkt ten nie jest dopuszczalny: nie spełnia warunku nierównościowego dla żadnego . Wnioskujemy zatem, że i warunek konieczny pierwszego rzędu może być spełniony tylko w punktach, w których ograniczenie nierównościowe jest aktywne:
(9.5) |
Rozpiszmy równanie (9.3):
Z drugiego równania wynika, że albo albo Jeśli to z (9.5) dostajemy Punkt wraz z mnożnikiem Lagrange'a spełnia warunek pierwszego rzędu.
Rozważmy teraz przypadek . Wówczas z równania dostajemy Jeśli , to i równanie (9.5) nie ma rozwiązania. Dla dostajemy punkt , zaś dla dwa punkty
Podsumowując: oraz
Funkcja nie jest quasi-wypukła, wiec nie możemy skorzystać z twierdzenia 7.6 stwierdzającego dostateczność warunku pierwszego rzędu. Zatem .
Przechodzimy do kroku 3 i sprawdzamy warunek konieczny drugiego rzędu dla punktów z . Rozważmy najpierw punkt Odpowiada mu mnożnik Lagrange'a Pierwsza pochodna funkcji Lagrange'a ma postać:
Macierz drugich pochodnych to;
Na mocy twierdzenia wystarczy sprawdzić, że
dla wektorów spełniających , czyli takich że Wstawiając do powyższej nierówności dostajemy Nierówność ta zachodzi dla : w punkcie może być rozwiązanie lokalne. Dla nierówność nie zachodzi, więc w nie ma rozwiązania lokalnego.
Załóżmy teraz i rozważmy dwa pozostałe punkty. W obu przypadkach mnożnik Lagrange'a . Mamy zatem
Macierz drugich pochodnych jest nieujemnie określona, więc warunek konieczny drugiego rzędu jest spełniony w obu punktach. Podsumowując:
Przechodzimy do sprawdzenia warunku dostatecznego drugiego rzędu. W przypadku macierz drugich pochodnych funkcji Lagrange'a jest dodatnio określona, więc na mocy tw. 9.3 w punkcie jest ścisłe rozwiązanie lokalne. Niestety nie możemy nic powiedzieć o punkcie , gdy
Rozważmy przypadek Zajmijmy się punktem Musimy sprawdzić warunki tw. 9.3:
dla spełniającego czyli A zatem jeśli , to i w punkcie spełniony jest warunek dostateczny drugiego rzędu: jest ścisłym rozwiązaniem lokalnym. Analogicznie dowodzimy, że punkt jest również ścisłym rozwiązaniem lokalnym.
Pozostaje jeszcze przypadek Choć jest rozwiązaniem globalnym, to nie udało nam się tego pokazać korzystając z teorii Kuhna-Tuckera. Łatwo można to jednak udowodnić bezpośrednio.
Rozwiąż geometrycznie i analitycznie zadanie minimalizacji na zbiorze
Niech będzie macierzą o pełnym rzędzie (tzn. o rzędzie równym ). Udowodnij, że rzut na jądro jest przekształceniem liniowym zadanym wzorem
W dowodzie wykorzystaj fakt, że rzeczony rzut, to taki punkt zbioru , który jest najmniej oddalony od rzutowanego punktu.
Na brzegu będącym prostym odcinkiem co metrów stoją trzy stacje pomiarowe, patrz rys. 9.1. Każda z nich mierzy kąt między prostą prostopadłą do brzegu a prostą przechodzącą przez punkt pomiarowy i statek. Wyniki obserwacji są następujące:
Pomiary te są obarczone małymi błędami. Skoryguj je tak, aby były zgodne tzn. wskazywały na ten sam punkt na płaszczyźnie i korekta była jak najmniejsza w sensie średniokwadratowym (suma kwadratów różnic pomiędzy zmierzonymi kątami i skorygowanymi kątami). Znajdź położenie statku względem punktów pomiarowych. W obliczeniach przyjmij, że dla małych kątów .
Metalowa belka ma przekrój trapezoidalny. Pole tego przekroju ze względów wytrzymałościowych musi wynosić . Górna i boczna powierzchnia musi zostać zabezpieczona antykorozyjnie. Ustal tak kształt przekroju, aby powierzchnia do zabezpieczenia antykorozyjnego była jak najmniejsza.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.