W tym rozdziale podamy warunki dostateczne równości stożka kierunków stycznych i stożka kierunków stycznych dla ograniczeń zlinearyzowanych . Przypomnijmy, że jest to główne założenie twierdzenia Kuhna-Tuckera, tw. 5.2, opisującego warunek konieczny pierwszego rzędu dla lokalnego rozwiązania problemu optymalizacyjnego z ograniczeniami nierównościowymi (5.3).
Sformułujemy teraz trzy warunki dostateczne równości , zwane warunkami regularności. Dowody dostateczności podamy w kolejnych twierdzeniach.
W punkcie spełniony jest:
warunek liniowej niezależności, jeśli funkcje , , są ciągłe w oraz wektory , dla , są liniowo niezależne,
warunek afiniczności, jeśli funkcje , , są afiniczne oraz funkcje , , są ciągłe w ,
warunek Slatera, jeśli funkcje , są pseudowypukłe w , funkcje , , są ciągłe w oraz istnieje , dla którego dla .
Zauważmy, że w warunku Slatera nie wymagamy, aby punkt spełniał warunki ograniczeń nieaktywnych, tzn. nie musi być w zbiorze .
Jeśli w punkcie spełniony jest warunek afiniczności, to .
Zawieranie wynika z lematu 5.2. Wystarczy zatem wykazać zawieranie w drugą stronę.
Niech . Udowodnimy, że istnieje , taka że cały odcinek , , zawarty jest w :
(6.1) |
Zauważmy, że dla . Z ciągłości tych funkcji w wynika, że istnieje , dla której , , . Pozostaje jeszcze wykazać, że nierówność taka zachodzi dla ograniczeń aktywnych. Ustalmy . Z definicji wiemy, że . Ograniczenie jest afiniczne, czyli postaci , gdzie , . Zatem . Z faktu, że jest aktywne w dostajemy również . Stąd dla dowolnego mamy
Dowodzi to (6.1).
Pozostaje już tylko skonstruować ciąg , i . Kładziemy
Wówczas , oraz , czyli trywialnie
a zatem .
∎Przed przystąpieniem do dowodu analogicznych twierdzeń dla pozostałych warunków regularności sformułujemy pomocniczy lemat. Wprowadźmy zbiór
Zauważmy, że jeśli w punkcie funkcje , , są różniczkowalne w , zaś funkcje , są ciągłe w , to oznacza, że dla dostatecznie małych .
Niech oraz funkcje , , są różniczkowalne w , zaś funkcje , są ciągłe w . Wówczas
I) ,
II) Jeśli , to .
Dowód (I) zostawiamy jako ćwiczenie. Do dowodu (II) zauważmy, że jest wnętrzem zbioru . Ponadto jest zbiorem wielościennym, a zatem wypukłym (patrz lemat 4.5). Zastosowanie lematu 3.2 kończy dowód.
∎Jeśli w punkcie spełniony jest warunek Slatera, to .
Pokażemy najpierw, że . Niech taki że dla . Z pseudowypukłości w punkcie dostajemy dla , czyli .
Na mocy lematu 6.1 mamy . Udowodniliśmy także, że oraz, że jest domknięty. A zatem .
∎Dowód analogicznego twierdzenia dla warunku liniowej niezależności wymaga pomocniczego lematu w stylu lematu Farkasa. Wynik ten jest jednak wcześniejszy i został uzyskany przez Paul'a Gordana w 1873 roku.
Niech będzie macierzą . Wówczas dokładnie jeden z układów ma rozwiązanie:
Dowód rozpoczniemy od uzasadnienia, że oba te układy nie mogą mieć rozwiązania jednocześnie. Załóżmy więc przez sprzeczność, że istnieją spełniające (1)-(2). Z faktu, że rozwiązuje (2), dostajemy, że . Z drugiej strony rozwiązuje (1), czyli dla każdego . Pamiętając, że , , i mamy . Dostaliśmy więc sprzeczność, co dowodzi, że nie może istnieć jednocześnie rozwiązanie (1) i (2).
Następnym krokiem dowodu będzie wykazanie, że zawsze któryś z układów ma rozwiązanie. W tym celu udowodnimy, że jeśli układ (1) nie ma rozwiązania, to układ (2) ma rozwiązanie. W tym celu zdefiniujmy następujące zbiory wypukłe:
Z faktu, że układ (1) nie ma rozwiązania, wynika, iż zbiory te są rozłączne. Słabe twierdzenie o oddzielaniu implikuje istnienie wektora , , takiego że
Wykażemy, że . Przypuśćmy przeciwnie, że istnieje współrzędna . Rozważmy ciąg , gdzie jest na -tej pozycji. Wówczas oraz , a zatem dostaliśmy sprzeczność, gdyż jest skończone.
Wiemy zatem, że wektor ma wszystkie współrzędne nieujemne. Pociąga to . Weźmy . Wówczas , czyli . A zatem
co implikuje, że , czyli . Rozwiązaniem układu (2) jest zatem .
∎Jeśli w punkcie spełniony jest warunek liniowej niezależności, to .
Identycznie jak w dowodzie tw. 6.2 wystarczy pokazać, że . Niech będzie macierzą składającą się z gradientów ograniczeń aktywnych (jako rzędów). Na mocy liniowej niezależności nie istnieje wektor , , o tej własności, że . Nie istnieje więc rozwiązanie układu (2) w lemacie 6.2. A zatem ma rozwiązanie układ (1), czyli istnieje , takie że :
Stąd .
∎Rozważmy problem optymalizacji na zbiorze:
Zbiór . Ograniczenia są opisane przez trójkę funkcji
W punkcie wszystkie ograniczenia są aktywne i mamy
Warunek liniowej niezależności ograniczeń nie jest spełniony w . Ograniczenia aktywne nie są również afiniczne. Pozostaje zatem sprawdzić warunek Slatera. Wszystkie funkcje ograniczeń są wypukłe, a więc także pseudowypukłe. W punkcie mamy dla . Zachodzi więc warunek Slatera.
Rozważmy zadanie optymalizacyjne:
Zbiór punktów dopuszczalnych naszkicowany jest na rysunku 6.1. Zapiszmy funkcje opisujące ograniczenia:
Zauważmy, że w każdym punkcie dopuszczalnym, poza , spełniony jest warunek liniowej niezależności. Widać jednak, że rozwiązaniem powyższego problemu optymalizacyjnego jest . Niestety w tym punkcie :
Niech będzie macierzą symetryczną . Rozważmy zadanie optymalizacyjne:
Zapiszmy najpierw problem optymalizacyjny w kanonicznej formie. Zauważmy przy tym, że warunek jest równoważny .
Oznaczmy przez zbiór punktów dopuszczalnych. Zauważmy, że w każdym punkcie dopuszczalnym spełnione są warunki liniowej niezależności i Slatera. Wynika stąd, że rozwiązanie powyższego zadania spełnia warunki konieczne pierwszego rzędu (warunki Kuhna-Tuckera (5.5)). Znajdziemy teraz wszystkie punkty ,,podejrzane”.
Warunki Kuhna-Tuckera mają następującą postać:
Przypadek . Wówczas (z powodu drugiego równania) i pierwsze równanie przyjmuje postać , którą poprzez transponowanie obu stron sprowadzamy do
Równanie to spełnione jest przez wszystkie , . W szczególności ma ono co najmniej jedno rozwiązanie ().
Przypadek . Teraz nic nie możemy powiedzieć o . Może być zerowe lub dodatnie. Pierwsze równanie przyjmuje jednak postać , które po stransponowaniu wygląda następująco:
Rozwiązaniami są zatem wektory własne () odpowiadające nieujemnym wartościom własnym (). Zbiór rozwiązań może być pusty, jeśli wszystkie wartości własne są ujemne.
Podsumowując, zbiór punktów podejrzanych, czyli punktów, w których spełniony jest warunek konieczny pierwszego rzędu, ma postać:
Na obecnym etapie nie mamy żadnej techniki pozwalającej na znalezienie rozwiązania. Możemy tylko posłużyć się zdrowym rozsądkiem. Otóż, jeśli , to wartość funkcji celu jest zerowa. Dla dowolnego elementu drugiego zbioru, wartość funkcji celu jest równa wartości własnej. Możemy zatem wyciągnąć następujący wniosek: jeśli maksymalna wartość własna jest dodatnia, to każdy wektor jej odpowiadający jest rozwiązaniem globalnym. Jeśli macierz nie ma wartości własnych większych od zera, to rozwiązaniem jest dowolny punkt z jądra o normie nie większej niż .
Uzasadnij prawdziwość stwierdzenia umieszczonego w uwadze 6.1, by później udowodnić, że , gdzie zdefiniowane jest w lemacie 6.1.
Przez ”punkty podejrzane” problemu optymalizacyjnego rozumiemy takie punkty dopuszczalne, w których nie są spełnione warunki regularności albo spełnione są warunki konieczne pierwszego rzędu. Znajdź wszystkie punkty podejrzane dla następującego problemu optymalizacyjnego:
Czy w którymś z nich jest rozwiązanie? Jeśli tak, to w którym? Odpowiedź uzasadnij.
Znajdź zbiór rozwiązań problemu optymalizacyjnego
gdzie . Uzasadnij, że są to wszystkie rozwiązania.
Znajdź rozwiązania globalne problemu optymalizacyjnego
Znajdź minima i maksima globalne funkcji
na zbiorze
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.