Rozważmy problem optymalizacyjny
(5.1) |
gdzie i . Niech będzie rozwiązaniem lokalnym. Będziemy chcieli powiązać geometrię lokalną zbioru w punkcie z zachowaniem funkcji , czyli kierunkami spadku jej wartości. Przez lokalną geometrię rozumiemy zbiór kierunków, w których możemy się poruszyć z punktu nie opuszczając .
Stożkiem kierunków stycznych do w punkcie nazywamy zbiór wektorów takich że
dla pewnych , i .
Powyższa definicja mówi, iż kierunek należy do stożka kierunków stycznych , jeśli jest on granicą kierunków wyznaczonych przez ciąg punktów dopuszczalnych zmierzających to Zapisać możemy to formalnie w następujący sposób:
(5.2) |
Dowód tej tożsamości oraz poniższego lematu pozostawiamy jako ćwiczenie.
Zbiór jest stożkiem, tzn. dla dowolnych i . W szczególności, .
Jeśli jest punktem wewnętrznym zbioru , to .
Stożek jest domknięty.
Na rysunku 5.1 znajdują się trzy przykłady zbiorów i stożków do nich stycznych w punkcie . Stożki te są przesunięte o wektor , by pokazać ich zależność od kształtu zbioru. W przykładzie (a) i (c) zakładamy, że brzeg zbioru jest gładki, więc stożki te są półprzestrzeniami ograniczonymi przez styczną w . W przykładzie (b) zbiór to środek narysowanego stożka (bez brzegu). Wówczas stożek kierunków stycznych jest domknięciem zbioru .
Jak już wspomnieliśmy, stożek kierunków stycznych jest ściśle związany z rozwiązaniem zagadnienia (5.1). Jeśli w punkcie funkcja ma minimum lokalne na , to wówczas kierunki spadku wartości funkcji nie mogą należeć do zbioru kierunków stycznych w punkcie . Gdyby tak nie było, to poruszając się w kierunku spadku funkcji zmniejszalibyśmy jej wartość jednocześnie pozostając w zbiorze . Intuicje te formalizujemy poniżej.
Niech będzie różniczkowalna w . Zbiorem kierunków spadku funkcji w punkcie nazywamy
Weźmy . Wówczas dla pewnego ciągu punktów zbieżnego do oraz ciągu liczb . Z definicji różniczkowalności w mamy
Z faktu, że jest rozwiązaniem lokalnym dla dostatecznie dużych . W połączeniu z powyższym wzorem daje to następujące oszacowanie:
Mnożąc obie strony powyższej nierówności przez dostajemy
Zrobimy teraz sztuczkę, aby rozwiązać problem z i przejdziemy z to nieskończoności:
Udowodniliśmy zatem, że , czyli . Kończy to dowód twierdzenia.
∎Rozważmy następujący problem optymalizacyjny:
Oznaczmy i . Zbadamy zbiory i w następujących punktach: .
. Punkt ten leży wewnątrz zbioru , czyli . Zbiór kierunków spadku funkcji dany jest następująco:
W oczywisty sposób część wspólna powyższych zbiorów nie jest pusta, czyli w punkcie nie ma minimum.
. Punkt ten leży na brzegu zbioru . Łatwo można zauważyć, że
Zbiory te mają niepuste przecięcie (patrz podwójna kratka na rys. 5.2), więc w punkcie nie ma minimum.
. Zauważmy, że
Zbiory te mają zatem puste przecięcie, więc w punkcie może być minimum.
Bezpośrednie wykorzystanie twierdzenia 5.1 do szukania kandydatów na rozwiązania zadań z ograniczeniami nie wygląda zachęcająco. Dlatego postaramy się opisać prościej zbiór oraz warunek .
Zajmiemy się problemem optymalizacyjnym w następującej formie:
(5.3) |
gdzie jest zbiorem otwartym i . A zatem
(5.4) |
Funkcje nazywane są ograniczeniami nierównościowymi, zaś cały problem (5.3) zadaniem optymalizacyjnym z ograniczeniami nierównościowymi.
Ustalmy i załóżmy, że funkcje są ciągłe. Wówczas ruch wokół ograniczają lokalnie tylko te warunki, dla których . W przypadku pozostałych, z ciągłości wynika, iż istnieje pewne otoczenie , na którym mamy . Okazuje się, że ta obserwacja będzie pełnić ważną rolę w procesie optymalizacji z ograniczeniami nierównościowymi.
Zbiorem ograniczeń aktywnych w punkcie nazywamy zbiór
Głównym wynikiem tego rozdziału będzie powiązanie własności ograniczeń aktywnych w danym punkcie z lokalną geometrią tego zbioru wokół . W tym celu wprowadźmy następującą definicję.
Niech i różniczkowalne w dla ograniczeń aktywnych . Stożkiem kierunków stycznych dla ograniczeń zlinearyzowanych nazywamy zbiór
Stożek kierunków stycznych dla ograniczeń zlinearyzowanych jest zbiorem wielościennym, a zatem wypukłym i domkniętym.
Jeśli , to
Dowód przebiega bardzo podobnie do dowodu twierdzenia 5.1. Weźmy . Wówczas dla pewnego ciągu punktów zbieżnego do oraz ciągu liczb dodatnich . Ustalmy . Z definicji różniczkowalności w mamy
Ograniczenie -te jest aktywne w . Zatem . Oczywiście, , ponieważ . W połączeniu w powyższym wzorem daje to następujące oszacowanie:
Mnożąc obie strony powyższej nierówności przez dostajemy
Zrobimy teraz sztuczkę, aby rozwiązać problem i przejdziemy z to nieskończoności:
Udowodniliśmy zatem, że . Analogicznie wynik otrzymujemy dla każdego ograniczenia aktywnego . A zatem
∎Rozważmy zbiór , patrz rysunek 5.3. Zapiszmy go w kanonicznej formie (5.4):
Zbadajmy trzy punktu tego zbioru , i .
: i .
: , ,
: , ,
Rozważmy ten sam zbiór co w powyższym przykładzie, lecz zapiszmy go nieco inaczej:
Zmianie uległo drugie ograniczenie: z na . Nowy opis zbioru odpowiada ograniczeniom , . Rozważmy zbiory i w punkcie . Stożek kierunków stycznych jest identyczny, gdyż zbiór się nie zmienił:
Natomiast stożek kierunków stycznych dla ograniczeń zlinearyzowanych jest następujący:
Widzimy zatem, że nie zawsze zachodzi równość pomiędzy i .
W lemacie 5.2 wykazaliśmy, że . Pokazaliśmy w przykładach, że dość często mamy równość tych dwóch zbiorów. Okazuje się, że to bardzo ważna własność, która będzie punktem wyjścia dla całej teorii optymalizacji nieliniowej Kuhna-Tucker'a. Zanim jednak przejdziemy do głównego twierdzenia dowiedziemy pomocniczy, lecz bardzo ważny lemat.
Niech będzie macierzą i . Wówczas dokładnie jeden z układów ma rozwiązanie:
Pokażemy najpierw, że jeśli układ (2) ma rozwiązanie, to układ (1) go nie ma. Weźmy zatem spełniające (2). Zatem . Wstawiamy to do układu (1) i otrzymujemy
Pierwsza nierówność oznacza, że każda współrzędna wektora jest niedodatnia. Ponieważ współrzędne są nieujemne, to iloczyn skalarny jest niedodatni. Przeczy to drugiej nierówności, a zatem dowodzi, że (1) nie ma rozwiązania.
Załóżmy teraz, że układ (2) nie ma rozwiązania. Zdefiniujmy zbiór
Łatwo sprawdzić, że jest to zbiór wypukły i domknięty. Z faktu, że układ (2) nie ma rozwiązania wynika, że . Zastosujmy więc mocne twierdzenia o oddzielaniu, tw. 3.2 do zbiorów i . Istnieje więc wektor taki że
Pokażemy, że jest rozwiązaniem układu (1). Oznaczmy . Ponieważ , to , co pociąga . Pozostaje tylko udowodnić, że . Przypuśćmy, że -ta współrzędna jest dodatnia. Z definicji zbioru wynika, że dla dowolnego zachodzi . Zdefiniujmy ciąg , gdzie jest na -tej współrzędnej. Na mocy założenia o dodatniości dostajemy
co przeczy temu, że . Sprzeczność ta dowodzi, że .
∎Niech będzie rozwiązaniem lokalnym (5.3). Jeśli funkcje oraz , , są różniczkowalne w oraz , to istnieje , takie że
(5.5) |
Często tezę powyższego twierdzenia zapisuje się biorąc sumę po wszystkich :
Jest to naginanie notacji, gdyż funkcje opisujące ograniczenia nieaktywne nie muszą być różniczkowalne w punkcie . Z drugiej strony są one mnożone przez zerowe współczynniki . Jest to pewne usprawiedliwienie powyższej notacji, którą należy rozumieć tak, jak zapisane zostało w twierdzeniu 5.2.
Na mocy twierdzenia 5.1 mamy . Dalej, korzystając z założenia, dostajemy , co innymi słowy oznacza, że nie istnieje rozwiązanie układu
Stosujemy lemat Farkasa z i macierzą złożoną wierszowo z gradientów ograniczeń aktywnych , . Istnieje zatem takie że lub inaczej
Zdefiniujmy następująco: i . Wówczas powyższa równość jest równoważna następującej
Z definicji oczywiste jest, że .
∎Założenia twierdzenia Kuhna-Tuckera są trywialnie spełnione, gdy , tzn. gdy . Wówczas warunki (5.5) sprowadzają się do
Na zakończenie zwróćmy jeszcze raz uwagę na tezę twierdzenia Kuhna-Tuckera. Warunki (5.5) nazywane są warunkami koniecznymi pierwszego rzędu. Wektor będzie pojawiał się jeszcze wiele razy na tym wykładzie. Nadajmy mu zatem nazwę:
Wektor spełniający (5.5) nazywa się wektorem mnożników Lagrange'a w punkcie .
Wykaż, że zbiór dla jest stożkiem.
Udowodnij, że stożek kierunków stycznych jest zbiorem domkniętym.
Udowodnij tożsamość (5.2).
Znajdź stożek kierunków stycznych do zbioru w punkcie , gdy
Udowodnić, że dla zadania
warunek konieczny pierwszego rzędu przyjmuje postać:
Nierówność dla wektorów oznacza nierówność po współrzędnych.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.