Dotychczas mnożniki Lagrange'a wydawały się techniczną sztuczką służącą do znajdowania rozwiązania problemu optymalizacyjnego z ograniczeniami. W tym rozdziale pokażemy, że pełnią one rolę kosztu związanego ze zmianą ograniczeń. Oddzielnie zajmiemy się ograniczeniami równościowymi i nierównościowymi.
Rozważmy problem optymalizacyjny z ograniczeniami równościowymi:
(11.1) |
gdzie jest zbiorem otwartym i . Dla uproszczenia notacji połóżmy . Rozważmy problem zaburzony, tzn.
(11.2) |
gdzie
Niech będzie rozwiązaniem lokalnym problemu (11.1), zaś wektorem jego mnożników Lagrange'a. Załóżmy, że funkcje są klasy na otoczeniu , gradienty ograniczeń są liniowo niezależne (spełniony jest warunek liniowej niezależności) oraz
(11.3) |
dla spełniających , Wówczas istnieje otoczenie punktu oraz funkcja klasy , taka że oraz jest ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Ponadto,
Na mocy tw. 8.1 punkt rozwiązuje układ równań:
gdzie
Zaburzając prawą stronę drugiej równości przez będziemy chcieli pokazać, że istnieje rozwiązanie, które jest funkcją klasy . Rozważmy więc układ:
gdzie niewiadomymi są oraz . Zdefiniujmy funkcję wzorem
Zaburzony układ możemy wówczas zapisać jako
Wiemy, że Skorzystamy z twierdzenia o funkcji uwikłanej, aby rozwikłać pierwsze dwie zmienne w zależności od trzeciej. W tym celu rozważamy macierz pochodnych :
Warunek liniowej niezależności gradientów ograniczeń implikuje nieosobliwość podmacierzy
Spełnione są zatem założenia twierdzenia 8.4 i istnieje otoczenie punktu oraz funkcje i klasy , takie że dla zachodzi , czyli
Korzystając z faktu, iż funkcje są ciągłe oraz nierówność (11.3) spełniona jest dla niezaburzonego problemu, wnioskujemy, że istnieje być może mniejsze otoczenie punktu , takie że
dla i spełniających , Kluczowa dla tego wyniku jest ostra nierówność w warunku (11.3). Na mocy tw. 9.3 punkt jest zatem ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Przypomnijmy, że funkcja jest klasy . Możemy zatem zdefiniować pochodną złożenia
Od zakończenia dowodu dzielą nas dwa spostrzeżenia. Po pierwsze, mnożąc obie strony warunku koniecznego pierwszego rzędu dla problemu niezaburzonego
przez dostajemy
Po drugie, rózniczkując po otrzymujemy w punkcie następującą pochodną , czyli Upraszcza to powyższe równanie do
Stąd już teza wynika natychmiast.
∎Twierdzenie 11.1 można rozumieć następująco: nieznaczna zmiana -tego ograniczenia z zera do prowadzi do zmiany optymalnej wartości funkcji o , tzn. dla małych zmiana ta jest w przybliżeniu równa
W przypadku ograniczeń nierównościowych zastosujemy inne podejście. Skoncentrujemy się na zadaniu optymalizacji wypukłej:
(11.4) |
gdzie jest wypukły, są wypukłe. Dla uproszczenia notacji będziemy pisać . Problem (11.4) zapisujemy więc jako
(11.5) |
Rozważmy zadanie zaburzone: dla
(11.6) |
Niech będzie zbiorem takich , dla których zbiór punktów dopuszczalnych jest niepusty. Funkcją perturbacji nazywamy funkcję
określoną dla należących do dziedziny .
Zauważmy, że dla , ale może się zdarzyć, że .
Zbiór jest wypukły.
Funkcja jest wypukła.
Jeśli istnieje punkt , taki że , to i .
Z wypukłości wynika następująca implikacja:
(11.7) |
Będziemy korzystać z tego spostrzeżenia wielokrotnie w dowodzie.
(1) Niech i Wówczas istnieją takie że i Z wzoru (11.7) dostajemy , skąd wynika
(2) Niech i Wówczas
gdzie pierwsza nierówność wynika z wypukłości , zaś ostatnia – z własności (11.7):
(3) Musimy udowodnić, że zbiór dopuszczalny jest niepusty dla z pewnego otoczenia . Wiemy, że istnieje punkt , taki że , Weźmy Wówczas dla każdego mamy Zatem .
∎Jeśli dla pewnego , to dla dowolnego i mamy z wypukłości
Jeśli dla pewnego , to dla Wynika to wprost z powyższej uwagi.
Jeśli istnieje taki że , to dla każdego Inaczej mielibyśmy sprzeczność z punktem (2).
Jeśli w problemie optymalizacji wypukłej istnieje punkt , taki że , oraz , to dla każdego oraz istnieje wektor wyznaczający płaszczyznę podpierającą :
Z tw. 11.2 wynika, że jest funkcją wypukłą i Zatem na mocy ostatniej z powyższych uwag mamy dla Istnienie płaszczyzny podpierającej wynika z tw. 3.8:
dla pewnego Udowodnimy teraz, że wszystkie współrzędne muszą być nieujemne. Przypuśćmy przeciwnie, tzn. dla pewnego Ponieważ , to dla dostatecznie małego punkt , gdzie jest na -tej pozycji, należy do . Korzystając z ujemności mamy
Z drugiej strony , czyli To daje sprzeczność, czyli dowiedliśmy, że
∎Wektor nazywamy wektorem wrażliwości dla problemu (11.4). Z tw. 3.8 wynika, że jeśli funkcja jest różniczkowalna w punkcie , to Zatem oznacza szybkość i kierunek zmian wartości minimalnej przy zmianie ograniczeń, podobnie jak w przypadku ograniczeń równościowych omawianych wcześniej w tym rozdziale.
Zbadajmy teraz relacje pomiędzy wektorem wrażliwości a punktem siodłowym i warunkiem pierwszego rzędu. Zauważmy, że powiązanie punktu siodłowego z wektorem wrażliwości nie wymaga wypukłości problemu optymalizacyjnego.
Jeśli jest punktem siodłowym funkcji Lagrange'a na zbiorze , to jest wektorem wrażliwości (tzn. wyznacza płaszczyznę podpierającą). Teza ta nie wymaga założenia o wypukłości problemu optymalizacyjnego.
Załóżmy, że funkcje są różniczkowalne w , i wypukłe. Jeśli w spełniony jest warunek pierwszego rzędu z mnożnikami Lagrange'a , to jest wektorem wrażliwości.
(1) Oznaczmy przez funkcję Langrange'a dla problemu zaburzonego. Wówczas
Z faktu, że jest punktem siodłowym wynika, że
Zatem
(11.8) |
Zauważmy, że dla dowolnego i mamy czyli, w szczególności,
Wstawiając tą zależność do (11.8) otrzymujemy
(2) Z zadania 10.1 wynika, iż punkt jest punktem siodłowym funkcji Lagrange'a. Tezę dostajemy z pierwszej części niniejszego twierdzenia.
∎Dla problemu
Znaleźć .
Znaleźć wektor wrażliwości.
Znaleźć funkcję perturbacji.
Umieszczenie ograniczenia było intencją autora zadania.
Znajdź funkcję perturbacji i wektor wrażliwości dla problemu
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje i są klasy oraz . Czy funkcja perturbacji musi być wówczas klasy ? Udowodnij lub podaj kontrprzykład.
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje i są ciągłe oraz . Czy funkcja perturbacji musi być wówczas ciągła? Udowodnij lub podaj kontrprzykład.
Rozważmy problem producenta. Dysponuje on budżetem , który może spożytkować na wytworzenie dwóch rodzajów towarów. Pierwszy z towarów sprzedaje po cenie , zaś drugi – po cenie Cena produkcji opisana jest funkcją , gdzie wektor opisuje wielkość produkcji każdego z towarów. Celem producenta jest maksymalizacja przychodów ze sprzedaży bez przekroczenia budżetu produkcyjnego:
Podaj warunki konieczne istnienia rozwiązania powyższego problemu.
Załóżmy, że jest funkcją wypukłą. Jak należy zmodyfikować wielkość produkcji, jeśli budżet produkcyjny wrośnie nieznacznie?
Rozważmy funkcję zadaną wzorem
Uzasadnij, że funkcja jest dobrze określona i wypukła.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.