Dotychczas mnożniki Lagrange'a wydawały się techniczną sztuczką służącą do znajdowania rozwiązania problemu optymalizacyjnego z ograniczeniami. W tym rozdziale pokażemy, że pełnią one rolę kosztu związanego ze zmianą ograniczeń. Oddzielnie zajmiemy się ograniczeniami równościowymi i nierównościowymi.
Rozważmy problem optymalizacyjny z ograniczeniami równościowymi:
![]() |
(11.1) |
gdzie
jest zbiorem otwartym i
. Dla uproszczenia notacji połóżmy
. Rozważmy problem zaburzony, tzn.
![]() |
(11.2) |
gdzie ![]()
Niech
będzie rozwiązaniem lokalnym problemu (11.1), zaś
wektorem jego mnożników Lagrange'a. Załóżmy, że funkcje
są klasy
na otoczeniu
, gradienty ograniczeń są liniowo niezależne (spełniony jest warunek liniowej niezależności) oraz
| (11.3) |
dla
spełniających
,
Wówczas istnieje otoczenie
punktu
oraz funkcja
klasy
, taka że
oraz
jest ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Ponadto,
Na mocy tw. 8.1 punkt
rozwiązuje układ równań:
![]() |
gdzie
![]() |
Zaburzając prawą stronę drugiej równości przez
będziemy chcieli pokazać, że istnieje rozwiązanie, które jest funkcją
klasy
. Rozważmy więc układ:
gdzie niewiadomymi są
oraz
.
Zdefiniujmy funkcję
wzorem
![]() |
Zaburzony układ możemy wówczas zapisać jako
Wiemy, że
Skorzystamy z twierdzenia o funkcji uwikłanej, aby rozwikłać pierwsze dwie zmienne w zależności od trzeciej. W tym celu rozważamy macierz pochodnych
:
![]() |
Warunek liniowej niezależności gradientów ograniczeń implikuje nieosobliwość podmacierzy
![]() |
Spełnione są zatem założenia twierdzenia 8.4 i istnieje otoczenie
punktu
oraz funkcje
i
klasy
, takie że dla
zachodzi
, czyli
Korzystając z faktu, iż funkcje
są ciągłe oraz nierówność (11.3) spełniona jest dla niezaburzonego problemu, wnioskujemy, że istnieje być może mniejsze otoczenie
punktu
, takie że
dla
i
spełniających
,
Kluczowa dla tego wyniku jest ostra nierówność w warunku (11.3). Na mocy tw. 9.3 punkt
jest zatem ścisłym rozwiązaniem lokalnym problemu zaburzonego (11.2). Przypomnijmy, że funkcja
jest klasy
. Możemy zatem zdefiniować pochodną złożenia
Od zakończenia dowodu dzielą nas dwa spostrzeżenia. Po pierwsze, mnożąc obie strony warunku koniecznego pierwszego rzędu dla problemu niezaburzonego
przez
dostajemy
Po drugie, rózniczkując
po
otrzymujemy w punkcie
następującą pochodną
, czyli
Upraszcza to powyższe równanie do
Stąd już teza wynika natychmiast.
∎Twierdzenie 11.1 można rozumieć następująco: nieznaczna zmiana
-tego ograniczenia z zera do
prowadzi do zmiany optymalnej wartości funkcji
o
, tzn. dla małych
zmiana ta jest w przybliżeniu równa ![]()
W przypadku ograniczeń nierównościowych zastosujemy inne podejście. Skoncentrujemy się na zadaniu optymalizacji wypukłej:
![]() |
(11.4) |
gdzie
jest wypukły,
są wypukłe. Dla uproszczenia notacji będziemy pisać
. Problem (11.4) zapisujemy więc jako
![]() |
(11.5) |
Rozważmy zadanie zaburzone: dla ![]()
![]() |
(11.6) |
Niech
będzie zbiorem takich
, dla których zbiór punktów dopuszczalnych
jest niepusty.
Funkcją perturbacji nazywamy funkcję
określoną dla
należących do dziedziny
.
Zauważmy, że
dla
, ale może się zdarzyć, że
.
![]()
Zbiór
jest wypukły.
Funkcja
jest wypukła.
Jeśli istnieje punkt
, taki że
,
to
i
.
Z wypukłości
wynika następująca implikacja:
| (11.7) |
Będziemy korzystać z tego spostrzeżenia wielokrotnie w dowodzie.
(1) Niech
i
Wówczas istnieją
takie że
i
Z wzoru (11.7) dostajemy
, skąd wynika ![]()
(2) Niech
i
Wówczas
gdzie pierwsza nierówność wynika z wypukłości
, zaś ostatnia – z własności (11.7):
(3) Musimy udowodnić, że zbiór dopuszczalny
jest niepusty dla
z pewnego otoczenia
. Wiemy, że istnieje punkt
, taki że
,
Weźmy
Wówczas dla każdego
mamy
Zatem
.
Jeśli
dla pewnego
, to dla dowolnego
i
mamy z wypukłości ![]()
Jeśli
dla pewnego
, to
dla
Wynika to wprost z powyższej uwagi.
Jeśli istnieje
taki że
, to
dla każdego
Inaczej mielibyśmy sprzeczność z punktem (2).
Jeśli w problemie optymalizacji wypukłej istnieje punkt
, taki że
,
oraz
, to
dla każdego
oraz istnieje wektor
wyznaczający płaszczyznę podpierającą
:
Z tw. 11.2 wynika, że
jest funkcją wypukłą i
Zatem na mocy ostatniej z powyższych uwag mamy
dla
Istnienie płaszczyzny podpierającej wynika z tw. 3.8:
dla pewnego
Udowodnimy teraz, że wszystkie współrzędne
muszą być nieujemne. Przypuśćmy przeciwnie, tzn.
dla pewnego
Ponieważ
, to dla dostatecznie małego
punkt
, gdzie
jest na
-tej pozycji, należy do
. Korzystając z ujemności
mamy
Z drugiej strony
, czyli
To daje sprzeczność, czyli dowiedliśmy, że ![]()
Wektor
nazywamy wektorem wrażliwości dla problemu (11.4). Z tw. 3.8 wynika, że jeśli funkcja
jest różniczkowalna w punkcie
, to
Zatem
oznacza szybkość i kierunek zmian wartości minimalnej
przy zmianie ograniczeń, podobnie jak w przypadku ograniczeń równościowych omawianych wcześniej w tym rozdziale.
Zbadajmy teraz relacje pomiędzy wektorem wrażliwości a punktem siodłowym i warunkiem pierwszego rzędu. Zauważmy, że powiązanie punktu siodłowego z wektorem wrażliwości nie wymaga wypukłości problemu optymalizacyjnego.
Jeśli
jest punktem siodłowym funkcji Lagrange'a na zbiorze
, to
jest wektorem wrażliwości (tzn. wyznacza płaszczyznę podpierającą). Teza ta nie wymaga założenia o wypukłości problemu optymalizacyjnego.
Załóżmy, że funkcje
są różniczkowalne w
, i wypukłe. Jeśli w
spełniony jest warunek pierwszego rzędu z mnożnikami Lagrange'a
, to
jest wektorem wrażliwości.
(1) Oznaczmy przez
funkcję Langrange'a dla problemu zaburzonego. Wówczas
![]() |
Z faktu, że
jest punktem siodłowym wynika, że
Zatem
| (11.8) |
Zauważmy, że dla dowolnego
i
mamy
czyli, w szczególności,
Wstawiając tą zależność do (11.8) otrzymujemy
(2) Z zadania 10.1 wynika, iż punkt
jest punktem siodłowym funkcji Lagrange'a. Tezę dostajemy z pierwszej części niniejszego twierdzenia.
Dla problemu
![]() |
Znaleźć
.
Znaleźć wektor wrażliwości.
Znaleźć funkcję perturbacji.
Umieszczenie ograniczenia
było intencją autora zadania.
Znajdź funkcję perturbacji i wektor wrażliwości dla problemu
![]() |
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje
i
są klasy
oraz
. Czy funkcja perturbacji musi być wówczas klasy
? Udowodnij lub podaj kontrprzykład.
Załóżmy, że w zadaniu optymalizacyjnym (11.4) funkcje
i
są ciągłe oraz
. Czy funkcja perturbacji musi być wówczas ciągła? Udowodnij lub podaj kontrprzykład.
Rozważmy problem producenta. Dysponuje on budżetem
, który może spożytkować na wytworzenie dwóch rodzajów towarów. Pierwszy z towarów sprzedaje po cenie
, zaś drugi – po cenie
Cena produkcji opisana jest funkcją
, gdzie wektor
opisuje wielkość produkcji każdego z towarów. Celem producenta jest maksymalizacja przychodów ze sprzedaży bez przekroczenia budżetu produkcyjnego:
![]() |
Podaj warunki konieczne istnienia rozwiązania powyższego problemu.
Załóżmy, że
jest funkcją wypukłą. Jak należy zmodyfikować wielkość produkcji, jeśli budżet produkcyjny
wrośnie nieznacznie?
Rozważmy funkcję
zadaną wzorem
Uzasadnij, że funkcja
jest dobrze określona i wypukła.
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.