W tym podrozdziale przypomnimy krótko twierdzenia Taylora dla funkcji wielu zmiennych. Wprowadźmy najpierw niezbędną notację.
Niech
, gdzie
jest zbiorem otwartym. Przyjmiemy następujące oznaczenia:
– wektor kolumnowy,
,
– gradient funkcji
,
– Hesjan funkcji
:
![]() |
Funkcja
jest różniczkowalna w punkcie
, jeśli istnieje wektor
, taki że
dla ![]()
Funkcja
jest dwukrotnie różniczkowalna w punkcie
, jeśli istnieje wektor
oraz macierz
, takie że
dla ![]()
Możemy założyć, że macierz
w powyższej definicji jest symetryczna. Wystarczy zauważyć, że
![]()
I) Jeśli funkcja
jest różniczkowalna w
, to
istnieje i
. Odwrotnie, jeśli
istnieje w pewnym otoczeniu
i jest ciągłe w
, to
jest różniczkowalna w
.
II) Jeśli hesjan
istnieje w pewnym otoczeniu
i jest ciągły w
, to
jest dwukrotnie różniczkowalna w
,
jest macierzą symetryczną oraz
.
Dowód powyższego twierdzenia pomijamy. Zainteresowany czytelnik znajdzie go w podręcznikach analizy wielowymiarowej.
Ilekroć będziemy chcieli wykorzystać drugą pochodną funkcji wielowymiarowej, bedziemy musieli zakładać, że hesjan
jest funkcją ciągłą. Jeśli nie poczynimy takiego założenia, nie będziemy mieli dobrego sposobu na policzenie drugiej pochodnej, a zatem taki rezultat będzie miał małą wartość praktyczną.
Dla funkcji
określonej na zbiorze otwartym
mówimy, że
jest klasy
(odpowiednio, klasy
) i piszemy
(
), gdy
jest ciągła na
oraz
(odpowiednio,
i
) istnieją
i są ciągłe na
. Gdy rozważany zbiór
nie jest otwarty, mówimy że
jest klasy
(odpowiednio, klasy
) na
, jeśli istnieje
rozszerzenie
funkcji
do zbioru otwartego
zawierającego
takie, że
jest klasy
(odpowiednio, klasy
) na
. W tym wypadku można więc mówić o pochodnych cząstkowych funkcji
również w
punktach brzegowych zbioru
. Pochodne te są jednoznacznie określone przez wartości funkcji na
, jeśli
zachodzi
(wynika to z ciągłości tych pochodnych).
Zapiszemy teraz rozwinięcie Taylora rzędu
.
Niech
otwarty. Dla funkcji
klasy
i punktów
takich, że odcinek łączący
z
leży w
zachodzi
gdzie
jest pewnym punktem wewnątrz odcinka łączącego
z
.
Dowód wynika z zastosowania twierdzenia 1.10 do funkcji
,
.
Podzbiór
jest wypukły, jeśli
dla każdych
i każdego
.
Niech
zbiór otwarty, wypukły oraz
klasy
. Wówczas dla dowolnych
mamy
gdzie
należy do wnętrza odcinka łączącego
i
, tzn. istnieje
, taka że
.
Z wypukłości
wynika, że dla każdego
odcinek łączący te punkty zawarty jest w
. Teza wynika teraz z lematu 2.1.
Będziemy rozważać funkcję
, gdzie
jest podzbiorem w
mającym niepuste wnętrze
.
Jeśli funkcja
jest różniczkowalna w punkcie
należącym do wnętrza zbioru
oraz
jest lokalnym minimum (maksimum) funkcji
to
Z faktu, że
wynika, że funkcja
, gdzie
jest
-tym wersorem (tj.
ma jedynkę na
-tej współrzędnej i zera poza nią), jest dobrze określona na otoczeniu
. Ma ona również lokalne ekstremum w punkcie
. Na mocy tw. 1.4 mamy
. W terminach funkcji
oznacza to, że
. Przeprowadzając to rozumowanie dla
dostajemy tezę..
Warunek znikania gradientu będzie często używany, zatem użyteczna będzie
Punkt
nazywamy punktem krytycznym funkcji
, jeśli
jest różniczkowalna w
oraz
.
Oczywiście, warunek znikania gradientu
nie jest wystarczający na to, by w
znajdowało się lokalne minimum lub maksimum. Do rozstrzygnięcia tego jest potrzebny analog warunku o znaku drugiej pochodnej (tw. 1.6). W przypadku wielowymiarowym ten warunek definiuje się jako dodatnią (ujemną) określoność macierzy drugich pochodnych.
Niech
będzie macierzą symetryczną, tzn.
. Rozważmy formę kwadratową
![]() |
Określoność macierzy
lub formy kwadratowej
definiujemy następująco:
jest nieujemnie określona, co oznaczamy
, jeśli
jest dodatnio określona, co oznaczamy
, jeśli
Odwracając nierówności definiujemy niedodatnią określoność i ujemną określoność.
Macierz
nazywamy nieokreśloną, jeśli istnieją wektory
takie, że
Zauważmy, że z definicji określoności macierzy, wyliczając wyrażenie
na wersorze
, z jedynką na
-tym miejscu, wynikają następujące warunki konieczne odpowiedniej określoności macierzy
:
Jeśli
jest dodatnio określona, to
.
Jeśli
jest nieujemnie określona, to
.
Jeśli
jest ujemnie określona, to
.
Jeśli
jest niedodatnio określona, to
.
Jeśli
i
, dla pewnych
,
, to
jest nieokreślona.
Warunki konieczne i dostateczne podane są w poniższym twierdzeniu, którego dowód pomijamy.
![]()
I. Forma kwadratowa
jest dodatnio określona wtedy i tylko wtedy, gdy zachodzi:
gdzie przez
oznaczamy minory główne macierzy
:
![]() |
Forma kwadratowa
jest ujemnie określona wtedy i tylko wtedy, gdy
jest dodatnio określona, co przekłada się na ciąg warunków:
II. Forma kwadratowa
jest nieujemnie określona wtedy i tylko wtedy, gdy dla dowolnych
oraz
zachodzi
![]() |
(jest to minor rzędu
złożony z kolumn
i rzędów
).
Określoność macierzy symetrycznej jest niezależna od bazy, w której jest reprezentowana. W bazie własnej macierz
jest diagonalna z wartościami własnymi na diagonali. Dostajemy zatem następujące warunki równoważne określoności:
Macierz
jest dodatnio określona wtw, gdy wszystkie jej wartości własne są dodatnie.
Macierz
jest nieujemnie określona wtw, gdy wszystkie jej wartości własne są nieujemne.
Macierz
jest ujemnie określona wtw, gdy wszystkie jej wartości własne są ujemne.
Macierz
jest niedodatnio określona wtw, gdy wszystkie jej wartości własne są niedodatnie.
Jeśli
jest klasy
na zbiorze otwartym
i
jest
minimum lokalnym, to macierz
jest nieujemnie określona. Podobnie, jeśli
jest lokalnym maksimum, to
jest
niedodatnio określona.
Jeśli
jest klasy
na zbiorze otwartym
,
oraz
jest dodatnio określona
(ujemnie określona) to
ma ścisłe lokalne minimum (lokalne maksimum) w
.
Niech
będzie minimum lokalnym
. Ustalmy niezerowy wektor
i funkcję
gdzie
jest z dostatecznie małego otoczenia zera, aby
. Wtedy funkcja
ma lokalne minimum w punkcie
. Ponieważ
jest klasy
, funkcja
również jest klasy
. Z Twierdzenia 1.5 dla przypadku skalarnego wiemy, że skoro
jest lokalnym minimum, to
. Ze wzorów na pochodną funkcji złożonej mamy
Z dowolności wektora
wynika nieujemna określoność macierzy
.
Załóżmy najpierw, że
. Określmy funkcję
wzorem
Funkcja ta jest ciągła na mocy ciągłości hesjanu
oraz ćwiczenia 2.2. Istnieje zatem kula
, taka że
dla
.
Ustalmy dowolny
. Na mocy wzoru Taylora, lemat 2.1, mamy
dla pewnego punktu
leżącego na odcinku łączącym
i
, a zatem i należącego do kuli
. Pierwsza pochodna
znika w punkcie
, zaś
Mamy zatem
gdyż funkcja
jest dodatnia na kuli
. Wnioskujemy więc, że
jest ścisłym minimum lokalnym.
Dowód przypadku
jest analogiczny.
Niech teraz
będzie funkcją klasy
na zbiorze wypukłym
, oraz klasy
na
.
Jeśli
jest punktem krytycznym
, to:
I)
jest globalnym minimum,
II)
jest globalnym maksimum.
Jeśli dodatkowo
w pierwszym stwierdzeniu (
w drugim stwierdzeniu), to
jest ścisłym globalnym minimum
(maksimum).
Jeśli
, to z wypukłości
cały odcinek łączący
z
(poza punktem
) leży w
i możemy zastosować wzór Taylora, lemat 2.1, który daje
gdzie
jest pewnym punktem z odcinka łączącego
z
. Nierówność
(odpowiednio,
) oznacza, że drugi człon w powyższym wzorze jest nieujemny (niedodatni), co pociąga obie implikacje w twierdzeniu.
W przypadku, gdy w (I) mamy dodatkowo
, odwołamy się do używanej już funkcji
,
. Z wypukłości
wynika, że
jest dobrze określona, tzn.
dla
. Nasze założenia implikują, że
,
oraz
. Możemy skorzystać z tw. 1.11, które stwierdza, że
ma ścisłe globalne minimum w
. Zatem
, czyli
. Z dowolności
wynika, iż
jest ścisłym minimum globalnym.
Przypadek
w stwierdzeniu (II) dowodzimy analogicznie.
Wykaż, że hesjan funkcji
![]() |
nie jest symetryczny w punkcie
.
Niech
,
zwarty oraz
ciągła. Udowodnij, że funkcja
zadana wzorem
jest ciągła.
Pochodną kierunkową funkcji
w punkcie
i kierunku
nazywamy granicę
Udowodnij, że
jest przyjmowane dla
.
Rozważmy następującą funkcję (czasami zwaną funkcją Peano):
Udowodnij, że funkcja
ograniczona do każdej prostej przechodzącej przez
ma w tym punkcie minimum lokalne.
Wykaż, że
jako funkcja wielu zmiennych nie ma ekstremum lokalnego w
.
Znajdź wartości własne macierzy drugiej pochodnej
. Co możesz z nich wywnioskować? Czy tłumaczą one zachowanie funkcji
w
?
Rozważmy funkcję kwadratową wielu zmiennych:
gdzie
jest macierzą kwadratową, niekoniecznie symetryczną,
jest wektorem, zaś
stałą. Wyznacz gradient i hesjan (macierz drugiej pochodnej) funkcji
.
Załóż najpierw, że
jest symetryczna. Udowodnij później, że dla każdej macierzy kwadratowej
istnieje macierz symetryczna
, taka że
dla każdego
.
Zbadaj określoność następujących macierzy i porównaj wyniki z ich formą zdiagonalizowaną:
![]() |
Znajdź ekstrema globalne funkcji
Niech
będzie przestrzenią probabilistyczną, co między innymi oznacza, że
. Dana jest zmienna losowa
, tzn. funkcja mierzalna
o tej własności, że
. Znajdź wektor
, taki że
jest najmniejsza.
Zapisz
jako funkcję kwadratową.
Niech
i
. Załóżmy, że
jest klasy
na otoczeniu
oraz
. Udowodnij, że jeśli macierz
jest nieokreślona, to
nie ma ekstremum lokalnego w
.
Udowodnij nierówność średnich rozwiązując zadanie optymalizacyjne:
![]() |
Znajdź minima lokalne funkcji
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010.
Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.