W tym podrozdziale przypomnimy krótko twierdzenia Taylora dla funkcji wielu zmiennych. Wprowadźmy najpierw niezbędną notację.
Niech , gdzie
jest zbiorem otwartym. Przyjmiemy następujące oznaczenia:
– wektor kolumnowy,
,
– gradient funkcji
,
– Hesjan funkcji
:
![]() |
Funkcja jest różniczkowalna w punkcie
, jeśli istnieje wektor
, taki że
![]() |
dla
Funkcja jest dwukrotnie różniczkowalna w punkcie
, jeśli istnieje wektor
oraz macierz
, takie że
![]() |
dla
Możemy założyć, że macierz w powyższej definicji jest symetryczna. Wystarczy zauważyć, że
![]() |
I) Jeśli funkcja jest różniczkowalna w
, to
istnieje i
. Odwrotnie, jeśli
istnieje w pewnym otoczeniu
i jest ciągłe w
, to
jest różniczkowalna w
.
II) Jeśli hesjan istnieje w pewnym otoczeniu
i jest ciągły w
, to
jest dwukrotnie różniczkowalna w
,
jest macierzą symetryczną oraz
.
Dowód powyższego twierdzenia pomijamy. Zainteresowany czytelnik znajdzie go w podręcznikach analizy wielowymiarowej.
Ilekroć będziemy chcieli wykorzystać drugą pochodną funkcji wielowymiarowej, bedziemy musieli zakładać, że hesjan jest funkcją ciągłą. Jeśli nie poczynimy takiego założenia, nie będziemy mieli dobrego sposobu na policzenie drugiej pochodnej, a zatem taki rezultat będzie miał małą wartość praktyczną.
Dla funkcji określonej na zbiorze otwartym
mówimy, że
jest klasy
(odpowiednio, klasy
) i piszemy
(
), gdy
jest ciągła na
oraz
(odpowiednio,
i
) istnieją
i są ciągłe na
. Gdy rozważany zbiór
nie jest otwarty, mówimy że
jest klasy
(odpowiednio, klasy
) na
, jeśli istnieje
rozszerzenie
funkcji
do zbioru otwartego
zawierającego
takie, że
jest klasy
(odpowiednio, klasy
) na
. W tym wypadku można więc mówić o pochodnych cząstkowych funkcji
również w
punktach brzegowych zbioru
. Pochodne te są jednoznacznie określone przez wartości funkcji na
, jeśli
zachodzi
(wynika to z ciągłości tych pochodnych).
Zapiszemy teraz rozwinięcie Taylora rzędu .
Niech otwarty. Dla funkcji
klasy
i punktów
takich, że odcinek łączący
z
leży w
zachodzi
![]() |
gdzie jest pewnym punktem wewnątrz odcinka łączącego
z
.
Dowód wynika z zastosowania twierdzenia 1.10 do funkcji ,
.
Podzbiór jest wypukły, jeśli
![]() |
dla każdych i każdego
.
Niech zbiór otwarty, wypukły oraz
klasy
. Wówczas dla dowolnych
mamy
![]() |
gdzie należy do wnętrza odcinka łączącego
i
, tzn. istnieje
, taka że
.
Z wypukłości wynika, że dla każdego
odcinek łączący te punkty zawarty jest w
. Teza wynika teraz z lematu 2.1.
Będziemy rozważać funkcję , gdzie
jest podzbiorem w
mającym niepuste wnętrze
.
Jeśli funkcja jest różniczkowalna w punkcie
należącym do wnętrza zbioru
oraz
jest lokalnym minimum (maksimum) funkcji
to
![]() |
Z faktu, że wynika, że funkcja
, gdzie
jest
-tym wersorem (tj.
ma jedynkę na
-tej współrzędnej i zera poza nią), jest dobrze określona na otoczeniu
. Ma ona również lokalne ekstremum w punkcie
. Na mocy tw. 1.4 mamy
. W terminach funkcji
oznacza to, że
. Przeprowadzając to rozumowanie dla
dostajemy tezę..
Warunek znikania gradientu będzie często używany, zatem użyteczna będzie
Punkt nazywamy punktem krytycznym funkcji
, jeśli
jest różniczkowalna w
oraz
.
Oczywiście, warunek znikania gradientu nie jest wystarczający na to, by w
znajdowało się lokalne minimum lub maksimum. Do rozstrzygnięcia tego jest potrzebny analog warunku o znaku drugiej pochodnej (tw. 1.6). W przypadku wielowymiarowym ten warunek definiuje się jako dodatnią (ujemną) określoność macierzy drugich pochodnych.
Niech będzie macierzą symetryczną, tzn.
. Rozważmy formę kwadratową
![]() |
Określoność macierzy lub formy kwadratowej
definiujemy następująco:
jest nieujemnie określona, co oznaczamy
, jeśli
![]() |
jest dodatnio określona, co oznaczamy
, jeśli
![]() |
Odwracając nierówności definiujemy niedodatnią określoność i ujemną określoność.
Macierz nazywamy nieokreśloną, jeśli istnieją wektory
takie, że
![]() |
Zauważmy, że z definicji określoności macierzy, wyliczając wyrażenie na wersorze
, z jedynką na
-tym miejscu, wynikają następujące warunki konieczne odpowiedniej określoności macierzy
:
Jeśli jest dodatnio określona, to
.
Jeśli jest nieujemnie określona, to
.
Jeśli jest ujemnie określona, to
.
Jeśli jest niedodatnio określona, to
.
Jeśli i
, dla pewnych
,
, to
jest nieokreślona.
Warunki konieczne i dostateczne podane są w poniższym twierdzeniu, którego dowód pomijamy.
I. Forma kwadratowa jest dodatnio określona wtedy i tylko wtedy, gdy zachodzi:
![]() |
gdzie przez oznaczamy minory główne macierzy
:
![]() |
Forma kwadratowa jest ujemnie określona wtedy i tylko wtedy, gdy
jest dodatnio określona, co przekłada się na ciąg warunków:
![]() |
II. Forma kwadratowa jest nieujemnie określona wtedy i tylko wtedy, gdy dla dowolnych
oraz
zachodzi
![]() |
(jest to minor rzędu złożony z kolumn
i rzędów
).
Określoność macierzy symetrycznej jest niezależna od bazy, w której jest reprezentowana. W bazie własnej macierz jest diagonalna z wartościami własnymi na diagonali. Dostajemy zatem następujące warunki równoważne określoności:
Macierz jest dodatnio określona wtw, gdy wszystkie jej wartości własne są dodatnie.
Macierz jest nieujemnie określona wtw, gdy wszystkie jej wartości własne są nieujemne.
Macierz jest ujemnie określona wtw, gdy wszystkie jej wartości własne są ujemne.
Macierz jest niedodatnio określona wtw, gdy wszystkie jej wartości własne są niedodatnie.
Jeśli jest klasy
na zbiorze otwartym
i
jest
minimum lokalnym, to macierz
jest nieujemnie określona. Podobnie, jeśli
jest lokalnym maksimum, to
jest
niedodatnio określona.
Jeśli jest klasy
na zbiorze otwartym
,
oraz
jest dodatnio określona
(ujemnie określona) to
ma ścisłe lokalne minimum (lokalne maksimum) w
.
Niech będzie minimum lokalnym
. Ustalmy niezerowy wektor
i funkcję
![]() |
gdzie jest z dostatecznie małego otoczenia zera, aby
. Wtedy funkcja
ma lokalne minimum w punkcie
. Ponieważ
jest klasy
, funkcja
również jest klasy
. Z Twierdzenia 1.5 dla przypadku skalarnego wiemy, że skoro
jest lokalnym minimum, to
. Ze wzorów na pochodną funkcji złożonej mamy
![]() |
Z dowolności wektora wynika nieujemna określoność macierzy
.
Załóżmy najpierw, że . Określmy funkcję
wzorem
![]() |
Funkcja ta jest ciągła na mocy ciągłości hesjanu oraz ćwiczenia 2.2. Istnieje zatem kula
, taka że
dla
.
Ustalmy dowolny . Na mocy wzoru Taylora, lemat 2.1, mamy
![]() |
dla pewnego punktu leżącego na odcinku łączącym
i
, a zatem i należącego do kuli
. Pierwsza pochodna
znika w punkcie
, zaś
![]() |
Mamy zatem
![]() |
gdyż funkcja jest dodatnia na kuli
. Wnioskujemy więc, że
jest ścisłym minimum lokalnym.
Dowód przypadku jest analogiczny.
Niech teraz będzie funkcją klasy
na zbiorze wypukłym
, oraz klasy
na
.
Jeśli jest punktem krytycznym
, to:
I) jest globalnym minimum,
II) jest globalnym maksimum.
Jeśli dodatkowo w pierwszym stwierdzeniu (
w drugim stwierdzeniu), to
jest ścisłym globalnym minimum
(maksimum).
Jeśli , to z wypukłości
cały odcinek łączący
z
(poza punktem
) leży w
i możemy zastosować wzór Taylora, lemat 2.1, który daje
![]() |
gdzie jest pewnym punktem z odcinka łączącego
z
. Nierówność
(odpowiednio,
) oznacza, że drugi człon w powyższym wzorze jest nieujemny (niedodatni), co pociąga obie implikacje w twierdzeniu.
W przypadku, gdy w (I) mamy dodatkowo , odwołamy się do używanej już funkcji
,
. Z wypukłości
wynika, że
jest dobrze określona, tzn.
dla
. Nasze założenia implikują, że
,
oraz
. Możemy skorzystać z tw. 1.11, które stwierdza, że
ma ścisłe globalne minimum w
. Zatem
, czyli
. Z dowolności
wynika, iż
jest ścisłym minimum globalnym.
Przypadek w stwierdzeniu (II) dowodzimy analogicznie.
Wykaż, że hesjan funkcji
![]() |
nie jest symetryczny w punkcie .
Niech ,
zwarty oraz
ciągła. Udowodnij, że funkcja
zadana wzorem
![]() |
jest ciągła.
Pochodną kierunkową funkcji w punkcie
i kierunku
nazywamy granicę
![]() |
Udowodnij, że jest przyjmowane dla
.
Rozważmy następującą funkcję (czasami zwaną funkcją Peano):
![]() |
Udowodnij, że funkcja ograniczona do każdej prostej przechodzącej przez
ma w tym punkcie minimum lokalne.
Wykaż, że jako funkcja wielu zmiennych nie ma ekstremum lokalnego w
.
Znajdź wartości własne macierzy drugiej pochodnej . Co możesz z nich wywnioskować? Czy tłumaczą one zachowanie funkcji
w
?
Rozważmy funkcję kwadratową wielu zmiennych:
![]() |
gdzie jest macierzą kwadratową, niekoniecznie symetryczną,
jest wektorem, zaś
stałą. Wyznacz gradient i hesjan (macierz drugiej pochodnej) funkcji
.
Załóż najpierw, że jest symetryczna. Udowodnij później, że dla każdej macierzy kwadratowej
istnieje macierz symetryczna
, taka że
dla każdego
.
Zbadaj określoność następujących macierzy i porównaj wyniki z ich formą zdiagonalizowaną:
![]() |
Znajdź ekstrema globalne funkcji
![]() |
Niech będzie przestrzenią probabilistyczną, co między innymi oznacza, że
. Dana jest zmienna losowa
, tzn. funkcja mierzalna
o tej własności, że
. Znajdź wektor
, taki że
jest najmniejsza.
Zapisz jako funkcję kwadratową.
Niech i
. Załóżmy, że
jest klasy
na otoczeniu
oraz
. Udowodnij, że jeśli macierz
jest nieokreślona, to
nie ma ekstremum lokalnego w
.
Udowodnij nierówność średnich rozwiązując zadanie optymalizacyjne:
![]() |
Znajdź minima lokalne funkcji
![]() |
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i
Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach
Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.