W tym podrozdziale przypomnimy krótko twierdzenia Taylora dla funkcji wielu zmiennych. Wprowadźmy najpierw niezbędną notację.
Niech , gdzie jest zbiorem otwartym. Przyjmiemy następujące oznaczenia:
– wektor kolumnowy,
,
– gradient funkcji ,
– Hesjan funkcji :
Funkcja jest różniczkowalna w punkcie , jeśli istnieje wektor , taki że
dla
Funkcja jest dwukrotnie różniczkowalna w punkcie , jeśli istnieje wektor oraz macierz , takie że
dla
Możemy założyć, że macierz w powyższej definicji jest symetryczna. Wystarczy zauważyć, że
I) Jeśli funkcja jest różniczkowalna w , to istnieje i . Odwrotnie, jeśli istnieje w pewnym otoczeniu i jest ciągłe w , to jest różniczkowalna w .
II) Jeśli hesjan istnieje w pewnym otoczeniu i jest ciągły w , to jest dwukrotnie różniczkowalna w , jest macierzą symetryczną oraz .
Dowód powyższego twierdzenia pomijamy. Zainteresowany czytelnik znajdzie go w podręcznikach analizy wielowymiarowej.
Ilekroć będziemy chcieli wykorzystać drugą pochodną funkcji wielowymiarowej, bedziemy musieli zakładać, że hesjan jest funkcją ciągłą. Jeśli nie poczynimy takiego założenia, nie będziemy mieli dobrego sposobu na policzenie drugiej pochodnej, a zatem taki rezultat będzie miał małą wartość praktyczną.
Dla funkcji określonej na zbiorze otwartym mówimy, że jest klasy (odpowiednio, klasy ) i piszemy (), gdy jest ciągła na oraz (odpowiednio, i ) istnieją i są ciągłe na . Gdy rozważany zbiór nie jest otwarty, mówimy że jest klasy (odpowiednio, klasy ) na , jeśli istnieje rozszerzenie funkcji do zbioru otwartego zawierającego takie, że jest klasy (odpowiednio, klasy ) na . W tym wypadku można więc mówić o pochodnych cząstkowych funkcji również w punktach brzegowych zbioru . Pochodne te są jednoznacznie określone przez wartości funkcji na , jeśli zachodzi (wynika to z ciągłości tych pochodnych).
Zapiszemy teraz rozwinięcie Taylora rzędu .
Niech otwarty. Dla funkcji klasy i punktów takich, że odcinek łączący z leży w zachodzi
gdzie jest pewnym punktem wewnątrz odcinka łączącego z .
Dowód wynika z zastosowania twierdzenia 1.10 do funkcji , .
∎Podzbiór jest wypukły, jeśli
dla każdych i każdego .
Niech zbiór otwarty, wypukły oraz klasy . Wówczas dla dowolnych mamy
gdzie należy do wnętrza odcinka łączącego i , tzn. istnieje , taka że .
Z wypukłości wynika, że dla każdego odcinek łączący te punkty zawarty jest w . Teza wynika teraz z lematu 2.1.
∎Będziemy rozważać funkcję , gdzie jest podzbiorem w mającym niepuste wnętrze .
Jeśli funkcja jest różniczkowalna w punkcie należącym do wnętrza zbioru oraz jest lokalnym minimum (maksimum) funkcji to
Z faktu, że wynika, że funkcja , gdzie jest -tym wersorem (tj. ma jedynkę na -tej współrzędnej i zera poza nią), jest dobrze określona na otoczeniu . Ma ona również lokalne ekstremum w punkcie . Na mocy tw. 1.4 mamy . W terminach funkcji oznacza to, że . Przeprowadzając to rozumowanie dla dostajemy tezę..
∎Warunek znikania gradientu będzie często używany, zatem użyteczna będzie
Punkt nazywamy punktem krytycznym funkcji , jeśli jest różniczkowalna w oraz .
Oczywiście, warunek znikania gradientu nie jest wystarczający na to, by w znajdowało się lokalne minimum lub maksimum. Do rozstrzygnięcia tego jest potrzebny analog warunku o znaku drugiej pochodnej (tw. 1.6). W przypadku wielowymiarowym ten warunek definiuje się jako dodatnią (ujemną) określoność macierzy drugich pochodnych.
Niech będzie macierzą symetryczną, tzn. . Rozważmy formę kwadratową
Określoność macierzy lub formy kwadratowej definiujemy następująco:
jest nieujemnie określona, co oznaczamy , jeśli
jest dodatnio określona, co oznaczamy , jeśli
Odwracając nierówności definiujemy niedodatnią określoność i ujemną określoność.
Macierz nazywamy nieokreśloną, jeśli istnieją wektory takie, że
Zauważmy, że z definicji określoności macierzy, wyliczając wyrażenie na wersorze , z jedynką na -tym miejscu, wynikają następujące warunki konieczne odpowiedniej określoności macierzy :
Jeśli jest dodatnio określona, to .
Jeśli jest nieujemnie określona, to .
Jeśli jest ujemnie określona, to .
Jeśli jest niedodatnio określona, to .
Jeśli i , dla pewnych , , to jest nieokreślona.
Warunki konieczne i dostateczne podane są w poniższym twierdzeniu, którego dowód pomijamy.
I. Forma kwadratowa jest dodatnio określona wtedy i tylko wtedy, gdy zachodzi:
gdzie przez oznaczamy minory główne macierzy :
Forma kwadratowa jest ujemnie określona wtedy i tylko wtedy, gdy jest dodatnio określona, co przekłada się na ciąg warunków:
II. Forma kwadratowa jest nieujemnie określona wtedy i tylko wtedy, gdy dla dowolnych oraz zachodzi
(jest to minor rzędu złożony z kolumn i rzędów ).
Określoność macierzy symetrycznej jest niezależna od bazy, w której jest reprezentowana. W bazie własnej macierz jest diagonalna z wartościami własnymi na diagonali. Dostajemy zatem następujące warunki równoważne określoności:
Macierz jest dodatnio określona wtw, gdy wszystkie jej wartości własne są dodatnie.
Macierz jest nieujemnie określona wtw, gdy wszystkie jej wartości własne są nieujemne.
Macierz jest ujemnie określona wtw, gdy wszystkie jej wartości własne są ujemne.
Macierz jest niedodatnio określona wtw, gdy wszystkie jej wartości własne są niedodatnie.
Jeśli jest klasy na zbiorze otwartym i jest minimum lokalnym, to macierz jest nieujemnie określona. Podobnie, jeśli jest lokalnym maksimum, to jest niedodatnio określona.
Jeśli jest klasy na zbiorze otwartym , oraz jest dodatnio określona (ujemnie określona) to ma ścisłe lokalne minimum (lokalne maksimum) w .
Niech będzie minimum lokalnym . Ustalmy niezerowy wektor i funkcję
gdzie jest z dostatecznie małego otoczenia zera, aby . Wtedy funkcja ma lokalne minimum w punkcie . Ponieważ jest klasy , funkcja również jest klasy . Z Twierdzenia 1.5 dla przypadku skalarnego wiemy, że skoro jest lokalnym minimum, to . Ze wzorów na pochodną funkcji złożonej mamy
Z dowolności wektora wynika nieujemna określoność macierzy .
∎Załóżmy najpierw, że . Określmy funkcję wzorem
Funkcja ta jest ciągła na mocy ciągłości hesjanu oraz ćwiczenia 2.2. Istnieje zatem kula , taka że dla .
Ustalmy dowolny . Na mocy wzoru Taylora, lemat 2.1, mamy
dla pewnego punktu leżącego na odcinku łączącym i , a zatem i należącego do kuli . Pierwsza pochodna znika w punkcie , zaś
Mamy zatem
gdyż funkcja jest dodatnia na kuli . Wnioskujemy więc, że jest ścisłym minimum lokalnym.
Dowód przypadku jest analogiczny.
∎Niech teraz będzie funkcją klasy na zbiorze wypukłym , oraz klasy na .
Jeśli jest punktem krytycznym , to:
I) jest globalnym minimum,
II) jest globalnym maksimum.
Jeśli dodatkowo w pierwszym stwierdzeniu ( w drugim stwierdzeniu), to jest ścisłym globalnym minimum (maksimum).
Jeśli , to z wypukłości cały odcinek łączący z (poza punktem ) leży w i możemy zastosować wzór Taylora, lemat 2.1, który daje
gdzie jest pewnym punktem z odcinka łączącego z . Nierówność (odpowiednio, ) oznacza, że drugi człon w powyższym wzorze jest nieujemny (niedodatni), co pociąga obie implikacje w twierdzeniu.
W przypadku, gdy w (I) mamy dodatkowo , odwołamy się do używanej już funkcji , . Z wypukłości wynika, że jest dobrze określona, tzn. dla . Nasze założenia implikują, że , oraz . Możemy skorzystać z tw. 1.11, które stwierdza, że ma ścisłe globalne minimum w . Zatem , czyli . Z dowolności wynika, iż jest ścisłym minimum globalnym.
Przypadek w stwierdzeniu (II) dowodzimy analogicznie.
∎Wykaż, że hesjan funkcji
nie jest symetryczny w punkcie .
Niech , zwarty oraz ciągła. Udowodnij, że funkcja zadana wzorem
jest ciągła.
Pochodną kierunkową funkcji w punkcie i kierunku nazywamy granicę
Udowodnij, że jest przyjmowane dla .
Rozważmy następującą funkcję (czasami zwaną funkcją Peano):
Udowodnij, że funkcja ograniczona do każdej prostej przechodzącej przez ma w tym punkcie minimum lokalne.
Wykaż, że jako funkcja wielu zmiennych nie ma ekstremum lokalnego w .
Znajdź wartości własne macierzy drugiej pochodnej . Co możesz z nich wywnioskować? Czy tłumaczą one zachowanie funkcji w ?
Rozważmy funkcję kwadratową wielu zmiennych:
gdzie jest macierzą kwadratową, niekoniecznie symetryczną, jest wektorem, zaś stałą. Wyznacz gradient i hesjan (macierz drugiej pochodnej) funkcji .
Załóż najpierw, że jest symetryczna. Udowodnij później, że dla każdej macierzy kwadratowej istnieje macierz symetryczna , taka że dla każdego .
Zbadaj określoność następujących macierzy i porównaj wyniki z ich formą zdiagonalizowaną:
Znajdź ekstrema globalne funkcji
Niech będzie przestrzenią probabilistyczną, co między innymi oznacza, że . Dana jest zmienna losowa , tzn. funkcja mierzalna o tej własności, że . Znajdź wektor , taki że jest najmniejsza.
Zapisz jako funkcję kwadratową.
Niech i . Załóżmy, że jest klasy na otoczeniu oraz . Udowodnij, że jeśli macierz jest nieokreślona, to nie ma ekstremum lokalnego w .
Udowodnij nierówność średnich rozwiązując zadanie optymalizacyjne:
Znajdź minima lokalne funkcji
Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.
strona główna | webmaster | o portalu | pomoc
© Wydział Matematyki, Informatyki i Mechaniki UW, 2009-2010. Niniejsze materiały są udostępnione bezpłatnie na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.