Notice: Undefined index: mode in /home/misc/mst/public_html/common.php on line 63 Notice: Undefined index: mode in /home/misc/mst/public_html/common.php on line 65 Notice: Undefined index: mode in /home/misc/mst/public_html/common.php on line 67 Notice: Undefined index: mode in /home/misc/mst/public_html/common.php on line 69 Notice: Undefined variable: base in /home/misc/mst/public_html/lecture.php on line 36 Optymalizacja II – 1. Wiadomości wstępne – MIM UW

Zagadnienia

1. Wiadomości wstępne

1.1. Problem optymalizacji

Niech W\subset\mathbb{R}^{n} będzie niepustym zbiorem, zaś f:W\to\mathbb{R} dowolną funkcją. Będziemy rozważać problem minimalizacji funkcji f na zbiorze W, przyjmując różne postaci W, w tym:

  • W=\mathbb{R}^{n} (problem optymalizacji bez ograniczeń),

  • W=\{ x\in\mathbb{R}^{n}:g_{1}(x)=0,\dots,\  g_{m}(x)=0\}, gdzie g_{1},\dots g_{m}:\mathbb{R}^{n}\to\mathbb{R} pewne funkcje (problem optymalizacji z ograniczeniami równościowymi),

  • W=\{ x\in\mathbb{R}^{n}:g_{1}(x)\leq 0,\dots,\  g_{m}(x)\leq 0\}, gdzie g_{1},\dots g_{m}:\mathbb{R}^{n}\to\mathbb{R} pewne funkcje (problem optymalizacji z ograniczeniami nierównościowymi).

Zbiór W nosi nazwę zbioru punktów dopuszczalnych.

Definicja 1.1

Punkt x_{0}\in W nazywamy minimum globalnym funkcji f na zbiorze W jeśli

f(x)\geq f(x_{0})\ \ \ \ \text{dla\  każdego}\ \  x\in W.
Definicja 1.2

Punkt x_{0}\in W nazywamy minimum lokalnym funkcji f jeśli istnieje \varepsilon>0 takie, że dla kuli B(x_{0},\varepsilon) o środku w x_{0} i promieniu \varepsilon zachodzi

\qquad\qquad f(x)\geq f(x_{0})\ \ \ \ \text{dla\  każdego}\ \  x\in B(x_{0},\varepsilon)\cap W.

Oczywiście, jeśli x_{0} jest minimum globalnym to jest minimum lokalnym. Minimum nazywamy ścisłym, jeśli w powyższych definicjach zachodzi f(x)>f(x_{0}), dla x\not=x_{0}. Analogicznie definiujemy globalne i lokalne maksimum. Punkt x_{0} nazywamy ekstremum (lokalnym, globalnym) jeśli jest on maksimum lub minimum (lokalnym, globalnym).

Minimum (globalne, lokalne) nie musi istnieć, tzn. może się okazać, że nie istnieje x_{0} spełniające warunek z definicji 1.1 lub 1.2. W szczególności minimum globalne f na zbiorze W nie istnieje gdy:

  • (a) \inf _{{x\in W}}f(x)=-\infty, lub

  • (b) \inf _{{x\in W}}f(x)=c\in\mathbb{R}, ale \nexists\  x\in U takie, że f(x)=c.

Przykład 1.1

Niech W=\mathbb{R},\  f(x)=x\sin x. Dla tej funkcji \inf _{{x\in W}}f(x)=-\infty, zatem minimum globalne nie istnieje. Jeżeli natomiast ograniczymy się do przedziału W=[a,b], to minimum globalne będzie istnieć. Funkcja ta osiąga minimum lokalne w nieskończonej ilości punktów, dla W=\mathbb{R}. Jeżeli za W przyjmiemy odcinek otwarty, to minimum globalne istnieje lub nie istnieje, w zależności od tego odcinka. Ogólnie, funkcja ciągła może nie osiągać kresów na zbiorze niezwartym, w szczególności na podzbiorze otwartym W\subset\mathbb{R}^{n}.

1.2. Istnienie minimum funkcji ciągłej

Przypomnijmy, że podzbiór zwarty w \mathbb{R}^{n} to podzbiór domknięty i ograniczony.

Twierdzenie 1.1

Jeśli W jest zbiorem zwartym i f:W\to\mathbb{R} jest funkcją ciągłą, to f osiąga kresy na W (dolny i górny). Oznacza to, że istnieją \mathbf{x}_{0}, \mathbf{y}_{0}\in W takie, że dla dowolnego \mathbf{x}\in W zachodzi

f(\mathbf{x}_{0})\leq f(\mathbf{x})\leq f(\mathbf{y}_{0}).

Będziemy oznaczali normę euklidesową w \mathbb{R}^{n} przez

\|\mathbf{x}\|=\sqrt{x_{1}^{2}+x_{2}^{2}+\ldots+x_{n}^{2}}.

Warunek zwartości zbioru w powyższym twierdzeniu możemy osłabić do warunku domkniętości, jeśli funkcja jest koercywna. Koercywność funkcji definiujemy następująco:

Definicja 1.3

Funkcję f:W\to\mathbb{R} na podzbiorze W\subset\mathbb{R}^{n} nazywamy koercywną, jeśli f(\mathbf{x})\rightarrow\infty dla \|\mathbf{x}\|\rightarrow\infty. Można ten warunek zapisać równoważnie

\forall _{{r>0}}\ \exists _{{s>0}}\ \forall _{{\mathbf{x}\in W}}:\quad\|\mathbf{x}\|>s\quad\Longrightarrow\quad f(\mathbf{x})>r.

W szczególności, jeśli W jest ograniczony, to f jest automatycznie koercywna na W.

Twierdzenie 1.2

Jeśli zbiór W jest domknięty oraz funkcja f:W\rightarrow\mathbb{R} jest ciągła i koercywna, to istnieje punkt \mathbf{x}_{0} w którym funkcja f przyjmuje minimum, tzn. istnieje \mathbf{x}_{0}\in W taki, że f(\mathbf{x}_{0})=\inf _{{\mathbf{x}\in W}}f(\mathbf{x}).

Dowód

Niech \mathbf{y} będzie ustalonym punktem w zbiorze W\subset\mathbb{R}^{n}. Rozpatrzmy zbiór U=\{\mathbf{x}\in W:f(\mathbf{x})\leq f(\mathbf{y})\}. Zauważmy, że U jest zbiorem domkniętym w W, bo funkcja f jest ciągła, a nierówność w warunku nieostra. Z domkniętości W wynika, że U jest domknięty w \mathbb{R}^{n}. Jest on też ograniczony. Mianowicie, dla r=f(\mathbf{y}), z koercywności f istnieje s>0 takie, że jeśli \|\mathbf{x}\|>s, to f(\mathbf{x})>r=f(\mathbf{y}), skąd U jest zawarte w kuli B(s)=\{\mathbf{x}:\|\mathbf{x}\|\leq s\}. Zatem U jest zbiorem zwartym. Wówczas istnieje \mathbf{x}_{0}\in U – punkt minimum na zbiorze U. Dla \mathbf{x}\not\in U mamy f(\mathbf{x})>f(\mathbf{y})\geq f(\mathbf{x}_{0}), więc \mathbf{x}_{0} jest globalnym minimum na całym W.

Domkniętość W nie jest potrzebna, jeśli f odpowiednio rośnie w pobliżu granicy \partial W.

Twierdzenie 1.3

Niech W\subset\mathbb{R}^{n} będzie dowolnym niepustym podzbiorem oraz f:W\rightarrow\mathbb{R} – funkcją ciągłą. Jeśli dla pewnego ustalonego punktu \mathbf{y}\in W oraz dowolnego ciągu \mathbf{x}_{n}\in W, takiego że

\mathbf{x}_{n}\to\mathop{\rm cl}W\setminus W\qquad\text{lub}\qquad\|\mathbf{x}_{n}\|\to\infty

zachodzi

\liminf _{{n\to\infty}}f(\mathbf{x}_{n})>f(\mathbf{y}),

to istnieje punkt \mathbf{x}_{0} w którym funkcja f przyjmuje minimum.

Dowód

Zbiór U definiujemy jak w poprzednim dowodzie, U=\{\mathbf{x}\in W:f(\mathbf{x})\leq f(\mathbf{y})\}. Aby pokazać domkniętość U weźmy dowolny ciąg (\mathbf{x}_{n})\subset U zbieżny do \tilde{\mathbf{x}}. Pokażemy, że \tilde{\mathbf{x}}\in U. Z \mathbf{x}_{n}\in U mamy f(\mathbf{x}_{n})\le f(\mathbf{y}) i jeśli \tilde{\mathbf{x}}\notin W, nierówność ta przeczy założeniu twierdzenia. Wynika stąd, że \tilde{\mathbf{x}}\in W. Korzystając teraz z ciągłości f na W dostajemy f(\tilde{\mathbf{x}})\le f(\mathbf{y}), skąd \tilde{\mathbf{x}}\in U. Ograniczoność zbioru U wynika z założonej w twierdzeniu implikacji \|\mathbf{x}_{n}\|\to\infty\ \Rightarrow\ \liminf _{{n\to\infty}}f(\mathbf{x}_{n})>f(\mathbf{y}). Pozostała część dowodu jest identyczna jak w dowodzie poprzedniego twierdzenia.

Przykład 1.2

Funkcja f(x,y)=xy-\ln(xy) jest ciągła i spełnia założenia Twierdzenia 1.3 na zbiorze W=\{(x,y)\in\mathbb{R}^{n}:x>0,y>0,x+y\le 4\}, osiąga więc minimum na W.

1.3. Minima lokalne funkcji jednej zmiennej

Niech W\subset\mathbb{R} - podzbiór otwarty. Przypomnimy elementarne fakty.

Twierdzenie 1.4 (Warunek konieczny I rzędu)

Jeśli x_{0}\in W jest punktem lokalnego minimum lub maksimum funkcji f:W\to\mathbb{R} oraz f posiada pochodną w punkcie x_{0}, to

f^{{\prime}}(x_{0})=0.
Dowód twierdzenia 1.4

Niech x_{0} - minimum lokalne. Dla dostatecznie małych h zachodzi f(x_{0}+h)\geq f(x_{0}). Zatem dla h>0 mamy

\frac{f(x_{0}+h)-f(x_{0})}{h}\geq 0\ \ \Longrightarrow\ \ \lim _{{h\rightarrow 0}}\frac{f(x_{0}+h)-f(x_{0})}{h}\geq 0\ \ \Longrightarrow\ \  f^{{\prime}}(x_{0})\geq 0.

Dla h<0

\frac{f(x_{0}+h)-f(x_{0})}{h}\leq 0\ \ \Longrightarrow\ \ \lim _{{h\rightarrow 0}}\frac{f(x_{0}+h)-f(x_{0})}{h}\leq 0\ \ \Longrightarrow\ \  f^{{\prime}}(x_{0})\leq 0.

Stąd f^{{\prime}}(x_{0})=0.

Twierdzenie 1.5 (Warunek konieczny II rzędu)

Jeśli f:W\to\mathbb{R} jest klasy C^{2} na zbiorze W i x_{0} jest punktem lokalnego minimum, to

f^{{\prime\prime}}(x_{0})\geq 0.
Twierdzenie 1.6 (Warunek dostateczny II rzędu)

Jeśli f:W\to\mathbb{R} jest klasy C^{2} na zbiorze W oraz f^{{\prime}}(x_{0})=0, f^{{\prime\prime}}(x_{0})>0 dla pewnego x_{0}\in W, to f ma ścisłe lokalne minimum w punkcie x_{0}.

Uwaga 1.1

Twierdzenie 1.5 pozostaje prawdziwe przy zamianie lokalnego minimum na maksimum, jeśli znak znak drugiej pochodnej zmienimy na przeciwny.

Uwaga 1.2

Jeśli W nie jest otwarty, to Twierdzenia 1.4 i 1.5 nie są prawdziwe dla x_{0}\in\partial W (brzeg W), np. funkcja f(x)=-x^{2} przyjmuje minimum na odcinku [0,2] w punkcie x_{0}=2, ale żaden z warunków koniecznych tych twierdzeń nie zachodzi. Natomiast Twierdzenie 1.6 zachodzi również dla W będącego odcinkiem domkniętym i x_{0}\in\partial W.

Poniższe twierdzenie uogólnia warunek dostateczny II rzędu.

Twierdzenie 1.7

Jeśli funkcja f jest klasy C^{k} na podzbiorze otwartym W\subset\mathbb{R} i zachodzi f^{{\prime}}(x_{0})=f^{{\prime\prime}}(x_{0})=\cdots=f^{{(k-1)}}(x_{0})=0 oraz f^{{(k)}}(x_{0})\neq 0 w pewnym x_{0}\in W, to:

  • I) Jeśli k jest nieparzyste, to funkcja f nie posiada w punkcie x_{0} ekstremum lokalnego.

  • II) Jeśli k jest parzyste oraz:

    • (a) f^{{(k)}}(x_{0})>0, to punkt x_{0} jest ścisłym minimum lokalnym f,

    • (b) f^{{(k)}}(x_{0})<0, to punkt x_{0} jest ścisłym maksimum lokalnym f.

Dowody twierdzeń 1.5-1.7 podamy w podrozdziale 1.5.

1.4. Wzory Taylora

W tym podrozdziale przypomnimy wyniki, których będziemy używać w wielu dowodach w trakcie tego wykładu. Skorzystamy z nich również, aby przedstawić zwięzłe dowody twierdzeń 1.5-1.7.

Twierdzenie 1.8 (Twierdzenie o wartości średniej)

Jeśli funkcja f:[a,b]\to\mathbb{R} jest ciągła na [a,b] i różniczkowalna na (a,b), to istnieje taki punkt x\in(a,b), że

f(b)-f(a)=f^{{\prime}}(x)(b-a).

Zauważmy, że do prawdziwości powyższego twierdzenia nie jest konieczna ciągłość pierwszej pochodnej (w zadaniu 1.7 pokazujemy, że różnicznowalność nie musi pociągać ciągłości pochodnej).

Dowód twierdzenia 1.8

Niech g(x)=[f(b)-f(a)]x-(b-a)f(x) dla x\in[a,b]. Wówczas g jest ciągła na [a,b], różniczkowalna w (a,b) oraz

g(a)=f(b)a-f(a)b=g(b).

Pokażemy teraz, że istnieje punkt x_{0}\in(a,b), w którym pochodna g się zeruje. Jeśli g jest funkcją stałą, to dla dowolnego x_{0}\in(a,b) mamy g^{{\prime}}(x_{0})=0. W przeciwnym przypadku, na mocy twierdzenia 1.1 funkcja g przyjmuje swoje kresy na [a,b]. Jeden z kresów jest różny od g(a)=g(b). Zatem jest on przyjmowany w punkcie x_{0} we wnętrzu przedziału [a,b]. Korzystając z twierdzenia 1.4 wnioskujemy, że g^{{\prime}}(x_{0})=0. Różniczkując g otrzymujemy:

0=g^{{\prime}}(x_{0})=[f(b)-f(a)]-(b-a)f^{{\prime}}(x).

Po prostych przekształceniach otrzymujemy poszukiwany wzór.

Twierdzenie 1.9 (Twierdzenie Taylora z resztą w postaci Peano)

Niech f:[a,b]\to\mathbb{R} będzie funkcją klasy C^{{1}} na [a,b] oraz dwukrotnie różniczkowalna w pewnym x_{0}\in(a,b). Wówczas dla x\in[a,b] zachodzi następujący wzór:

f(x)=f(x_{0})+f^{{\prime}}(x_{0})(x-x_{0})+\frac{f^{{\prime\prime}}(x_{0})}{2}(x-x_{0})^{2}+o\big((x-x_{0})^{2}\big).
Uwaga 1.3

W sformułowaniu powyższego twierdzenia użyliśmy notacji małe o. Rozumieć ją należy następująco:

R(x)=f(x)-f(x_{0})-f^{{\prime}}(x_{0})(x-x_{0})-\frac{f^{{\prime\prime}}(x_{0})}{2}(x-x_{0})^{2}

jest rządu mniejszego niż (x-x_{0})^{2}, tzn.

\lim _{{x\to x_{0}}}\frac{R(x)}{(x-x_{0})^{2}}=0.
Przykład 1.3

Innym zastosowaniem powyższej notacji jest definicja pochodnej. Pochodną funkcji f w punkcie x_{0} nazywamy taką liczbę \alpha\in\mathbb{R}, że

f(x)=f(x_{0})+\alpha(x-x_{0})+o(x-x_{0}).
Dowód twierdzenia 1.9

Bez straty ogólności możemy założyć x_{0}=0. Musimy wykazać, że R(x):=f(x)-f(0)-f^{{\prime}}(0)x-\frac{f^{{\prime\prime}}(0)}{2}x^{2} jest niższego rzędu niż x^{2}, tzn. R(x)=o(x^{2}). Z ciągłości pierwszej pochodnej f dostajemy

f(x)-f(0)=\int _{0}^{x}f^{{\prime}}(y)dy.

Wiemy, że f^{{\prime}} jest różniczkowalna w 0. Zatem f^{{\prime}}(y)=f^{{\prime}}(0)+f^{{\prime\prime}}(0)y+r(y), gdzie r(y)=o(y). Oznacza to, że

\lim _{{y\to 0}}\frac{r(y)}{y}=0.

Dla dowolnego \varepsilon>0 istnieje zatem \delta>0, taka że |y|<\delta pociąga |r(y)|<\varepsilon|y|.

Ustalmy zatem dowolny \varepsilon>0 i związaną z nim \delta>0. Weźmy |x|<\delta i scałkujmy pochodną f^{{\prime}}(y). Otrzymamy wówczas:

f(x)-f(0)=\int _{0}^{x}\big(f^{{\prime}}(0)+f^{{\prime\prime}}(0)y+r(y)\big)dy=f^{{\prime}}(0)x+\frac{f^{{\prime\prime}}(0)}{2}x^{2}+\int _{0}^{x}r(y)dy,

czyli R(x)=\int _{0}^{x}r(y)dy. Korzystając z oszacowania |r(y)|<\varepsilon|y| dla |y|<\delta dostajemy

|R(x)|\le\int _{0}^{x}|r(y)|dy<\int _{0}^{{|x|}}\varepsilon|y|dy=\frac{\varepsilon x^{2}}{2}.

A zatem

\left|\frac{R(x)}{x^{2}}\right|<\frac{\varepsilon}{2}.

Z dowolności \varepsilon>0 wynika, iż R(x)=o(x^{2}).

Uwaga 1.4

Twierdzenie 1.9 można uogólnić do dowolnie długiej aproksymacji Taylora. Dowód przebiega wówczas podobnie, lecz jest nieznacznie dłuższy.

Zakładając większą gładkość funkcji f możemy opisać dokładniej błąd aproksymacji we wzorze Taylora.

Twierdzenie 1.10 (Twierdzenie Taylora z resztą w postaci Lagrange'a)

Niech f:[a,b]\to\mathbb{R} będzie funkcją klasy C^{{k-1}} na [a,b] oraz k-krotnie różniczkowalna na (a,b). Wtedy dla ustalonego x_{0}\in(a,b) i x\in[a,b] zachodzi następujący wzór:

f(x)=f(x_{0})+\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(x-x_{0})^{i}+\frac{f^{{(k)}}(\tilde{x})}{k!}(x-x_{0})^{k},

gdzie \tilde{x} jest pewnym punktem pomiędzy x_{0} i x.

W szczególności dla k=2 dostajemy

f(x)=f(x_{0})+f^{{\prime}}(x_{0})(x-x_{0})+\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}.
Dowód twierdzenia 1.10

Niech liczba M spełnia równanie

f(x)=f(x_{0})+\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(x-x_{0})^{i}+M(x-x_{0})^{k}.

Celem dowodu jest pokazanie, że M=\frac{f^{{(k)}}(\tilde{x})}{k!} dla pewnego punktu \tilde{x} pomiędzy x_{0} i x. Określmy funkcję

g(y)=f(y)-\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(y-x_{0})^{i}-M(y-x_{0})^{k},\qquad y\in[x_{0},x].

Zauważmy, że

g(x_{0})=g^{{\prime}}(x_{0})=\cdots=g^{{(k-1)}}(x_{0})=0.

Ponieważ g(x)=0, to na podstawie twierdzenia 1.8 istnieje x_{1}\in(x_{0},x), taki że g^{{\prime}}(x_{1})=0. Stosując jeszcze raz tw. 1.8 do funkcji g^{{\prime}}(y) dla y\in[x_{0},x_{1}] dostajemy x_{2}\in(x_{0},x_{1}), w którym g^{{\prime\prime}}(x_{2})=0. Postępując w ten sposób dostajemy ciąg punktów x>x_{1}>x_{2}>\cdots>x_{k}>x_{0}, takich że g^{{(j)}}(x_{j})=0, j=1,\ldots,k. Z warunku dla punktu x_{k} otrzymujemy

0=g^{{(k)}}(x_{k})=f^{{(k)}}(x_{k})-k!M.

Szukanym punktem \tilde{x} w twierdzeniu jest więc x_{k}.

1.5. Dowody twierdzeń 1.5-1.7

Dowód twierdzenia 1.5

Z twierdzenia 1.4 wiemy, że jeśli x_{0} jest punktem minimum to f^{{\prime}}(x_{0})=0. Zatem korzystając ze wzoru Taylora, tw. 1.10, uzyskujemy

f(x)-f(x_{0})=\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}

dla pewnego punktu \tilde{x} leżącego pomiędzy x_{0} i x. Z założenia, że x_{0} jest minimum lokalnym, otrzymujemy f(x)-f(x_{0})\ge 0. Stąd i z (x-x_{0})^{2}\ge 0 wnioskujemy, że

f^{{\prime\prime}}(\tilde{x})\ge 0.

Jeśli x\rightarrow x_{0}, to również \tilde{x}\rightarrow x_{0}. Wykorzystując ciągłość f^{{\prime\prime}} dostajemy f^{{\prime\prime}}(x_{0})\ge 0.

Dowód twierdzenia 1.6

Z ciągłości drugiej pochodnej f wynika, że istnieje kula B(x_{0},\varepsilon), na której f^{{\prime\prime}}>0. Zatem dla x\in B(x_{0},\varepsilon), x\ne x_{0}, wnioskujemy ze wzoru Taylora, tw. 1.10, że f(x)>f(x_{0}):

f(x)-f(x_{0})=\underset{=0}{\underbrace{f^{{\prime}}(x_{0})(x-x_{0})}}+\underset{>0}{\underbrace{\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}}}.

Oznacza to, że f ma ścisłe minimum lokalne w x_{0}.

Dowód twierdzenia 1.7

Z ciągłości f i otwartości W wynika, że istnieje kula B(x_{0},\varepsilon)\subset W, na której f^{{(k)}} jest niezerowa (tzn. f^{{(k)}} nie zmienia znaku z ciągłości). Korzystając ze wzoru Taylora, tw. 1.10 i z założeń twierdzenia otrzymujemy

f(x)=f(x_{0})+\frac{f^{{(k)}}(\tilde{x})}{k!}(x-x_{0})^{k}

dla dowolnego x\in B(x_{0},\varepsilon) oraz \tilde{x}, zależnego od x, należącego do przedziału o końcach x_{0} i x. Aby zbadać, czy zachodzi jedna z nierówności f(x)>f(x_{0}) lub f(x)<f(x_{0}) dla wszystkich x\not=x_{0}, x\in B(x_{0},\varepsilon) należy zbadać znak członu z potęgą (x-x_{0})^{k}. Człon ten zmienia znak dla k nieparzystego, stąd teza (I). Dla k parzystego znak różnicy f(x)-f(x_{0}) zależy od znaku pochodnej f^{{(k)}} na B(x_{0},\varepsilon).

1.6. Ekstrema globalne

Uzupełnimy jeszcze twierdzenie 1.6 o wynik dotyczący ekstremów globalnych.

Niech I\subset\mathbb{R} będzie odcinkiem otwartym, domkniętym, lub jednostronnie domkniętym (być może nieograniczonym) i niech f:I\to\mathbb{R} będzie funkcją klasy C^{1} na I i klasy C^{2} na \mathop{\rm int}I. Zachodzi następujące

Twierdzenie 1.11

Przy powyższych założeniach, jeśli f^{{\prime}}(x_{0})=0 oraz:

  • (a) f^{{\prime\prime}}(x)\geq 0\quad\forall _{{x\in I}}\quad\Longrightarrow\quad x_{0} jest globalnym minimum na I,

  • (b) f^{{\prime\prime}}(x)\leq 0\quad\forall _{{x\in I}}\quad\Longrightarrow\quad x_{0} jest globalnym maksimum na I.

Jeśli założenia powyższe uzupełnimy o warunek f^{{\prime\prime}}(x_{0})>0 (odpowiednio f^{{\prime\prime}}(x_{0})<0), to x_{0} będzie ścisłym globalnym minimum (maksimum).

Dowód

Wzór Taylora, tw. 1.10, daje

f(x)=f(x_{0})+\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2},

gdzie \tilde{x} jest pewnym punktem pomiędzy x_{0} i x. Stąd drugi człon wzoru Taylora decyduje o nierówności pomiędzy f(x) a f(x_{0}) i otrzymujemy obie implikacje w twierdzeniu dotyczące słabych ekstremów.

Załóżmy dodatkowo w pierwszym stwierdzeniu, że f^{{\prime\prime}}(x_{0})>0. Z założenia f^{{\prime\prime}}(x)\ge 0 i warunku f^{{\prime}}(x_{0})=0 dostajemy

f^{{\prime}}(x)=f^{{\prime}}(x)-f^{{\prime}}(x_{0})=\int _{{x_{0}}}^{x}f^{{\prime\prime}}(y)dy\ge 0,

gdy x>x_{0}. Podobnie pokazujemy, że f^{{\prime}}(x)=-\int _{{x}}^{{x_{0}}}f^{{\prime\prime}}(y)dy\le 0, gdy x<x_{0}. Z faktu, że f^{{\prime\prime}}(x_{0})>0 i ciągłości drugiej pochodnej dostajemy dodatkowo, że ta pochodna jest ściśle dodatnia w otoczeniu x_{0}. Zatem całki są dodatnie, co pociąga nierówności f^{{\prime}}(x)>0, gdy x>x_{0}, oraz f^{{\prime}}(x)<0, gdy x<x_{0}. Wynika stąd, że funkcja f jest ściśle rosnąca na prawo od x_{0} i ściśle malejąca na lewo od x_{0}, a więc x_{0} jest ścisłym minimum. Przypadek ścisłego maksimum dowodzimy analogicznie.

1.7. Zadania

Ćwiczenie 1.1

Czy funkcja f(x,y)=x^{4}+x^{2}-xy+2y^{2} osiąga minimum na zbiorze \{(x,y)\in\mathbb{R}^{2}:\  x\ge-1\}.

Ćwiczenie 1.2

Znajdź minimum funkcji f(x,y)=2x+3y na zbiorze W=\{(x,y)\in\mathbb{R}^{2}:\  x^{2}+y^{2}=1\}.

Ćwiczenie 1.3

Znajdź maksimum funkcji f(x,y)=x^{2}-4y^{2} na zbiorze W=\{(x,y)\in\mathbb{R}^{2}:\  2x^{2}+|y|=1\}.

Ćwiczenie 1.4

Znajdź minimum funkcji f(x,y)=e^{{x^{2}-y^{2}}} na zbiorze W=\{(x,y)\in\mathbb{R}^{2}:\  x^{2}+y^{2}=1\}.

Ćwiczenie 1.5

Rozważmy następujący nieliniowy problem optymalizacyjny:

\begin{cases}(x_{1}-4)^{2}+(x_{2}-2)^{2}\to\min,&\\
4x_{1}^{2}+9x_{2}^{2}\le 36,&\\
x_{1}^{2}+4x_{2}=4,&\\
2x_{1}+3\ge 0.\end{cases}
  1. Naszkicuj zbiór punktów dopuszczalnych, czyli punktów spełniających wszystkie ograniczenia.

  2. Znajdź graficznie rozwiązanie powyższego problemu optymalizacyjnego.

  3. Znajdź następnie rozwiązanie w przypadku, gdy minimalizacja zamieniona zostanie na maksymalizację.

Ćwiczenie 1.6

Niech g będzie funkcją spełniającą: 0\le g(y), y\in[0,1], oraz \int _{0}^{1}g(y)dy=1. Znajdź x\in[0,1], dla którego następująca całka jest minimalna:

\int _{0}^{1}(x-y)^{2}g(y)dy.
Ćwiczenie 1.7

Wykaż, że funkcja

f(x)=\begin{cases}x^{2}sin\big(\frac{1}{x}\big),&x\ne 0,\\
0,&x=0,\end{cases}

jest różniczkowalna w \mathbb{R}, lecz jej pochodna nie jest ciągła.

Ćwiczenie 1.8

Udowodnij, że poniższe definicje pochodnej funkcji f:[a,b]\to\mathbb{R} w punkcie x_{0}\in(a,b) są równoważne:

  • (a) \displaystyle f^{{\prime}}(x_{0})=\lim _{{h\to 0}}\frac{f(x_{0}+h)-f(x_{0})}{h},

  • (b) \displaystyle f(x)=f(x_{0})+\alpha(x-x_{0})+o(x-x_{0}) dla x\in[a,b] i \alpha\in\mathbb{R} niezależnego od x.

Przez równoważność rozumiemy to, że jeśli granica w (a) istnieje, to zależność (b) jest spełniona z \alpha=f^{{\prime}}(x_{0}); i odwrotnie, jeśli (b) zachodzi dla pewnego \alpha, to granica w (a) istnieje i jest równa \alpha.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.