Zagadnienia

1.1 Problem optymalizacji
1.2 Istnienie minimum funkcji ciągłej
1.3 Minima lokalne funkcji jednej zmiennej
1.4 Wzory Taylora
1.5 Dowody twierdzeń -
1.6 Ekstrema globalne
1.7 Zadania

1. Wiadomości wstępne

1.1. Problem optymalizacji

Niech $W\subset\mathbb{R}^{n}$ będzie niepustym zbiorem, zaś $f:W\to\mathbb{R}$ dowolną funkcją. Będziemy rozważać problem minimalizacji funkcji $f$ na zbiorze $W$ , przyjmując różne postaci $W$ , w tym:

$W=\mathbb{R}^{n}$ (problem optymalizacji bez ograniczeń),
$W=\{ x\in\mathbb{R}^{n}:g_{1}(x)=0,\dots,\ g_{m}(x)=0\}$ , gdzie $g_{1},\dots g_{m}:\mathbb{R}^{n}\to\mathbb{R}$ pewne funkcje (problem optymalizacji z ograniczeniami równościowymi),
$W=\{ x\in\mathbb{R}^{n}:g_{1}(x)\leq 0,\dots,\ g_{m}(x)\leq 0\}$ , gdzie $g_{1},\dots g_{m}:\mathbb{R}^{n}\to\mathbb{R}$ pewne funkcje (problem optymalizacji z ograniczeniami nierównościowymi).

Zbiór $W$ nosi nazwę zbioru punktów dopuszczalnych.

Definicja 1.1

Punkt $x_{0}\in W$ nazywamy minimum globalnym funkcji $f$ na zbiorze $W$ jeśli

$f(x)\geq f(x_{0})\ \ \ \ \text{dla\ każdego}\ \ x\in W.$

Definicja 1.2

Punkt $x_{0}\in W$ nazywamy minimum lokalnym funkcji $f$ jeśli istnieje $\varepsilon>0$ takie, że dla kuli $B(x_{0},\varepsilon)$ o środku w $x_{0}$ i promieniu $\varepsilon$ zachodzi

$\qquad\qquad f(x)\geq f(x_{0})\ \ \ \ \text{dla\ każdego}\ \ x\in B(x_{0},\varepsilon)\cap W.$

Oczywiście, jeśli $x_{0}$ jest minimum globalnym to jest minimum lokalnym. Minimum nazywamy ścisłym, jeśli w powyższych definicjach zachodzi $f(x)>f(x_{0})$ , dla $x\not=x_{0}$ . Analogicznie definiujemy globalne i lokalne maksimum. Punkt $x_{0}$ nazywamy ekstremum (lokalnym, globalnym) jeśli jest on maksimum lub minimum (lokalnym, globalnym).

Minimum (globalne, lokalne) nie musi istnieć, tzn. może się okazać, że nie istnieje $x_{0}$ spełniające warunek z definicji 1.1 lub 1.2. W szczególności minimum globalne $f$ na zbiorze $W$ nie istnieje gdy:

(a) $\inf _{{x\in W}}f(x)=-\infty$ , lub
(b) $\inf _{{x\in W}}f(x)=c\in\mathbb{R}$ , ale $\nexists\ x\in U$ takie, że $f(x)=c$ .

Przykład 1.1

Niech $W=\mathbb{R},\ f(x)=x\sin x$ . Dla tej funkcji $\inf _{{x\in W}}f(x)=-\infty$ , zatem minimum globalne nie istnieje. Jeżeli natomiast ograniczymy się do przedziału $W=[a,b]$ , to minimum globalne będzie istnieć. Funkcja ta osiąga minimum lokalne w nieskończonej ilości punktów, dla $W=\mathbb{R}$ . Jeżeli za $W$ przyjmiemy odcinek otwarty, to minimum globalne istnieje lub nie istnieje, w zależności od tego odcinka. Ogólnie, funkcja ciągła może nie osiągać kresów na zbiorze niezwartym, w szczególności na podzbiorze otwartym $W\subset\mathbb{R}^{n}$ .

1.2. Istnienie minimum funkcji ciągłej

Przypomnijmy, że podzbiór zwarty w $\mathbb{R}^{n}$ to podzbiór domknięty i ograniczony.

Twierdzenie 1.1

Jeśli $W$ jest zbiorem zwartym i $f:W\to\mathbb{R}$ jest funkcją ciągłą, to $f$ osiąga kresy na $W$ (dolny i górny). Oznacza to, że istnieją $\mathbf{x}_{0}$ , $\mathbf{y}_{0}\in W$ takie, że dla dowolnego $\mathbf{x}\in W$ zachodzi

$f(\mathbf{x}_{0})\leq f(\mathbf{x})\leq f(\mathbf{y}_{0}).$

Będziemy oznaczali normę euklidesową w $\mathbb{R}^{n}$ przez

$\|\mathbf{x}\|=\sqrt{x_{1}^{2}+x_{2}^{2}+\ldots+x_{n}^{2}}.$

Warunek zwartości zbioru w powyższym twierdzeniu możemy osłabić do warunku domkniętości, jeśli funkcja jest koercywna. Koercywność funkcji definiujemy następująco:

Definicja 1.3

Funkcję $f:W\to\mathbb{R}$ na podzbiorze $W\subset\mathbb{R}^{n}$ nazywamy koercywną, jeśli $f(\mathbf{x})\rightarrow\infty$ dla $\|\mathbf{x}\|\rightarrow\infty$ . Można ten warunek zapisać równoważnie

$\forall _{{r>0}}\ \exists _{{s>0}}\ \forall _{{\mathbf{x}\in W}}:\quad\|\mathbf{x}\|>s\quad\Longrightarrow\quad f(\mathbf{x})>r.$

W szczególności, jeśli $W$ jest ograniczony, to $f$ jest automatycznie koercywna na $W$ .

Twierdzenie 1.2

Jeśli zbiór $W$ jest domknięty oraz funkcja $f:W\rightarrow\mathbb{R}$ jest ciągła i koercywna, to istnieje punkt $\mathbf{x}_{0}$ w którym funkcja $f$ przyjmuje minimum, tzn. istnieje $\mathbf{x}_{0}\in W$ taki, że $f(\mathbf{x}_{0})=\inf _{{\mathbf{x}\in W}}f(\mathbf{x})$ .

Dowód

Niech $\mathbf{y}$ będzie ustalonym punktem w zbiorze $W\subset\mathbb{R}^{n}$ . Rozpatrzmy zbiór $U=\{\mathbf{x}\in W:f(\mathbf{x})\leq f(\mathbf{y})\}$ . Zauważmy, że $U$ jest zbiorem domkniętym w $W$ , bo funkcja $f$ jest ciągła, a nierówność w warunku nieostra. Z domkniętości $W$ wynika, że $U$ jest domknięty w $\mathbb{R}^{n}$ . Jest on też ograniczony. Mianowicie, dla $r=f(\mathbf{y})$ , z koercywności $f$ istnieje $s>0$ takie, że jeśli $\|\mathbf{x}\|>s$ , to $f(\mathbf{x})>r=f(\mathbf{y})$ , skąd $U$ jest zawarte w kuli $B(s)=\{\mathbf{x}:\|\mathbf{x}\|\leq s\}$ . Zatem $U$ jest zbiorem zwartym. Wówczas istnieje $\mathbf{x}_{0}\in U$ – punkt minimum na zbiorze $U$ . Dla $\mathbf{x}\not\in U$ mamy $f(\mathbf{x})>f(\mathbf{y})\geq f(\mathbf{x}_{0})$ , więc $\mathbf{x}_{0}$ jest globalnym minimum na całym $W$ .

∎

Domkniętość $W$ nie jest potrzebna, jeśli $f$ odpowiednio rośnie w pobliżu granicy $\partial W$ .

Twierdzenie 1.3

Niech $W\subset\mathbb{R}^{n}$ będzie dowolnym niepustym podzbiorem oraz $f:W\rightarrow\mathbb{R}$ – funkcją ciągłą. Jeśli dla pewnego ustalonego punktu $\mathbf{y}\in W$ oraz dowolnego ciągu $\mathbf{x}_{n}\in W$ , takiego że

$\mathbf{x}_{n}\to\mathop{\rm cl}W\setminus W\qquad\text{lub}\qquad\|\mathbf{x}_{n}\|\to\infty$

zachodzi

$\liminf _{{n\to\infty}}f(\mathbf{x}_{n})>f(\mathbf{y}),$

to istnieje punkt $\mathbf{x}_{0}$ w którym funkcja $f$ przyjmuje minimum.

Dowód

Zbiór $U$ definiujemy jak w poprzednim dowodzie, $U=\{\mathbf{x}\in W:f(\mathbf{x})\leq f(\mathbf{y})\}$ . Aby pokazać domkniętość $U$ weźmy dowolny ciąg $(\mathbf{x}_{n})\subset U$ zbieżny do $\tilde{\mathbf{x}}$ . Pokażemy, że $\tilde{\mathbf{x}}\in U$ . Z $\mathbf{x}_{n}\in U$ mamy $f(\mathbf{x}_{n})\le f(\mathbf{y})$ i jeśli $\tilde{\mathbf{x}}\notin W$ , nierówność ta przeczy założeniu twierdzenia. Wynika stąd, że $\tilde{\mathbf{x}}\in W$ . Korzystając teraz z ciągłości $f$ na $W$ dostajemy $f(\tilde{\mathbf{x}})\le f(\mathbf{y})$ , skąd $\tilde{\mathbf{x}}\in U$ . Ograniczoność zbioru $U$ wynika z założonej w twierdzeniu implikacji $\|\mathbf{x}_{n}\|\to\infty\ \Rightarrow\ \liminf _{{n\to\infty}}f(\mathbf{x}_{n})>f(\mathbf{y})$ . Pozostała część dowodu jest identyczna jak w dowodzie poprzedniego twierdzenia.

∎

Przykład 1.2

Funkcja $f(x,y)=xy-\ln(xy)$ jest ciągła i spełnia założenia Twierdzenia 1.3 na zbiorze $W=\{(x,y)\in\mathbb{R}^{n}:x>0,y>0,x+y\le 4\}$ , osiąga więc minimum na $W$ .

1.3. Minima lokalne funkcji jednej zmiennej

Niech $W\subset\mathbb{R}$ - podzbiór otwarty. Przypomnimy elementarne fakty.

Twierdzenie 1.4 (Warunek konieczny I rzędu)

Jeśli $x_{0}\in W$ jest punktem lokalnego minimum lub maksimum funkcji $f:W\to\mathbb{R}$ oraz $f$ posiada pochodną w punkcie $x_{0}$ , to

$f^{{\prime}}(x_{0})=0.$

Dowód twierdzenia 1.4

Niech $x_{0}$ - minimum lokalne. Dla dostatecznie małych $h$ zachodzi $f(x_{0}+h)\geq f(x_{0})$ . Zatem dla $h>0$ mamy

$\frac{f(x_{0}+h)-f(x_{0})}{h}\geq 0\ \ \Longrightarrow\ \ \lim _{{h\rightarrow 0}}\frac{f(x_{0}+h)-f(x_{0})}{h}\geq 0\ \ \Longrightarrow\ \ f^{{\prime}}(x_{0})\geq 0.$

Dla $h<0$

$\frac{f(x_{0}+h)-f(x_{0})}{h}\leq 0\ \ \Longrightarrow\ \ \lim _{{h\rightarrow 0}}\frac{f(x_{0}+h)-f(x_{0})}{h}\leq 0\ \ \Longrightarrow\ \ f^{{\prime}}(x_{0})\leq 0.$

Stąd $f^{{\prime}}(x_{0})=0$ .

∎

Twierdzenie 1.5 (Warunek konieczny II rzędu)

Jeśli $f:W\to\mathbb{R}$ jest klasy $C^{2}$ na zbiorze $W$ i $x_{0}$ jest punktem lokalnego minimum, to

$f^{{\prime\prime}}(x_{0})\geq 0.$

Twierdzenie 1.6 (Warunek dostateczny II rzędu)

Jeśli $f:W\to\mathbb{R}$ jest klasy $C^{2}$ na zbiorze W oraz $f^{{\prime}}(x_{0})=0$ , $f^{{\prime\prime}}(x_{0})>0$ dla pewnego $x_{0}\in W$ , to $f$ ma ścisłe lokalne minimum w punkcie $x_{0}$ .

Uwaga 1.1

Twierdzenie 1.5 pozostaje prawdziwe przy zamianie lokalnego minimum na maksimum, jeśli znak znak drugiej pochodnej zmienimy na przeciwny.

Uwaga 1.2

Jeśli $W$ nie jest otwarty, to Twierdzenia 1.4 i 1.5 nie są prawdziwe dla $x_{0}\in\partial W$ (brzeg $W$ ), np. funkcja $f(x)=-x^{2}$ przyjmuje minimum na odcinku $[0,2]$ w punkcie $x_{0}=2$ , ale żaden z warunków koniecznych tych twierdzeń nie zachodzi. Natomiast Twierdzenie 1.6 zachodzi również dla $W$ będącego odcinkiem domkniętym i $x_{0}\in\partial W$ .

Poniższe twierdzenie uogólnia warunek dostateczny II rzędu.

Twierdzenie 1.7

Jeśli funkcja $f$ jest klasy $C^{k}$ na podzbiorze otwartym $W\subset\mathbb{R}$ i zachodzi $f^{{\prime}}(x_{0})=f^{{\prime\prime}}(x_{0})=\cdots=f^{{(k-1)}}(x_{0})=0$ oraz $f^{{(k)}}(x_{0})\neq 0$ w pewnym $x_{0}\in W$ , to:

I) Jeśli $k$ jest nieparzyste, to funkcja $f$ nie posiada w punkcie $x_{0}$ ekstremum lokalnego.
II) Jeśli $k$ jest parzyste oraz:
- (a) $f^{{(k)}}(x_{0})>0$ , to punkt $x_{0}$ jest ścisłym minimum lokalnym $f$ ,
- (b) $f^{{(k)}}(x_{0})<0$ , to punkt $x_{0}$ jest ścisłym maksimum lokalnym $f$ .

Dowody twierdzeń 1.5-1.7 podamy w podrozdziale 1.5.

1.4. Wzory Taylora

W tym podrozdziale przypomnimy wyniki, których będziemy używać w wielu dowodach w trakcie tego wykładu. Skorzystamy z nich również, aby przedstawić zwięzłe dowody twierdzeń 1.5-1.7.

Twierdzenie 1.8 (Twierdzenie o wartości średniej)

Jeśli funkcja $f:[a,b]\to\mathbb{R}$ jest ciągła na $[a,b]$ i różniczkowalna na $(a,b)$ , to istnieje taki punkt $x\in(a,b)$ , że

$f(b)-f(a)=f^{{\prime}}(x)(b-a).$

Zauważmy, że do prawdziwości powyższego twierdzenia nie jest konieczna ciągłość pierwszej pochodnej (w zadaniu 1.7 pokazujemy, że różnicznowalność nie musi pociągać ciągłości pochodnej).

Dowód twierdzenia 1.8

Niech $g(x)=[f(b)-f(a)]x-(b-a)f(x)$ dla $x\in[a,b]$ . Wówczas $g$ jest ciągła na $[a,b]$ , różniczkowalna w $(a,b)$ oraz

$g(a)=f(b)a-f(a)b=g(b).$

Pokażemy teraz, że istnieje punkt $x_{0}\in(a,b)$ , w którym pochodna $g$ się zeruje. Jeśli $g$ jest funkcją stałą, to dla dowolnego $x_{0}\in(a,b)$ mamy $g^{{\prime}}(x_{0})=0$ . W przeciwnym przypadku, na mocy twierdzenia 1.1 funkcja $g$ przyjmuje swoje kresy na $[a,b]$ . Jeden z kresów jest różny od $g(a)=g(b)$ . Zatem jest on przyjmowany w punkcie $x_{0}$ we wnętrzu przedziału $[a,b]$ . Korzystając z twierdzenia 1.4 wnioskujemy, że $g^{{\prime}}(x_{0})=0$ . Różniczkując $g$ otrzymujemy:

$0=g^{{\prime}}(x_{0})=[f(b)-f(a)]-(b-a)f^{{\prime}}(x).$

Po prostych przekształceniach otrzymujemy poszukiwany wzór.

∎

Twierdzenie 1.9 (Twierdzenie Taylora z resztą w postaci Peano)

Niech $f:[a,b]\to\mathbb{R}$ będzie funkcją klasy $C^{{1}}$ na $[a,b]$ oraz dwukrotnie różniczkowalna w pewnym $x_{0}\in(a,b)$ . Wówczas dla $x\in[a,b]$ zachodzi następujący wzór:

$f(x)=f(x_{0})+f^{{\prime}}(x_{0})(x-x_{0})+\frac{f^{{\prime\prime}}(x_{0})}{2}(x-x_{0})^{2}+o\big((x-x_{0})^{2}\big).$

Uwaga 1.3

W sformułowaniu powyższego twierdzenia użyliśmy notacji małe o. Rozumieć ją należy następująco:

$R(x)=f(x)-f(x_{0})-f^{{\prime}}(x_{0})(x-x_{0})-\frac{f^{{\prime\prime}}(x_{0})}{2}(x-x_{0})^{2}$

jest rządu mniejszego niż $(x-x_{0})^{2}$ , tzn.

$\lim _{{x\to x_{0}}}\frac{R(x)}{(x-x_{0})^{2}}=0.$

Przykład 1.3

Innym zastosowaniem powyższej notacji jest definicja pochodnej. Pochodną funkcji $f$ w punkcie $x_{0}$ nazywamy taką liczbę $\alpha\in\mathbb{R}$ , że

$f(x)=f(x_{0})+\alpha(x-x_{0})+o(x-x_{0}).$

Dowód twierdzenia 1.9

Bez straty ogólności możemy założyć $x_{0}=0$ . Musimy wykazać, że $R(x):=f(x)-f(0)-f^{{\prime}}(0)x-\frac{f^{{\prime\prime}}(0)}{2}x^{2}$ jest niższego rzędu niż $x^{2}$ , tzn. $R(x)=o(x^{2})$ . Z ciągłości pierwszej pochodnej $f$ dostajemy

$f(x)-f(0)=\int _{0}^{x}f^{{\prime}}(y)dy.$

Wiemy, że $f^{{\prime}}$ jest różniczkowalna w $0$ . Zatem $f^{{\prime}}(y)=f^{{\prime}}(0)+f^{{\prime\prime}}(0)y+r(y)$ , gdzie $r(y)=o(y)$ . Oznacza to, że

$\lim _{{y\to 0}}\frac{r(y)}{y}=0.$

Dla dowolnego $\varepsilon>0$ istnieje zatem $\delta>0$ , taka że $|y|<\delta$ pociąga $|r(y)|<\varepsilon|y|$ .

Ustalmy zatem dowolny $\varepsilon>0$ i związaną z nim $\delta>0$ . Weźmy $|x|<\delta$ i scałkujmy pochodną $f^{{\prime}}(y)$ . Otrzymamy wówczas:

$f(x)-f(0)=\int _{0}^{x}\big(f^{{\prime}}(0)+f^{{\prime\prime}}(0)y+r(y)\big)dy=f^{{\prime}}(0)x+\frac{f^{{\prime\prime}}(0)}{2}x^{2}+\int _{0}^{x}r(y)dy,$

czyli $R(x)=\int _{0}^{x}r(y)dy$ . Korzystając z oszacowania $|r(y)|<\varepsilon|y|$ dla $|y|<\delta$ dostajemy

$|R(x)|\le\int _{0}^{x}|r(y)|dy<\int _{0}^{{|x|}}\varepsilon|y|dy=\frac{\varepsilon x^{2}}{2}.$

A zatem

$\left|\frac{R(x)}{x^{2}}\right|<\frac{\varepsilon}{2}.$

Z dowolności $\varepsilon>0$ wynika, iż $R(x)=o(x^{2})$ .

∎

Uwaga 1.4

Twierdzenie 1.9 można uogólnić do dowolnie długiej aproksymacji Taylora. Dowód przebiega wówczas podobnie, lecz jest nieznacznie dłuższy.

Zakładając większą gładkość funkcji $f$ możemy opisać dokładniej błąd aproksymacji we wzorze Taylora.

Twierdzenie 1.10 (Twierdzenie Taylora z resztą w postaci Lagrange'a)

Niech $f:[a,b]\to\mathbb{R}$ będzie funkcją klasy $C^{{k-1}}$ na $[a,b]$ oraz $k$ -krotnie różniczkowalna na $(a,b)$ . Wtedy dla ustalonego $x_{0}\in(a,b)$ i $x\in[a,b]$ zachodzi następujący wzór:

$f(x)=f(x_{0})+\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(x-x_{0})^{i}+\frac{f^{{(k)}}(\tilde{x})}{k!}(x-x_{0})^{k},$

gdzie $\tilde{x}$ jest pewnym punktem pomiędzy $x_{0}$ i $x$ .

W szczególności dla $k=2$ dostajemy

$f(x)=f(x_{0})+f^{{\prime}}(x_{0})(x-x_{0})+\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}.$

Dowód twierdzenia 1.10

Niech liczba $M$ spełnia równanie

$f(x)=f(x_{0})+\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(x-x_{0})^{i}+M(x-x_{0})^{k}.$

Celem dowodu jest pokazanie, że $M=\frac{f^{{(k)}}(\tilde{x})}{k!}$ dla pewnego punktu $\tilde{x}$ pomiędzy $x_{0}$ i $x$ . Określmy funkcję

$g(y)=f(y)-\sum _{{i=1}}^{{k-1}}\frac{f^{{(i)}}(x_{0})}{i!}(y-x_{0})^{i}-M(y-x_{0})^{k},\qquad y\in[x_{0},x].$

Zauważmy, że

$g(x_{0})=g^{{\prime}}(x_{0})=\cdots=g^{{(k-1)}}(x_{0})=0.$

Ponieważ $g(x)=0$ , to na podstawie twierdzenia 1.8 istnieje $x_{1}\in(x_{0},x)$ , taki że $g^{{\prime}}(x_{1})=0$ . Stosując jeszcze raz tw. 1.8 do funkcji $g^{{\prime}}(y)$ dla $y\in[x_{0},x_{1}]$ dostajemy $x_{2}\in(x_{0},x_{1})$ , w którym $g^{{\prime\prime}}(x_{2})=0$ . Postępując w ten sposób dostajemy ciąg punktów $x>x_{1}>x_{2}>\cdots>x_{k}>x_{0}$ , takich że $g^{{(j)}}(x_{j})=0$ , $j=1,\ldots,k$ . Z warunku dla punktu $x_{k}$ otrzymujemy

$0=g^{{(k)}}(x_{k})=f^{{(k)}}(x_{k})-k!M.$

Szukanym punktem $\tilde{x}$ w twierdzeniu jest więc $x_{k}$ .

∎

1.5. Dowody twierdzeń 1.5-1.7

Dowód twierdzenia 1.5

Z twierdzenia 1.4 wiemy, że jeśli $x_{0}$ jest punktem minimum to $f^{{\prime}}(x_{0})=0.$ Zatem korzystając ze wzoru Taylora, tw. 1.10, uzyskujemy

$f(x)-f(x_{0})=\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}$

dla pewnego punktu $\tilde{x}$ leżącego pomiędzy $x_{0}$ i $x$ . Z założenia, że $x_{0}$ jest minimum lokalnym, otrzymujemy $f(x)-f(x_{0})\ge 0$ . Stąd i z $(x-x_{0})^{2}\ge 0$ wnioskujemy, że

$f^{{\prime\prime}}(\tilde{x})\ge 0.$

Jeśli $x\rightarrow x_{0}$ , to również $\tilde{x}\rightarrow x_{0}$ . Wykorzystując ciągłość $f^{{\prime\prime}}$ dostajemy $f^{{\prime\prime}}(x_{0})\ge 0$ .

∎

Dowód twierdzenia 1.6

Z ciągłości drugiej pochodnej $f$ wynika, że istnieje kula $B(x_{0},\varepsilon)$ , na której $f^{{\prime\prime}}>0$ . Zatem dla $x\in B(x_{0},\varepsilon)$ , $x\ne x_{0}$ , wnioskujemy ze wzoru Taylora, tw. 1.10, że $f(x)>f(x_{0})$ :

$f(x)-f(x_{0})=\underset{=0}{\underbrace{f^{{\prime}}(x_{0})(x-x_{0})}}+\underset{>0}{\underbrace{\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2}}}.$

Oznacza to, że $f$ ma ścisłe minimum lokalne w $x_{0}$ .

∎

Dowód twierdzenia 1.7

Z ciągłości $f$ i otwartości $W$ wynika, że istnieje kula $B(x_{0},\varepsilon)\subset W$ , na której $f^{{(k)}}$ jest niezerowa (tzn. $f^{{(k)}}$ nie zmienia znaku z ciągłości). Korzystając ze wzoru Taylora, tw. 1.10 i z założeń twierdzenia otrzymujemy

$f(x)=f(x_{0})+\frac{f^{{(k)}}(\tilde{x})}{k!}(x-x_{0})^{k}$

dla dowolnego $x\in B(x_{0},\varepsilon)$ oraz $\tilde{x}$ , zależnego od $x$ , należącego do przedziału o końcach $x_{0}$ i $x$ . Aby zbadać, czy zachodzi jedna z nierówności $f(x)>f(x_{0})$ lub $f(x)<f(x_{0})$ dla wszystkich $x\not=x_{0}$ , $x\in B(x_{0},\varepsilon)$ należy zbadać znak członu z potęgą $(x-x_{0})^{k}$ . Człon ten zmienia znak dla $k$ nieparzystego, stąd teza (I). Dla $k$ parzystego znak różnicy $f(x)-f(x_{0})$ zależy od znaku pochodnej $f^{{(k)}}$ na $B(x_{0},\varepsilon)$ .

∎

1.6. Ekstrema globalne

Uzupełnimy jeszcze twierdzenie 1.6 o wynik dotyczący ekstremów globalnych.

Niech $I\subset\mathbb{R}$ będzie odcinkiem otwartym, domkniętym, lub jednostronnie domkniętym (być może nieograniczonym) i niech $f:I\to\mathbb{R}$ będzie funkcją klasy $C^{1}$ na $I$ i klasy $C^{2}$ na $\mathop{\rm int}I$ . Zachodzi następujące

Twierdzenie 1.11

Przy powyższych założeniach, jeśli $f^{{\prime}}(x_{0})=0$ oraz:

(a) $f^{{\prime\prime}}(x)\geq 0\quad\forall _{{x\in I}}\quad\Longrightarrow\quad x_{0}$ jest globalnym minimum na $I$ ,
(b) $f^{{\prime\prime}}(x)\leq 0\quad\forall _{{x\in I}}\quad\Longrightarrow\quad x_{0}$ jest globalnym maksimum na $I$ .

Jeśli założenia powyższe uzupełnimy o warunek $f^{{\prime\prime}}(x_{0})>0$ (odpowiednio $f^{{\prime\prime}}(x_{0})<0$ ), to $x_{0}$ będzie ścisłym globalnym minimum (maksimum).

Dowód

Wzór Taylora, tw. 1.10, daje

$f(x)=f(x_{0})+\frac{1}{2}f^{{\prime\prime}}(\tilde{x})(x-x_{0})^{2},$

gdzie $\tilde{x}$ jest pewnym punktem pomiędzy $x_{0}$ i $x$ . Stąd drugi człon wzoru Taylora decyduje o nierówności pomiędzy $f(x)$ a $f(x_{0})$ i otrzymujemy obie implikacje w twierdzeniu dotyczące słabych ekstremów.

Załóżmy dodatkowo w pierwszym stwierdzeniu, że $f^{{\prime\prime}}(x_{0})>0$ . Z założenia $f^{{\prime\prime}}(x)\ge 0$ i warunku $f^{{\prime}}(x_{0})=0$ dostajemy

$f^{{\prime}}(x)=f^{{\prime}}(x)-f^{{\prime}}(x_{0})=\int _{{x_{0}}}^{x}f^{{\prime\prime}}(y)dy\ge 0,$

gdy $x>x_{0}$ . Podobnie pokazujemy, że $f^{{\prime}}(x)=-\int _{{x}}^{{x_{0}}}f^{{\prime\prime}}(y)dy\le 0$ , gdy $x<x_{0}$ . Z faktu, że $f^{{\prime\prime}}(x_{0})>0$ i ciągłości drugiej pochodnej dostajemy dodatkowo, że ta pochodna jest ściśle dodatnia w otoczeniu $x_{0}$ . Zatem całki są dodatnie, co pociąga nierówności $f^{{\prime}}(x)>0$ , gdy $x>x_{0}$ , oraz $f^{{\prime}}(x)<0$ , gdy $x<x_{0}$ . Wynika stąd, że funkcja $f$ jest ściśle rosnąca na prawo od $x_{0}$ i ściśle malejąca na lewo od $x_{0}$ , a więc $x_{0}$ jest ścisłym minimum. Przypadek ścisłego maksimum dowodzimy analogicznie.

∎

1.7. Zadania

Ćwiczenie 1.1

Czy funkcja $f(x,y)=x^{4}+x^{2}-xy+2y^{2}$ osiąga minimum na zbiorze $\{(x,y)\in\mathbb{R}^{2}:\ x\ge-1\}$ .

Ćwiczenie 1.2

Znajdź minimum funkcji $f(x,y)=2x+3y$ na zbiorze $W=\{(x,y)\in\mathbb{R}^{2}:\ x^{2}+y^{2}=1\}.$

Ćwiczenie 1.3

Znajdź maksimum funkcji $f(x,y)=x^{2}-4y^{2}$ na zbiorze $W=\{(x,y)\in\mathbb{R}^{2}:\ 2x^{2}+|y|=1\}.$

Ćwiczenie 1.4

Znajdź minimum funkcji $f(x,y)=e^{{x^{2}-y^{2}}}$ na zbiorze $W=\{(x,y)\in\mathbb{R}^{2}:\ x^{2}+y^{2}=1\}.$

Ćwiczenie 1.5

Rozważmy następujący nieliniowy problem optymalizacyjny:

$\begin{cases}(x_{1}-4)^{2}+(x_{2}-2)^{2}\to\min,&\\ 4x_{1}^{2}+9x_{2}^{2}\le 36,&\\ x_{1}^{2}+4x_{2}=4,&\\ 2x_{1}+3\ge 0.\end{cases}$

Naszkicuj zbiór punktów dopuszczalnych, czyli punktów spełniających wszystkie ograniczenia.
Znajdź graficznie rozwiązanie powyższego problemu optymalizacyjnego.
Znajdź następnie rozwiązanie w przypadku, gdy minimalizacja zamieniona zostanie na maksymalizację.

Ćwiczenie 1.6

Niech $g$ będzie funkcją spełniającą: $0\le g(y)$ , $y\in[0,1]$ , oraz $\int _{0}^{1}g(y)dy=1.$ Znajdź $x\in[0,1]$ , dla którego następująca całka jest minimalna:

$\int _{0}^{1}(x-y)^{2}g(y)dy.$

Ćwiczenie 1.7

Wykaż, że funkcja

$f(x)=\begin{cases}x^{2}sin\big(\frac{1}{x}\big),&x\ne 0,\\ 0,&x=0,\end{cases}$

jest różniczkowalna w $\mathbb{R}$ , lecz jej pochodna nie jest ciągła.

Ćwiczenie 1.8

Udowodnij, że poniższe definicje pochodnej funkcji $f:[a,b]\to\mathbb{R}$ w punkcie $x_{0}\in(a,b)$ są równoważne:

(a) $\displaystyle f^{{\prime}}(x_{0})=\lim _{{h\to 0}}\frac{f(x_{0}+h)-f(x_{0})}{h}$ ,
(b) $\displaystyle f(x)=f(x_{0})+\alpha(x-x_{0})+o(x-x_{0})$ dla $x\in[a,b]$ i $\alpha\in\mathbb{R}$ niezależnego od $x$ .

Przez równoważność rozumiemy to, że jeśli granica w (a) istnieje, to zależność (b) jest spełniona z $\alpha=f^{{\prime}}(x_{0})$ ; i odwrotnie, jeśli (b) zachodzi dla pewnego $\alpha$ , to granica w (a) istnieje i jest równa $\alpha$ .

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Optymalizacja II

Zagadnienia

1. Wiadomości wstępne

1.1. Problem optymalizacji

Definicja 1.1

Definicja 1.2

Przykład 1.1

1.2. Istnienie minimum funkcji ciągłej

Twierdzenie 1.1

Definicja 1.3

Twierdzenie 1.2

Dowód

Twierdzenie 1.3

Dowód

Przykład 1.2

1.3. Minima lokalne funkcji jednej zmiennej

Twierdzenie 1.4 (Warunek konieczny I rzędu)

Dowód twierdzenia 1.4

Twierdzenie 1.5 (Warunek konieczny II rzędu)

Twierdzenie 1.6 (Warunek dostateczny II rzędu)

Uwaga 1.1

Uwaga 1.2

Twierdzenie 1.7

1.4. Wzory Taylora

Twierdzenie 1.8 (Twierdzenie o wartości średniej)

Dowód twierdzenia 1.8

Twierdzenie 1.9 (Twierdzenie Taylora z resztą w postaci Peano)

Uwaga 1.3

Przykład 1.3

Dowód twierdzenia 1.9

Uwaga 1.4

Twierdzenie 1.10 (Twierdzenie Taylora z resztą w postaci Lagrange'a)

Dowód twierdzenia 1.10

1.5. Dowody twierdzeń 1.5-1.7

Dowód twierdzenia 1.5

Dowód twierdzenia 1.6

Dowód twierdzenia 1.7

1.6. Ekstrema globalne

Twierdzenie 1.11

Dowód

1.7. Zadania

Ćwiczenie 1.1

Ćwiczenie 1.2

Ćwiczenie 1.3

Ćwiczenie 1.4

Ćwiczenie 1.5

Ćwiczenie 1.6

Ćwiczenie 1.7

Ćwiczenie 1.8