Zagadnienia

3. Funkcje wypukłe

3.1. Zbiory wypukłe i twierdzenia o oddzielaniu

Przypomnijmy, za def. 2.2, definicję zbioru wypukłego: zbiór WRn jest wypukły, jeśli

λx+1-λyW

dla każdych x,yW i każdego λ0,1. Równoważnie można wypukłość zdefiniować za pomocą m-tek punktów:

Lemat 3.1

Zbiór WRn jest wypukły wtw, gdy dla dowolnego m2, punktów x1,,xmW oraz liczb a1,,am0, takich że a1++am=1 mamy

a1x1+a2x2++amxmW.

Dowód tego lematu pozostawiamy jako ćwiczenie (patrz ćw. 3.3). Udowodnimy natomiast geometryczną własność zbiorów wypukłych, która przyda nam się wielokrotnie.

Lemat 3.2

Niech WRn będzie zbiorem wypukłym o niepustym wnętrzu. Wówczas:

  • I) Dla dowolnego xW oraz x0intW odcinek łączący x0 z x, z pominięciem punktu x, należy do wnętrza W:

    λx0+1-λxintW, 0λ<1.
  • II) WclintW.

Dowód

Weźmy punkty x0 i x jak w założeniach lematu. Z otwartości intW wynika, że istnieje kula Bx0,εintW. Połączmy punkty tej kuli z punktem x. Dostaniemy ,,stożek” o wierzchołku x i podstawie Bx0,ε (patrz rys. 3.1). Stożek ten leży w całości w W. Jego wnętrze zawiera odcinek od x0 do x bez końca x. Kończy to zatem dowód (I). Dowód (II) wynika natychmiast z (I).

Rys. 3.1. Stożek o wierzchołku x i podstawie Bx¯,ε.

Przypomnijmy bez dowodu twierdzenia o oddzielaniu zbiorów wypukłych w przestrzeniach Rn (dowody tych twierdzeń można znaleźć np. w rozdziale 2.4 monografii Bazaraa, Sherali, Shetty [3] lub w rozdziale 11 monografii Rockafellar'a [11]).

Twierdzenie 3.1 (Słabe twierdzenie o oddzielaniu)

Niech U,VRn będą niespustymi zbiorami wypukłymi, takimi że UV=. Wówczas istnieje hiperpłaszczyzna rozdzielająca U od V, tzn. istnieje niezerowy wektor aRn spełniający

aTxaTy,xU,yV.

Korzystając z ciągłości odwzorowania liniowego xaTx dostajemy bardzo przydatny wniosek, który również będziemy nazywać słabym twierdzeniem o oddzielaniu.

Wniosek 3.1

Niech U,VRn będą niepustymi zbiorami wypukłymi, takimi że intU i intUV=. Wówczas istnieje hiperpłaszczyzna rozdzielająca U od V, tzn. istnieje niezerowy wektor aRn spełniający

aTxaTy,xU,yV.
Twierdzenie 3.2 (Mocne twierdzenie o oddzielaniu)

Niech U,VRn będą niepustymi zbiorami wypukłymi domkniętymi, U zwarty i UV=. Wówczas istnieje hiperpłaszczyzna ściśle rozdzielająca U od V, tzn. istnieje niezerowy wektor aRn spełniający

supxUaTx<infyVaTy.
Uwaga 3.1

Powyższe twierdzenia mają intuicyjną geometryczną interpretację. Dwa rozłączne zbiory wypukłe mogą być rozdzielone hiperpłaszczyzną w ten sposób, iż jeden z nich leży w domkniętej półprzestrzeni po jednej stronie hiperpłaszczyzny, podczas gdy drugi leży po przeciwnej stronie tejże hiperpłaszczyzny. W słabym twierdzeniu nie możemy zagwarantować, iż któryś ze zbiorów leży we wnętrzu półprzestrzeni, tzn. ma puste przecięcie z hiperpłaszczyzną. Silna wersja właśnie to gwarantuje.

Hiperpłaszczyzna, o której mowa w twierdzeniach zadana jest wzorem:

xRn:aTx=α,

gdzie α=supxUaTx. Nie musi to być jedyna hiperpłaszczyzna spełniająca warunki słabego/mocnego rozdzielania.

Twierdzenia o oddzielaniu będziemy dowodzić w przeciwnej kolejności niż są podane. Okazuje się bowiem, że łatwiej udowodnić twierdzenie mocne. Później w dowodzie twierdzenia słabego skorzystamy z mocnego oddzielania zbiorów wypukłych.

Dowód twierdzenia 3.2

Określmy funkcję d:U×VR wzorem dx,y=x-y. Z ograniczoności zbioru U wynika, że d jest funkcją koercywną; zbieżność do nieskończoności może się tylko odbywać po argumencie ze zbioru V. Na mocy tw. 1.2 funkcja d jako ciągła i koercywna określona na zbiorze domkniętym U×V osiąga swoje minimum w pewnym punkcie x0,y0U×V. Z faktu, że UV= wynika, że x0y0. Połóżmy a=y0-x0. Pokażemy, że jest to szukany wektor z tezy twierdzenia.

Udowodnimy, że aTyaTy0. Niech yV, yy0. Zdefiniujmy funkcję

gt=dx0,y0+ty-y02,tR.

Rozwijając dostajemy

gt=y0-x02+2ty0-x0Ty-y0+t2y-y0Ty-y0.

Funkcja ta jest różniczkowalna dla tR i g0gt dla t0,1 (na mocy wypukłości V i definicji y0). Zatem g00, czyli

y0-x0Ty-y00.

Nierówność ta jest równoważna aTyaTy0.

Podobnie pokazujemy, że aTxaTx0 dla xU. Do zakończenia dowodu wystarczy sprawdzić, że aTy0>aTx0. Ta nierówność jest równoważna a2>0, co zachodzi, gdyż x0y0.

Dowód twierdzenia 3.1

Rozważmy zbiór C=V-U=y-x:xU,yV. Zbiór ten jest wypukły i 0C. Równoważne tezie twierdzenia jest znalezienie wektora niezerowego aRn oddzielającego C od 0, tzn. takiego że aTx0 dla xC.

Zdefiniujmy zbiory

Ax=aRn:a=1,aTx0.

Wystarczy pokazać, że xCAx. Będziemy rozumować przez sprzeczność. Załóżmy więc, że xCAx=. Niech Bx=SAx, gdzie S jest sferą jednostkową S=aRn:a=1. Zbiory Bx, xC, są otwartymi podzbiorami zbioru zwartego S. Z założenia, że przecięcie ich dopełnień w S jest puste, wynika, że rodzina BxxC jest pokryciem otwartym S. Na mocy zwartości S istnieje podpokrycie skończone Bx1,,Bxk, czyli

Ax1Axk=.

Połóżmy

C=convx1,,xk=i=1kλixi:λ1,,λk0,i=1kλi=1.

Zbiór C jest wypukły i domknięty oraz CC. Stąd 0C i na mocy mocnego twierdzenia o oddzielaniu zastosowanego do C i 0 istnieje wektor aRn0, taki że

aTx>0,xC.

W szczególności, aTx1>0,,aTxk>0, czyli aaAxi, i=1,,k, co przeczy założeniu, że przecięcie i=1kAxi=.

3.2. Definicja funkcji wypukłej

Definicja 3.1

Funkcję f:WR, gdzie WRn wypukły, nazwiemy:

  • wypukłą, jeśli dla każdego x,yW i λ0,1 zachodzi

    fλx+1-λyλfx+1-λfy.
  • ściśle wypukłą, jeśli dla każdego x,yW, xy i λ0,1 zachodzi

    fλx+1-λy<λfx+1-λfy.

Funkcja f jest (ściśle) wklęsła, jeśli -f jest (ściśle) wypukła.

Okazuje się, że wystarczy rozważać λ=1/2 w definicji wypukłości. Zacytujemy najpierw silny wynik noszący nazwisko Sierpińskiego, a później łatwiejszy, który dowiedziemy:

Twierdzenie 3.3

Jeśli funkcja f:WR, gdzie WRn wypukły, jest mierzalna w sensie Lebesgue'a oraz spełnia

fx+y2fx+fy2,

to jest wypukła.

Dowód

Patrz dowód tw. Sierpińskiego w [7, str. 12].

My udowodnimy słabszy wynik; założymy mianowicie ciągłość f.

Twierdzenie 3.4

Jeśli funkcja f:WR, gdzie WRn wypukły, jest ciągła oraz spełnia

fx+y2fx+fy2,

to jest wypukła.

Dowód

Pokażemy najpierw, przez indukcję po k, że nierówność wypukłości zachodzi dla λ postaci p/2k, p=0,1,,2k. Własność ta jest spełniona dla k=1 z założenia twierdzenia. Przeprowadźmy teraz krok indukcyjny. Załóżmy, że nierówność jest prawdziwa dla k. Weźmy p,q>0 całkowite, o sumie p+q=2k+1. Załóżmy pq. Wówczas p2kq i możemy napisać:

z=p2k+1x+q2k+1y=12p2kx+q-2k2ky+y.

Mamy zatem

fz12fp2kx+q-2k2ky+12fy12p2kfx+12q-2k2kfy+12fy=p2k+1fx+q2k+1fy.

Pierwsza nierówność wynika z założenia twierdzenia, zaś druga – z założenia indukcyjnego. Dowód w przypadku pq jest symetryczny, ze zmienioną rolą x i y.

Zbiór punktów postaci p/2k, k=1,2,, jest gęsty w odcinku 0,1. Z ciągłości funkcji f otrzymujemy nierówność wypukłości dla dowolnego λ0,1.

Przykład 3.1
  • Funkcja afiniczna fx=aTx+b jest wypukła i wklęsła.

  • Norma w Rn jest funkcją wypukłą. Wystarczy skorzystać z nierówności trójkąta.

  • Odległość punktu od zbioru definiujmy następująco dx,W=infyWx-y. Odległość punktu od zbioru wypukłego jest funkcją wypukłą: fx=dx,W dla pewnego zbioru wypukłego WRn.

3.3. Własności funkcji wypukłych

W tym rozdziale zakładamy, iż funkcja f:WR jest określona na niepustym wypukłym podzbiorze WRn.

Definicja 3.2

Epigrafem funkcji f:WR nazywamy zbiór

epif=x,zW×R:zfx.
Definicja 3.3

Zbiorem poziomicowym funkcji f:WR nazywamy

Wαf=xW:fxα,αR.
Twierdzenie 3.5 (Twierdzenie o epigrafie)

Funkcja f jest wypukła wtedy i tylko wtedy, gdy jej epigraf epif jest wypukłym podzbiorem Rn+1.

Twierdzenie 3.6

Jeśli funkcja f jest wypukła, to zbiór poziomicowy Wαf jest wypukły dla dowolnego α.

Dowód powyższych twierdzeń pozostawiamy czytelnikowi.

Uwaga 3.2

Twierdzenie odwrotne do tw. 3.6 nie jest prawdziwe. Połóżmy W=Rn i weźmy dowolny niepusty wypukły zbiór ARn. Rozważmy funkcję

fx=0,xA,1,xA.

Każdy zbiór poziomicowy tej funkcji jest wypukły, zaś funkcja nie jest wypukła.

Okazuje się, że wypukłość gwarantuje ciągłość we wnętrzu intW. Rezultat ten nie może być rozszerzony na brzeg W.

Twierdzenie 3.7

Jeśli funkcja f jest wypukła, to jest również ciągła na intW.

Dowód powyższego twierdzenia wykracza poza ramy tego wykładu. Zainteresowany czytelnik może go znaleźć w monografii [10] w rozdziale IV.41.

Twierdzenie 3.8 (Twierdzenie o hiperpłaszczyźnie podpierającej)

Jeśli f jest wypukła, to w każdym punkcie x¯intW istnieje hiperpłaszczyzna podpierająca, tzn. istnieje ξRn takie że

fxfx¯+ξTx-x¯,xW.

Jeśli f jest ściśle wypukła, to

fx>fx¯+ξTx-x¯,xWx¯.

Jeśli f jest różniczkowalna w x¯, to w obu powyższych nierównościach możemy przyjąć ξ=Dfx¯T.

Dowód tw. 3.8

Na mocy twierdzenia 3.5, epigraf epif jest zbiorem wypukłym. Zastosujemy słabe twierdzenie o oddzielaniu do zbiorów U=epif i V=x¯,fx¯. Istnieje niezerowy wektor a=ξ,αRn×R, takie że

ξTx+αyξTx¯+αfx¯(3.1)

dla x,yepif. Nierówność ta musi być prawdziwa dla wszystkich yfx. Zatem α0. Okazuje się, że α0. Dowiedziemy tego przez sprzeczność: załóżmy α=0. Wówczas dla dowolnego xW mamy ξTx-x¯0. Korzystając z tego, że x¯ jest we wnętrzu W, wiemy, że x¯+εξW dla dostatecznie małego ε>0. Połóżmy x=x¯+εξ. Wtedy 0ξTx-x¯=εξTξ=εξ2, a zatem ξ=0. Przeczy to niezerowości wektora ξ,α. Wnioskujemy więc, że α<0.

Możemy założyć, że α=-1 w nierówności (3.1) (wystarczy podzielić obie strony przez α). Dla dowolnego xW dostajemy zatem

ξTx-fxξTx¯-fx¯,

co przepisujemy następująco

fxfx¯+ξTx-x¯.

Kończy to dowód pierwszej części twierdzenia.

Załóżmy teraz, że f jest różniczkowalna w x¯. Dla dowolnego xW, xx¯ i λ0,1, z wypukłości mamy

fx-fx¯=1-λfx¯+λfx-fx¯λ
f1-λx¯+λx-fx¯λ(3.2)
=fx¯+λx-x¯-fx¯λ.

Policzmy granicę, gdy λ dąży do zera:

fx-fx¯limλ0fx¯+λx-x¯-fx¯λ=Dfx¯x-x¯,

gdzie istnieje granicy i ostatnia równość wynika z różniczkowalności f w punkcie x¯.

Przypuśćmy, że f jest ściśle wypukła. Ustalmy x¯intW. Na mocy pierwszej części twierdzenia fxfx¯+ξTx-x¯ dla dowolnego xW. Przypuśćmy, że dla pewnego xW, xx¯, ta nierówność nie jest ścisła, tj. fx=fx¯+ξTx-x¯. Ze ścisłej wypukłości dostajemy

fx¯+x2<12fx+12fx¯=fx¯+12ξTx-x¯.(3.3)

Z drugiej strony, z istnienia płaszczyzny podpierającej w x¯ mamy

fx¯+x2fx¯+ξTx+x¯2-x¯=fx¯+ξTx-x¯2.

Dostajemy sprzeczność z nierównością (3.3). Pokazuje to, że dla funkcji ściśle wypukłej f musi być spełniona ścisła nierówność fx<fx¯+ξTx-x¯ jeśli tylko xx¯.

Prawdziwe jest twierdzenie odwrotne do twierdzenia 3.8 (patrz tw. 3.9).

Wniosek 3.2

Jeśli f wypukła i różniczkowalna w x¯intW, to w x¯ jest minimum globalne wtw, gdy Dfx¯=0.

Dowód

Implikacja w prawą stronę wynika z tw. 1.4. Aby dowieść implikacji przeciwnej, załóżmy Dfx¯=0 dla pewnego x¯=0. Na mocy tw. 3.8 dla dowolnego xW mamy

fxfx¯+Dfx¯x-x¯=fx¯,

co dowodzi, że w punkcie x¯ jest minimum globalne.

Poniżej wymieniamy pozostałe własności funkcji wypukłych. Ich dowody pozostawione są jako ćwiczenia.

  • Niech WRn, wypukły, zaś I dowolny zbiór. Jeśli funkcje fi:WR, iI, są wypukłe, to fx=supiIfix jest wypukła ze zbiorem wartości R.

  • Niech WRn, wypukły. Jeśli funkcje fi:WR, i=1,2,,m, są wypukłe i αi>0 dla i=1,2,,m, to funkcja f=i=1mαifi jest wypukła. Jeśli jedna z funkcji fi jest ściśle wypukła, to f jest również ściśle wypukła.

  • Niech WRn, ARm wypukłe zbiory. Jeśli funkcja h:W×AR jest wypukła i ograniczona z dołu, to

    fx=infaAhx,a,xW,

    jest wypukła.

  • Niech f:RnR wypukła. Jeśli h:RmRn afiniczna, to złożenie fh jest funkcją wypukłą.

  • Niech WRn wypukły. Jeśli f:WR jest funkcją wypukłą i g:RR jest wypukła i niemalejąca, to gf jest funkcją wypukłą. Jeśli dodatkowo g jest rosnąca, zaś f ściśle wypukła, to gf jest ściśle wypukła.

  • Niech WRn wypukły. Jeśli f:WR jest funkcją (ściśle) wklęsłą i f>0, to funkcja 1/f jest (ściśle) wypukła.

3.4. Charakteryzacje funkcji wypukłej

Twierdzenie 3.9

Niech WRn wypukły o niepustym wnętrzu. Jeśli w każdym punkcie x¯intW istnieje wektor ξRn, taki że

fxfx¯+ξTx-x¯,xW,

to funkcja f jest wypukła. Jeśli nierówność jest ostra dla xx¯, to f jest ściśle wypukła.

Dowód

Weźmy xintW, yW i λ0,1. Oznaczmy xλ=λx+1-λy. Chcemy wykazać, że fxλλfx+1-λfy. Na mocy Lematu 3.2 punkt xλ należy do wnętrza W. Stosując założenie do tego punktu dostajemy ξRn, takie że

fxfxλ+ξTx-xλ,fyfxλ+ξTy-xλ.(3.4)

Stąd

λfx+1-λfyfxλ+ξTλx-xλ+1-λy-xλ=fxλ,

gdyż wielkości w nawiasie kwadratowym zerują się. Kończy to dowód twierdzenia. Jeśli nierówność w założeniu jest ostra i xy, to nierówności (3.4) są ostre i dostajemy warunek ścisłej wypukłości.

Twierdzenie 3.10

Niech WRn niepusty, otwarty i wypukły, zaś f:WR dwukrotnie różniczkowalna. Wówczas:

  • I) f jest wypukła wtw, gdy hesjan D2fx jest nieujemnie określony dla każdego xW.

  • II) Jeśli hesjan D2fx jest dodatnio określony dla każdego xW, to f jest ściśle wypukła.

Analogiczna teza zachodzi w przypadku wklęsłości.

Dowód

Załóżmy najpierw, że hesjan jest nieujemnie określony dla każdego xW. Wówczas, na mocy wniosku 2.1, dla dowolnych x¯,xW mamy

fx=fx¯+Dfx¯x-x¯+12x-x¯TD2fx~x-x¯,

gdzie x~ jest punktem leżącym na odcinku łączącym x¯ z x. Założenie o nieujemnej określoności hesjanu pociąga nieujemność ostatniego składnika powyższej sumy. Stąd

fxfx¯+Dfx¯x-x¯.(3.5)

Ponieważ powyższa nierówność zachodzi dla dowolnych x¯,xW, to f jest wypukła na mocy twierdzenia 3.9.

Jeśli założymy, że hesjan jest dodatnio określony dla każdego punktu W, to nierówność (3.5) jest ostra i twierdzenie 3.9 implikuje ścisłą wypukłość f.

Przejdźmy teraz do dowodu implikacji przeciwnej. Załóżmy, że funkcja f jest wypukła. Ustalmy x¯W i hRn, h0. Z otwartości W wynika, że istnieje δ>0, dla której x¯+thW, t-δ,δ. Zdefiniujmy funkcję gt=fx¯+th, t-δ,δ. Jest to funkcja jednej zmiennej, dwukrotnie różniczkowalna oraz wypukła. Stosując twierdzenie 3.8 dostajemy

gtg0+g0t,t-δ,δ.

Na mocy twierdzenie Taylora z resztą w postaci Peano, tw. 1.9, mamy

gt=g0+g0t+12g′′0t2+ot2,t-δ,δ.

Powyższa nierówność i wzór Taylora dają następujące oszacowanie na drugą pochodną

12g′′0t2+ot20.

Dzielimy obie strony przez t2:

12g′′0+ot2t20.

W granicy przy t dążącym do zera, drugi składnik zanika i pozostaje g′′00. Co ta nierówność znaczy w terminach funkcji f? Liczymy:

gt=Dfx¯+thh,g′′t=hTD2fx¯+thh.

Stąd g′′0=hTD2fx¯h.

Powyższe rozumowanie możemy przeprowadzić dla dowolnego hRn. Wykazaliśmy więc nieujemną określoność D2fx¯.

3.5. Subróżniczka

Zajmiemy się teraz uogólnieniem pojęcia pochodnej na nieróżniczkowalne funkcje wypukłe. Niech WRn będzie zbiorem wypukłym, zaś f:WR funkcją wypukłą.

Definicja 3.4

Wektor ξRn nazywamy subgradientem funkcji f w punkcie x0W, jeśli

fxfx0+ξTx-x0,xW.

Zbiór wszystkich subgradientów f w punkcie x0 nazywamy subróżniczką i oznaczamy fx0.

Wniosek 3.3

Jeśli WRn jest zbiorem wypukłym o niepustym wnętrzu, to f:WR jest wypukła wtw, gdy w każdym punkcie zbioru intW istnieje subgradient:

fxxintW.
Dowód

Implikacja w prawą stronę wynika z twierdzenia 3.8, zaś implikacja w stronę lewą – z tw. 3.9.

Lemat 3.3

Niech WRn będzie zbiorem wypukłym, zaś f:WR funkcją wypukłą. Wówczas subróżniczka fx jest zbiorem wypukłym i domkniętym. Jeśli x jest wewnętrzym punktem W, xintW, to zbiór fx jest ograniczony.

Dowód

Dowód wypukłości i domkniętości pozostawiamy jako ćwiczenie (patrz ćw. 3.24). Ustalmy x¯intW. Wówczas istnieje ε>0, taki że kula domknięta Bx¯,ε jest zawarta w intW. Dla dowolnego ξfx¯

fxfx¯+ξTx-x¯,xW.

A zatem

supxBx¯,εfxfx¯+supxBx¯,εξTx-x¯.

Lewa strona jest niezależna od ξ oraz, z ciągłości f na intW, skończona. Supremum po prawej stronie jest przyjmowane dla x=x¯+εξ/ξ i wynosi εξ. Dostajemy zatem

εξsupxBx¯,εfx-fx¯,

co dowodzi ograniczoności zbioru fx¯.

Pokażemy teraz związek subróżniczki z pochodnymi kierunkowymi funkcji. Związek ten przyda nam się w dalszych dowodach.

Definicja 3.5

Pochodną kierunkową funkcji f w punkcie x¯ w kierunku d nazywamy granicę

fx¯;d=limλ0fx¯+λd-fx¯λ.

Z własności pochodnych jednostronnych dla skalarnych funkcji wypukłych wynikają następujące własności pochodnych kierunkowych:

Lemat 3.4

Niech WRn będzie zbiorem wypukłym otwartym, zaś f:WR funkcją wypukłą. Wówczas dla każdego dRn i xW

  • I) istnieje pochodna kierunkowa fx;d.

  • II) fx;d=infλ>0fx¯+λd-fx¯λ.

  • III) fx;d-fx;-d.

Dowód

Zdefiniujmy funkcję skalarną gt=fx+td dla t, takich że x+tdW. Z otwartości W wynika, że g jest określona na pewnym otoczeniu zera -δ,δ. Jest ona także wypukła. Wówczas iloraz różnicowy jest monotoniczny, tzn. dla -δ<t1<t2<δ mamy

gt1-g0t1gt2-g0t2.(3.6)

Z monotoniczności ilorazu różnicowego wynika, że istnieją pochodne lewostronna g0- i prawostronna g0+, g0-g0+ oraz

g0+=inft>0gt-g0t.

Wystarczy teraz zauważyć, że fx;d=g0+, zaś fx;-d=-g0-.

Pozostał nam jeszcze dowód monotoniczności ilorazu różnicowego. Weźmy najpierw 0<t1<t2<δ i zauważmy, że nierówność (3.6) jest równoważna

gt1λgt2+1-λg0,

gdzie λ=t1/t20,1 oraz λt2+1-λ0=t1. Prawdziwość ostatniej nierówności wynika z wypukłości funkcji g. Przypadek -δ<t1<t2<0 dowodzimy analogicznie. Dla -δ<t1<0<t2<δ nierówność (3.6) jest równoważna

g011+λgt1+λ1+λgt2,λ=-t1t2,

która wynika z wypukłości g, gdyż 1/1+λ0,1 oraz

11+λt1+λ1+λt2=0.

Pochodne kierunkowe pozwalają na nową charakteryzację subróżniczki.

Lemat 3.5

Niech WRn będzie zbiorem wypukłym otwartym, zaś f:WR funkcją wypukłą. Prawdziwa jest następująca równoważność: ξfx¯ wtw, gdy

fx¯;dξTd,dRn.
Dowód

Ustalmy x¯W i ξfx¯. Wówczas dla λ>0 i dRn (oczywiście takich, że x¯+λdW) mamy

fx¯+λdfx¯+λξTd.

Zatem

fx¯+λd-fx¯λξTd,

co implikuje fx¯;dξTd.

Weźmy teraz wektor ξRn spełniający warunek fx¯;dξTd dla każdego dRn. Na mocy lematu 3.4(II) dla λ>0 mamy

fx¯;dfx¯+λd-fx¯λ.

A zatem

fx¯+λdfx¯+ξTλd.

Z dowolności λ i d wynika, iż ξ jest subgradientem.

Poniższe twierdzenie precyzuje związek pomiędzy subróżniczką i pochodną kierunkową funkcji. Zwróć uwagę na wykorzystanie twierdzenia o oddzielaniu w dowodzie. Metoda polegająca na sprytnym dobraniu rozłącznych zbiorów wypukłych, które można rozdzielić hiperpowierzchnią, będzie wielokrotnie wykorzystywana w dowodzeniu twierdzeń dotyczących funkcji wypukłych.

Twierdzenie 3.11

Niech f:WR będzie funkcją wypukłą zadaną na wypukłym otwartym zbiorze WRn. Dla dowolnego x¯W i dRn zachodzi

fx¯;d=maxξfx¯ξTd.

Ponadto, funkcja f jest różniczkowalna w x¯ wtw, gdy subróżniczka fx¯ składa się z jednego subgradientu. Tym subgradientem jest wówczas Dfx¯T.

Dowód

Z lematu 3.5 wynika, że fx¯;dξTd dla ξfx¯. Stąd

fx¯;dmaxξfx¯ξTd.

Udowodnienie przeciwnej nierówności wymaga skorzystania z twierdzenia o oddzielaniu. Zdefiniujmy dwa zbiory:

C1=x,zW×R:z>fx,
C2=x,zW×R:x=x¯+λd,z=fx¯+λfx¯;d,λ0.

Zauważmy, że C1 różni się od epigrafu f tylko brzegiem x,zW×R:z=fx. Możemy zatem zastosować podobne rozumowanie jak w dowodzie tw. 3.5, aby wykazać, że C1 jest zbiorem wypukłym. Zbiór C2 jest odcinkiem o początku w punkcie x¯,fx¯ i o kierunku d,fx¯;d, więc jest wypukły. Można zauważyć, że jest on wykresem liniowego przybliżenia funkcji f wokół punktu x¯ wzdłuż odcinka x¯+λd:λ0W.

Na mocy lematu 3.4(II) mamy fx;dfx¯+λd-fx¯λ, czyli

fx¯+λdfx¯+λfx;d.

Wniskujemy stąd, że zbiory C1 i C2 są rozłączne. Stosujemy słabe twierdzenie o oddzialniu, tw. 3.1: istnieje niezerowy wektor μ,γRn×R, taki że

μTx+γzμTx¯+λd+γfx¯+λfx¯;d,x,zC1,λ0,L,(3.7)

gdzie L=supλ0:x¯+λdW. Zauważmy, że γ nie może być ujemna, gdyż wtedy lewa strona mogłaby być dowolnie mała (z może być dowolnie duże). Nie może także być γ=0, gdyż wówczas dla każdego xW musiałoby zachodzić μTx-x¯λμTd. Jest to możliwe tylko, gdy μ=0 (korzystamy tutaj z faktu, że W jest otwarty). A to przeczy niezerowości wektora μ,γ. Dowiedliśmy zatem, że γ>0. Dzieląc obie strony nierówności (3.7) przez γ możemy założyć, że γ=1, czyli

μTx+zμTx¯+λd+fx¯+λfx¯;d,x,zC1,λ0,L.

Zbiegając z z do fx otrzymujemy

μTx+fxμTx¯+λd+fx¯+λfx¯;d,xW,λ0,L.(3.8)

Kładąc λ=0 dostajemy

μTx-x¯+fxfx¯,

co po przekształeceniu daje

fxfx¯-μTx-x¯.

A zatem -μfx¯. Biorąc w nierówności (3.8) λ>0 i x=x¯ dostajemy

-μTλdλfx¯;d,

czyli

supξfx¯ξTdfx¯;d.

To kończy dowód pierwszej części twierdzenia.

Dowód drugiej części twierdzenia opiera się na dwóch prostych równoważnościach:

  1. Funkcja f jest różniczkowalna w punkcie x¯ wtw, gdy istnieje wektor αRn, taki że fx¯;d=αTd dla każdego dRn.

  2. Odwzorowanie Rndsupξfx¯ξTd jest liniowe wtw, gdy subróżniczka fx¯ jest jednoelementowa.

Równoważność pierwsza wynika wprost z definicji pochodnej (patrz roz. 2). Jeśli f jest różniczowalna w x¯, jedynym wektorem spełniającym fx¯;d=αTd jest α=Dfx¯T.

Przypuśćmy więc, że funkcja f jest różniczkowalna w x¯. Wówczas fx¯;d=Dfx¯d, czyli pochodna kierunkowa jest funkcją liniową d. Na mocy drugiej równoważności subróżniczka jest jednoelementowa. Łatwo już zauważyć, że fx¯=Dfx¯T. Do dowodu w przeciwną stronę załóżmy, że subróżniczka fx¯ składa się z jednego wektora αRn. Wówczas fx¯;d=αTd. Na mocy pierwszej równoważności funkcja f jest różniczkowalna w x¯.

Twierdzenie 3.11 wykorzystamy kilkukrotnie w dowodzie poniższego twierdzenia, które będzie użyteczne w znajdowaniu subróżniczek.

Twierdzenie 3.12

Niech WRn będzie zbiorem wypukłym otwartym, zaś f1,f2:WR funkcjami wypukłymi.

  • I) Niech f=f1+f2. Wówczas f1x+f2x=fx, gdzie

    f1x+f2x=ξ1+ξ2:ξ1f1x,ξ2f2x.
  • II) Niech f=maxf1,f2. Wówczas

    fx=f1x,f1x>f2x,convf1xf2x,f1x=f2x,f2x,f1x<f2x,

    gdzie convf1xf2x jest zbiorem kombinacji wypukłych elementów zbiorów f1x i f2x.

Dowód

Zaczniemy od dowodu (I). Ustalmy x¯W. Niech ξ1f1x¯ i ξ2f2x¯. Wówczas dla xW zachodzi

f1xf1x¯+ξ1Tx-x¯,
f2xf2x¯+ξ2Tx-x¯.

Dodając te nierówności stronami otrzymujemy

fxfx¯+ξ1+ξ2Tx-x¯,

czyli ξ1+ξ2fx¯. Dowiedliśmy zawierania f1x¯+f2x¯fx¯. Przypuśćmy, że inkluzja ta jest ostra, tzn. istnieje ξfx¯, taki że ξf1x¯+f2x¯. Na mocy lematu 3.3 subróżniczki f1x¯ i f2x¯ są zwartymi zbiorami wypukłymi. A zatem ich suma algebraiczna jest również zbiorem zwartym i wypukłym (patrz ćw. 3.25). Stosujemy silne twierdzenie o oddzielaniu do zbiorów ξ oraz f1x¯+f2x¯. Dostajemy μRn i stałą bR, takie że

μTξ1+μTξ2<b<μTξ,ξ1f1x¯,ξ2f2x¯.

Bierzemy maksimum po ξ1,ξ2 po lewej stronie i stosujemy twierdzenie 3.11:

f1x¯;μ+f2x¯;μ<ξTμfx¯;μ.

Z drugiej strony, z własności pochodnych kierunkowych mamy

f1x¯;μ+f2x¯;μ=fx¯;μ.

Doprowadziliśmy do sprzeczności: ξ o żądanych własnościach nie może istnieć. Kończy to dowód (I).

Dowód (II). Postać subróżniczki f na zbiorach xW:f1x>f2x i xW:f1x<f2x jest oczywista. Jedynie przypadek xW:f1x=f2x wymaga dokładnego dowodu. Ustalmy x¯W, dla którego f1x¯=f2x¯. Oznaczmy A=convf1x¯f2x¯. Dla i=1,2 oraz xW mamy

fx-fx¯fix-fx¯=fix-fix¯ξiTx-x¯,ξifix¯.

Stąd dostajemy f1x¯f1x¯fx¯. Z wypukłości subróżniczki (patrz lemat 3.3) wynika, że Afx¯. Załóżmy teraz, że istnieje ξfx¯A. Zbiór A jest wypukły i zwarty. Stosujemy silne twierdzenie o oddzielaniu do zbiorów A i ξ. Dostajemy μRn i stałą bR, takie że

μTξ~<b<μTξ,ξ~A.

W szczególności μTξi<b dla ξifix¯, i=1,2, czyli, na mocy tw. 3.11,

maxf1x¯;μ,f2x¯;μb.

Podobnie, b<ξTμfx¯;μ. Podsumowując:

maxf1x¯;μ,f2x¯;μ<fx¯;μ.(3.9)

Z drugiej strony, definicja pochodnej kierunkowej daje nam następującą równość (przypomnijmy, że fx¯=f1x¯=f2x¯):

fx¯+λd-fx¯λ=maxf1x¯+λd-fx¯λ,f2x¯+λd-fx¯λ,λ>0.

Przechodząc z λ do zera dostajemy

fx¯;d=maxf1x¯;d,f2x¯;d.

Biorąc d=μ dostajemy sprzeczność z (3.9), a więc nie może istnieć ξfx¯A.

Twierdzenie 3.13

Niech WRn będzie zbiorem wypukłym otwartym, f:WR funkcją wypukłą, zaś A będzie macierzą n×m. Zdefiniujmy W~=xRm:AxW. Wówczas W~ jest zbiorem wypukłym otwartym oraz funkcja F:W~R zadana wzorem Fx=fAx ma w punkcie xW~ subróżniczkę zadaną wzorem

Fx=ATfAx.
Dowód

Dowód będzie przebiegał podobnie jak dowód poprzedniego twierdzenia. Ustalmy x¯W~. Weźmy ξfAx¯. Wówczas

fAxfAx¯+ξTAx-Ax¯=fAx¯+ATξTx-x¯,

czyli ATξFx¯. Stąd mamy zawieranie ATfAx¯Fx¯. Równości tych dwóch zbiorów dowiedziemy przez sprzeczność. Załóżmy, że istnieje ξFx¯ATfAx¯. Zbiór ATfAx¯ jest wypukły i domknięty, jako liniowy obraz zbioru wypukłego i domkniętego. Zastosujemy silne twierdzenie o oddzielaniu, aby oddzielić go od zbioru jednoelementowego ξ. Dostajemy μRm oraz bR, takie że

μTATξ~<b<μTξ,ξ~fAx¯.

Biorąc supremum po ξ~fAx¯ po lewej stronie i stosując tw. 3.11 otrzymujemy fAx¯;Aμb. Prawą stronę możemy również oszacować przez pochodną kierunkową: μTξFx¯;μ. Podsumowując:

fAx¯;Aμ<Fx¯;μ.

Jednak z własności pochodnych kierunkowych natychmiast wnioskujemy, że Fx¯;d=fAx¯;Ad dla dowolnego dRm. Mamy zatem sprzeczność. Dowodzi to, iż zbiór Fx¯ATfAx¯ jest pusty.

3.6. Zadania

Ćwiczenie 3.1

Niech U,VRn będą zbiorami wypukłymi. Wykaż, że

  1. UV jest zbiorem wypukłym.

  2. UV może nie być zbiorem wypukłym.

Ćwiczenie 3.2

Czy zbiór x1,x2,x3R3:x16+x12+x2x3+x321 jest zbiorem wypukłym?

Ćwiczenie 3.3

Udowodnij lemat 3.1.

Ćwiczenie 3.4

Niech

W1=x1,x2:x2e-x1,W2=x1,x2:x2-e-x1.

Wykaż, że zbiory W1,W2 są wypukłe i rozłączne. Znajdź prostą (hiperpłaszczyznę) je dzielącą. Czy istnieje hiperpłaszczyzna dzieląca ściśle te zbiory (w sensie mocnego twierdzenia o oddzielaniu)?

Ćwiczenie 3.5

Niech W1,W2Rn będą zbiorami wypukłymi. Udowodnij, że infx-y:xW1,yW2>0 wtw, gdy istnieje hiperpłaszczyzna ściśle (w sensie mocnego tw. o oddzielaniu) oddzielająca te zbiory.

Ćwiczenie 3.6

Niech XRn będzie dowolnym zbiorem. Zdefiniujmy zbiór X~ jako zbiór takich punktów xRn, dla których istnieje liczba naturalna mN, zależna od punktu, wektor λ1,,λm0,1m o tej własności, że i=1mλi=1, oraz x1,,xmX i

x=i=1mλixi.

Udowodnij, że

  1. X~ jest zbiorem wypukłym.

  2. X~ jest najmniejszym zbiorem wypukłym zawierającym X.

  3. W definicji zbioru X~ można założyć, że mn+1, gdzie n jest wymiarem przestrzeni (Tw. Caratheodory'ego).

Zbiór X~ nazywa się otoczką wypukłą zbioru X i oznaczane jest convX.

Ćwiczenie 3.7

Udowodnij twierdzenie 3.5.

Ćwiczenie 3.8

Udowodnij twierdzenie 3.6.

Ćwiczenie 3.9

Znajdź przykład zbioru WRn i funkcji wypukłej f:WR, która nie jest ciągła na całym zbiorze W.

Wskazówka: 

Twierdzenie 3.7 pomoże w wyborze zbioru W.

Ćwiczenie 3.10

Niech WRn będzie zbiorem wypukłym i otwartym, zaś f:WR funkcją różniczkowalną. Udowodnij następującą równoważność: f jest wypukła wtw, gdy

Dfy-Dfxy-x0,x,yW.
Ćwiczenie 3.11

Udowodnij: Niech WRn, wypukły, zaś I dowolny zbiór. Jeśli funkcje fi:WR, iI, są wypukłe, to fx=supiIfix jest wypukła ze zbiorem wartości R.

Ćwiczenie 3.12

Udowodnij: Niech WRn, wypukły. Jeśli funkcje fi:WR, i=1,2,,m, są wypukłe i αi>0 dla i=1,2,,m, to funkcja f=i=1mαifi jest wypukła. Jeśli jedna z funkcji fi jest ściśle wypukła, to f jest również ściśle wypukła.

Ćwiczenie 3.13

Udowodnij: Niech WRn, wypukły, zaś ARm wypukły, zwarty. Jeśli funkcja h:W×AR jest wypukła i ciągła, to

fx=infaAhx,a,xW,

jest wypukła.

Wskazówka: 

Korzystając ze zwartości A i ciągłości h, dla każdego x istnieje axA realizujący infimum. Dowodzimy teraz z definicji funkcji wypukłej.

Ćwiczenie 3.14

Udowodnij uogólnienie twierdzenia z ćwiczenia 3.13: opuścimy zwartość A i ciągłość h. Niech WRn, ARm wypukłe zbiory. Jeśli funkcja h:W×AR jest wypukła i ograniczona z dołu, to

fx=infaAhx,a,xW,

jest wypukła.

Ćwiczenie 3.15

Skonstruuj przykład, który pokaże, że założenie o ograniczoności z dołu nie może być pominięte w twierdzeniu z ćw. 3.14.

Ćwiczenie 3.16

Udowodnij, że funkcja odległości od zbioru wypukłego jest funkcją wypukłą. Podaj przykład wskazujący na konieczność wypukłości zbioru.

Ćwiczenie 3.17

Udowodnij: Niech f:RnR wypukła. Jeśli h:RmRn afiniczna, to złożenie fh jest funkcją wypukłą.

Ćwiczenie 3.18

Udowodnij: Niech WRn, wypukły. Jeśli f:WR jest funkcją wypukłą i g:RR jest wypukła i niemalejąca, to gf jest funkcją wypukłą. Kiedy gf jest ściśle wypukła?

Stwórz analog powyższego twierdzenia dla funkcji wklęsłych.

Ćwiczenie 3.19

Udowodnij: Niech WRn wypukły. Jeśli f:WR jest funkcją (ściśle) wklęsłą i f>0, to funkcja 1/f jest (ściśle) wypukła.

Ćwiczenie 3.20

Czy jeśli f:RnR i g:RR wypukłe, to gf:RnR jest wypukła?

Ćwiczenie 3.21

Udowodnij, że funkcja fx1,x2=ex12-x2 jest wypukła.

Ćwiczenie 3.22

Niech WRn i funkcja f:WR klasy C2. Załóżmy ponadto, że D2fx0 dla każdego xW (tzn. Hesjan jest nieujemnie określony). Rozstrzygnij, który z następujących warunków jest wystarczający, by zdanie

Dfx¯=0x¯ jest globalne minimum

było prawdziwe:

  • W=Rn,

  • W jest wypukły i otwarty,

  • W jest wypukły,

  • W jest otwarty.

Ćwiczenie 3.23

Znajdź przykład zbioru XRn oraz funkcji f:XR klasy C2, takiej że

  1. D2fx0 (tzn. hesjan jest nieujemnie określony) dla każdego xX,

  2. istnieje punkt x¯X, w którym jest minimum lokalne funkcji f, ale nie jest ono globalne.

Ćwiczenie 3.24

Niech WRn będzie zbiorem wypukłym, zaś f:WR funkcją wypukłą. Udowodnij, że fx jest zbiorem wypukłym i domkniętym.

Ćwiczenie 3.25

Niech A,BRn będą zbiorami wypukłymi zwartymi. Udowodnij, że suma algebraiczna tych zbiorów

A+B=a+b:aA,bB

jest zbiorem zwartym i wypukłym.

Ćwiczenie 3.26

Niech WRn wypukły otwarty i f:WR wypukła. Wykaż, że ξRn jest subgradientem f w x¯W wtw, gdy odwzorowanie xξTx-fx osiąga swoje maksimum w x¯.

Ćwiczenie 3.27

Znajdź subróżniczkę funkcji Rnxx.

Ćwiczenie 3.28

Niech A będzie macierzą n×n symetryczną i nieujemnie określoną. Udowodnij, że fx=xTAx, xRn, jest funkcją wypukłą i znajdź jej subróżniczkę.

Ćwiczenie 3.29

Wykaż, że dla skalarnej funkcji wypukłej f:a,bR mamy

fx=fx-,fx+,

gdzie fx± oznaczają prawo- i lewo-stronne pochodne w punkcie xa,b.

Ćwiczenie 3.30

Niech f:RnR wypukła, x,yRn ustalone wektory. Zdefiniujmy gt=ftx+1-ty, tR. Wykaż, że g jest wypukła oraz

gt=x-yTftx+1-ty.
Ćwiczenie 3.31

Wykaż, że funkcja fx=max-2x+5,3x2-1 jest wypukła na R i znajdź jej subróżniczkę.

Ćwiczenie 3.32

Niech fWx=infyWx-y, xRn, gdzie WRn jest zbiorem wypukłym. Znajdź subróżniczkę w następujących przypadkach:

  • W=x¯ dla pewnego x¯Rn,

  • W=conv0,0,1,0R2, tzn. W jest odcinkiem,

  • W=conv0,0,1,0,0,1,1,1R2, tzn. W jest kwadratem.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.