Zagadnienia

7. Funkcje quasi-wypukłe i warunki dostateczne

Mogliśmy już zaobserwować na kilku przykładach, że wypukłość znacznie ułatwia rozwiązywanie problemów optymalizacyjnych. W rozdziale 3 zauważyliśmy, że warunkiem koniecznym i dostatecznym minimum funkcji wypukłej jest zerowanie się pochodnej. Później wykazaliśmy, że identyczny warunek zachodzi dla większej rodziny funkcji: funkcji pseudowypukłych. W rozdziale 4 zajmowaliśmy się maksymalizacją funkcji wypukłej na zbiorze wypukłym i zwartym. Udowodniliśmy, że maksimum jest przyjmowane w jednym z punktów ekstremalnych tego zbioru. W tym rozdziale rozszerzymy rodzinę funkcji, dla których jest to prawdą; wprowadzimy własność quasi-wypukłości.

Patrząc na powyższą listę można się domyślać, że wypukłość może również pomagać przy rozwiązywaniu zadań z ograniczeniami nierównościowymi. Jeśli założymy, że funkcje gi, opisujące ograniczenia nierównościowe, są wypukłe lub, ogólniej, quasi-wypukłe oraz funkcja f jest pseudowypukła, to spełnienie warunku pierwszego rzędu w pewnym punkcie x¯ jest wystarczające, by stwierdzić jego optymalność. Dowód powyższego faktu przytoczymy pod koniec tego rozdziału.

7.1. Quasi-wypukłość

W tym podrozdziale rozszerzymy rodzinę funkcji, dla których maksimum znajduje się w punktach ekstremalnych dziedziny.

Definicja 7.1

Niech WRn będzie zbiorem wypukłym, zaś f:WR.

Funkcję f nazywamy quasi-wypukłą, jeśli dla dowolnych x,yW i λ0,1 mamy

fλx+1-λymaxfx,fy.

Funkcję f nazywamy quasi-wklęsłą, jeśli funkcja -f jest quasi-wypukła, tzn. dla dowolnych x,yW i λ0,1 zachodzi

fλx+1-λyminfx,fy.

Funkcję f nazywamy quasi-liniową, jeśli jest ona jednocześnie quasi-wypukła i quasi-wklęsła.

Rys. 7.1. Przykłady funkcji quasi-wypukłych i quasi-wklęsłych.
Rys. 7.2. Przykłady funkcji quasi-liniowych.

Na rys. 7.1 pokazane są przykłady jednowymiarowych funkcji quasi-wypukłych i quasi-wklęsłych. Zwróćmy uwagę na to, że funkcje takie nie muszą być ciągłe, nie mówiąc już o różniczkowalności. Ciekawym jest również uogólnienie rodziny funkcji afinicznych do funkcji quasi-liniowych, patrz rys. 7.2.

Przykład 7.1

Funkcja afiniczna jest quasi-liniowa. Rzeczywiście, niech fx=aTx+b dla aRn i bR. Wówczas dla dowolnych x,yW i λ0,1 mamy

fλx+1-λy=λfx+1-λfy.

Prawa strona jest oczywiście nie mniejsza od minimum z fx i fy i nie większa od maksimum tych liczb, czyli f jest zarówno quasi-wypukła jak i quasi-wklęsła.

Przypomnijmy, że zbiorem poziomicowym funkcji f:WR nazywamy zbiór

Wαf=xW:fxα,αR.
Twierdzenie 7.1

Niech f:WR, gdzie WRn wypukły. Wówczas funkcja f jest quasi-wypukła wtw, gdy zbiór poziomicowy Wαf jest wypukły dla każdego αR.

Dowód

Załóżmy, że funkcja f jest quasi-wypukła i ustalmy αR. Niech x,yWαf. Wówczas fxα i fyα. Dla dowolnego λ0,1 dostajemy

fλx+1-λymaxfx,fyα.

Wnioskujemy stąd, że λx+1-λyWαf, czyli Wαf jest zbiorem wypukłym.

Załóżmy teraz, że Wαf jest wypukły dla każdego αR. Ustalmy x,yW oraz λ0,1. Na mocy założenia zbiór Wαf jest wypukły dla α=maxfx,fy. Wynika stąd, że λx+1-λyWαf, czyli

fλx+1-λyα=maxfx,fy.
Uwaga 7.1

Analogiczne twierdzenie dla funkcji wypukłej, tw. 3.5, brzmiało: funkcja f jest wypukła wtw, gdy jej epigraf jest zbiorem wypukłym.

Wniosek 7.1

Funkcja wypukła jest quasi-wypukła.

Dowód

Wynika to wprost z twierdzeń 3.6 i 7.1.

Twierdzenie przeciwne nie jest prawdziwe. Poniżej podajemy przykład funkcji quasi-wypukłej, która nie jest wypukła.

Przykład 7.2

Funkcja fx=-ex2, dla x0, jest quasi-wypukła choć jest ściśle wklęsła. Dla α-1 zbiór Wαf=0,, zaś dla α<-1 mamy Wαf=log-α,. Wszystkie te zbiory są wypukłe, więc na mocy twierdzenia 7.1 funkcja f jest quasi-wypukła. W podobny sposób możemy także pokazać, że funkcja f jest quasi-wklęsła, a zatem quasi-liniowa.

Przykład 7.3

Funkcja fx=-ex, xR, jest ściśle wklęsła a zarazem quasi-liniowa (czyli, między innymi, quasi-wypukła).

Przykład 7.4

Funkcja fx=x2 jest quasi-wypukła, lecz nie jest quasi-wklęsła. Quasi-wypukłość wynika z wypukłości f. Quasi-wklęsłość badamy rozpatrując zbiory poziomicowe funkcji -f. Dla α<0 mamy Wα-f=-,--α-α,. Nie jest to zbiór wypukły, czyli funkcja -f nie jest quasi-wypukła.

Dowód poniższego lematu pozostawiamy jako zadanie.

Lemat 7.1

Funkcja f:WR, WRn wypukły, jest quasi-liniowa wtw, gdy jej obcięcie do dowolnego odcinka jest funkcją monotoniczną.

Na mocy tego lematu możemy od razu zauważyć, że funkcja z przykładu 7.2 jest quasi-liniowa.

Okazuje się, że istnieją funkcje quasi-wypukłe jednej zmiennej, które nie są ani wypukłe ani monotoniczne.

Przykład 7.5

Funkcja fx=e-x2 jest quasi-wypukła. Mamy następujące zbiory poziomicowe w zależności od α:

Wαf=,α0,
Wαf=--log-α,-log-α,α0,1,
Wαf=R,α>1.

Wszystkie te zbiory są wypukłe, czyli na mocy tw. 7.1 funkcja f jest quasi-wypukła.

Na koniec podamy przykład funkcji quasi-wypukłej wielu zmiennych, która nie jest wypukła.

Przykład 7.6

Funkcja f:0,2R zadana wzorem fx1,x2=-x1x2 jest quasi-wypukła. Jej zbiory poziomicowe dla α0 są trywialne: Wαf=0,2, zaś dla α<0 mają formę przedstawioną na rysunku 7.3. Funkcja f nie jest ani wypukła ani wklęsła, gdyż jej hesjan ma wartości własne -1 i 1.

Rys. 7.3. Zbiór poziomicowy dla funkcji z przykładu 7.6.
Przykład 7.7

Niech a,cRn i b,dR. Połóżmy D=xRn:cTx+d>0. Wówczas funkcja wymierna f:DR

fx=aTx+bcTx+d

jest quasi-liniowa. Dowód pozostawiamy jako ćwiczenie.

Zbadamy teraz własności różniczkowalnych funkcji quasi-wypukłych.

Twierdzenie 7.2

Niech f:WR dla wypukłego zbioru WRn.

  • I) Jeśli funkcja f jest quasi-wypukła i różniczkowalna w yW, to

    xWfxfyDfyx-y0.
  • II) Załóżmy, że funkcja f jest różniczkowalna w każdym punkcie W. Wówczas f jest quasi-wypukła wtw, gdy zachodzi następujący warunek:

    x,yWfxfyDfyx-y0.
Uwaga 7.2
  1. Implikacja fxfyDfxx-y0 ma równoważną postać:

    Dfyx-y>0fx>fy.
  2. Jeśli funkcja f jest quasi-liniowa i fx=fy, to Dfyx-y=0.

Dowód tw. 7.2

(I): Ustalmy x,yW, dla których zachodzi warunek fxfy. Dla każdego λ0,1 mamy

fy+λx-y=fλx+1-λymaxfx,fy=fy.

Wynika stąd, że

fy+λx-y-fyλ0.

Z definicji pochodnej kierunkowej dostajemy

Dfyx-y=limλ0fy+λx-y-fyλ0.

Dowód (II) pozostawiamy jako niełatwe ćwiczenie.

Wiemy już, że funkcja wypukła jest quasi-wypukła. Okazuje się, że również funkcja pseudowypukła jest quasi-wypukła.

Twierdzenie 7.3

Jeśli f:WR określona na zbiorze wypukłym WRn jest pseudowypukła, to f jest quasi-wypukła.

Dowód

Zakładając, że funkcja f nie jest quasi-wypukła doprowadzimy do sprzeczności z pseudowypukłością. Weźmy więc punkty x,yW oraz λ0,1 spełniające

fλx+1-λy>maxfx,fy.

Oznaczmy z=λx+1-λy. Na mocy pseudowypukłości (wykorzystujemy tu warunek pseudowypukłości zapisany w uwadze 4.3) dostajemy:

fx<fzDfzx-z<0,
fy<fzDfzy-z<0.

Wektory x-z i y-z mają ten sam kierunek lecz przeciwne zwroty. Pochodna f w punkcie z nie może być ujemna w obu kierunkach. Sprzeczność.

Twierdzenie odwrotne nie jest prawdziwe. Możemy jednak podać warunek dostateczny, przy którym funkcja quasi-wypukła jest pseudowypukła.

Twierdzenie 7.4

Niech f:WR określona na zbiorze wypukłym otwartym WRn będzie quasi-wypukła i ciągła. Jeśli f jest różniczkowalna w x¯W oraz Dfx¯0T, to f jest pseudowypukła w x¯.

Dowód

Musimy pokazać, że dla każdego yW warunek Dfx¯y-x¯0 pociąga fyfx¯. Oznaczmy przez A przestrzeń afiniczną prostopadłą do Dfx¯ i przechodzącą przez x¯:

A=xRn:Dfx¯x-x¯=0.

Z warunku, że Dfx¯0T wynika, że przestrzeń A ma wymiar n-1, czyli jest właściwą hiperpłaszczyzną w Rn.

Zauważmy najpierw, że jeśli yWA i Dfx¯y-x¯0, to pochodna kierunkowa jest ściśle dodatnia: Dfx¯y-x¯>0. Na mocy uwagi 7.2 wnioskujemy, że fy>fx¯, czyli to, co mieliśmy wykazać. Ustalmy teraz punkt yWA. Z otwartości W i z tego, że A jest hiperpłaszczyzną wynika, że istnieje ciąg punktów ynWA zmierzający do y i taki że Dfx¯yn>0. Zatem fyn>fx¯. Korzystając z ciągłości funkcji f dostajemy fyfx¯.

7.2. Maksymalizacja funkcji quasi-wypukłej

Jak zostało zasygnalizowane wcześniej, funkcja quasi-wypukła zachowuje się podobnie jak funkcja wypukła przy maksymalizacji na zbiorze wypukłym zwartym. Dla pełności przytoczymy dowód, który jest prawie identyczny jak dowód twierdzenia 4.5.

Twierdzenie 7.5

Niech f:WR quasi-wypukła, ciągła, określona na wypukłym i zwartym zbiorze WRn. Wówczas punkt ekstremalny zbioru W jest jednym z rozwiązań globalnych problemu

fxmax,xW.
Dowód

Funkcja ciągła osiąga swoje kresy na zbiorze zwartym. Powyższy problem maksymalizacyjny ma zatem rozwiązanie x¯W. Na mocy tw. 4.4 punkt x¯ jest kombinacją wypukłą skończonej liczby punktów ekstremalnych, x1,,xm, zbioru W, tzn.

x¯=a1x1+a2x2++amxm

dla liczb a1,,am>0 takich że a1++am=1. Z quasi-wypukłości f dostajemy

fx¯maxfx1,,fxm.

Ponieważ w punkcie x¯ jest maksimum f na zbiorze W, to dla któregoś z punktów xi zachodzi równość fxi=fx¯.

7.3. Warunki dostateczne

Zajmiemy się problemem optymalizacyjnym, w którym występują zarówno ograniczenia nierównościowe jak i równościowe:

fxmin,gix0,i=1,,m,hjx=0,j=1,,l,xX,(7.1)

gdzie XRn jest zbiorem otwartym i f,g1,,gm,h1,,hl:XR. A zatem zbiór punktów dopuszczalnych zadany jest następująco:

W=xX:g1x0,,gmx0,h1x=0,,hlx=0.(7.2)

Funkcje gi nazywane są ograniczeniami nierównościowymi, funkcje hjograniczeniami równościowymi, zaś cały problem (7.1) nazywa się zadaniem optymalizacyjnym z ograniczeniami mieszanymi.

Podamy teraz warunki dostateczne, by punkt spełniający warunki pierwszego rzędu był rozwiązaniem globalnym.

Twierdzenie 7.6

Rozważmy problem optymalizacyjny w kanonicznej formie (7.1) i punkt x¯W. Załóżmy, że

  • funkcje gi, iIx¯ są ciągłe w x¯, funkcje gi, iIx¯ są różniczkowalne w x¯ i quasi-wypukłe,

  • funkcje hj, j=1,,m, są quasi-liniowe i różniczkowalne w x¯,

  • funkcja f jest pseudowypukła w x¯.

Jeśli istnieją stałe μ0,m oraz λRl spełniające warunek pierwszego rzędu:

Dfx¯+iIx¯μiDgix¯+j=1lλjDhjx¯=0T,μigix¯=0,i=1,,m,(7.3)

to punkt x¯ jest rozwiązaniem globalnym.

Dowód

Ustalmy dowolny punkt dopuszczalny xW i pomnóżmy obie strony pierwszego równania w warunku (7.3) przez x-x¯:

Dfx¯x-x¯+iIx¯μiDgix¯x-x¯+j=1lλjDhjx¯x-x¯=0.

Na mocy tw. 7.2 mamy Dhjx¯x-x¯=0 dla każdego j, bo hjx=hjx¯=0. To samo twierdzenie implikuje, że Dgix¯x-x¯0 dla iIx¯, ponieważ 0=gix¯gix. Korzystając z tych obserwacji wnioskujemy z powyższego równania, że

Dfx¯x-x¯0.

Z definicji funkcji pseudowypukłej, fxfx¯. Punkt x wybraliśmy dowolnie spośród punktów dopuszczalnych, a zatem x¯ jest rozwiązaniem globalnym.

Uwaga 7.3

Jeśli założenia twierdzenia 7.6 są spełnione lokalnie, na pewnym otoczeniu x¯, to x¯ jest rozwiązaniem lokalnym.

Uwaga 7.4

Na mocy twierdzenia 7.4 zamiast zakładać pseudowypukłość funkcji f w punkcie x¯ możemy założyć jej ciągłość na X, quasi-wypukłość oraz warunek Dfx¯0T. Jest to jedna z form warunku koniecznego zaprezentowana w pracy Arrowa i Enthovena z 1961 roku [1].

Kenneth Joseph Arrow jest amerykańskim ekonomistą. Wspólnie z John'em Hicks'em otrzymał nagrodę Nobla z ekonomii w 1972 roku.

7.4. Zadania

Ćwiczenie 7.1

Udowodnij, że funkcja f:a,bR jest quasi-liniowa wtw, gdy jest monotoniczna.

Ćwiczenie 7.2

Niech f:WR, WRn wypukły. Udowodnij następujący fakt: funkcja f jest quasi-liniowa wtw, gdy jej obcięcie do każdego odcinka zawartego w W jest funkcją monotoniczną.

Ćwiczenie 7.3

Wykaż, że jeśli funkcja f:WR, WRn wypukły, jest quasi-wypukła oraz g:RR jest niemalejąca, to funkcja gf jest quasi-wypukła. Jeśli natomiast funkcja g jest nierosnąca, to gf jest quasi-wklęsła.

Ćwiczenie 7.4

Niech f:a,bR będzie funkcją jednej zmiennej. Wykaż, że f jest quasi-wypukła wtw, gdy zachodzi jeden z warunków:

  • f jest monotoniczna,

  • istnieje x¯a,b taki że f jest nierosnąca dla x<x¯ oraz niemalejąca dla x>x¯.

Ćwiczenie 7.5

Dla jakich wartości parametrów a,b,c,dR funkcja fx=ax3+bx2+cx+d jest quasi-wypukła?

Ćwiczenie 7.6

Sprawdź, że funkcja f:0,2R zadana wzorem fx1,x2=e-x1x2 jest quasi-wklęsła.

Ćwiczenie 7.7

Znajdź przykład pokazujący, że suma funkcji quasi-wypukłych nie musi być quasi-wypukła.

Ćwiczenie 7.8

Niech a,cRn i b,dR. Wykaż, że funkcja wymierna

fx=aTx+bcTx+d

jest quasi-liniowa na swojej dziedzinie D=xRn:cTx+d>0.

Ćwiczenie 7.9

Niech h:RnR będzie funkcją liniową i W=xRn:hx>0. Wykaż, że jeśli f:WR jest wypukła, to funkcja gx=fx/hx dla xW jest quasi-wypukła.

Ćwiczenie 7.10

Udowodnij, że jeśli gααI jest rodziną funkcji quasi-wypukłych, w:IR jest funkcją nieujemną, to hx=supαIwαgαx jest quasi-wypukła, o ile jest skończona dla każdego x.

Ćwiczenie 7.11

Niech ARn, CRm będą zbiorami wypukłymi, zaś f:A×CR będzie quasi-wypukła. Wykaż, że hx=infcCfx,c jest quasi-wypukła.

Ćwiczenie 7.12

Niech WRn zbiór wypukły, f:WR. Udowodnij, że jeśli f quasi-liniowa, to zbiór xW:fx=α jest wypukły dla dowolnego αR.

Ćwiczenie 7.13

Niech f:RnR, ciągła. Udowodnij następującą równoważność: f jest quasi-liniowa wtw, gdy fx=gaTx dla funkcji monotonicznej, ciągłej g:RR oraz wektora aRn.

Wykaż, że powyższa równoważność nie musi być prawdziwa, gdy funkcję f rozważamy na wypukłym podzbiorze właściwym Rn.

Ćwiczenie 7.14

Przeprowadź dowód punktu (II) twierdzenia 7.2.

Wskazówka: 

Dla dowolnych punktów x,yW uporządkowanych tak, że fxfy rozważ funkcję

gλ=fλx+1-λy,λ0,1

oraz zbiór

A=λ0,1:gλ>g0.

Pokaż, że jeśli zbiór ten jest niepusty, to prowadzi to do sprzeczności z ciągłością funkcji f. Oznacz przez A spójną składową A, tzn. przedział.

  1. Udowodnij, że λAgλ=0.

  2. Wykaż, że A ma niepuste wnętrze.

  3. Wykaż, że funkcja f jest stała na A oraz ściśle większa od g0.

  4. Wykaż, że istnieje przedział otwarty I0,1 taki że IA=A.

  5. Zauważ sprzeczność z ciągłością funkcji f, bo fA>fIA.

Ćwiczenie 7.15

Wykaż, że funkcja quasi-wypukła (niekoniecznie ciągła) określona na zbiorze wielościennym zwartym przyjmuje swoje maksimum globalne w jednym z punktów ekstremalnych.

Ćwiczenie 7.16

Rozważmy problem optymalizacyjny (7.1). Niech x¯ będzie punktem dopuszczalnym, w którym spełnione są warunki pierwszego rzędu z mnożnikami Lagrange'a μ i λ.

  1. Załóżmy, że f jest pseudowypukła w x¯, zaś funkcja

    ϕx=i=1mμigix+j=1lλjhjx

    jest quasi-wypukła w x¯. Udowodnij, że x¯ jest rozwiązaniem globalnym.

  2. Przypomnijmy, że Lx,μ,λ jest funkcją Lagrange'a. Udowodnij, że jeśli xLx,μ,λ jest pseudowypukła w x¯, to x¯ jest rozwiązaniem globalnym.

  3. Wykaż, że warunki zawarte w powyższych punktach nie są równoważne. Znajdź zależności pomiędzy nimi a założeniami twierdzenia 7.6.

Ćwiczenie 7.17

Niech x¯ będzie rozwiązaniem globalnym problemu optymalizacyjnego (7.1). Załóżmy, że gkx¯<0 dla pewnego k1,,m. Wykaż, że jeśli ograniczenie gkx0 zostanie usunięte, to x¯ może nie być nawet lokalnym rozwiązaniem otrzymanego problemu. Udowodnij natomiast, że jeśli funkcja gk jest ciągła w x¯, to po usunięciu tego ograniczenia x¯ pozostaje rozwiązaniem lokalnym.

Ćwiczenie 7.18

Dla jakich wartości parametru αR problem

x1+x2+αx1-12min,x1-x20,x10

ma rozwiązanie? Jak zależy ono od wartości α?

Ćwiczenie 7.19

Rozwiąż zadanie optymalizacyjne:

bTxmin,xp1,

gdzie bRn, zaś xp=i=1nxip1/p i p>1.

Ćwiczenie 7.20

Niech u:0,nR będzie funkcją quasi-wklęsłą o pochodnej Dux>0 dla każdego x. Ustalmy liczbę w>0 i wektor p0,n. Rozważmy problem optymalizacyjny

uxmax,i=1npixiw,x0.

Wektor p pełni rolę cen produktów, x ich ilości, w jest wielkością budżetu, zaś funkcja u ocenia satysfakcję z decyzji zakupowej x.

Zapisz warunki Kuhn'a-Tucker'a dla powyższego problemu.

  1. Załóżmy, że x¯ jest rozwiązaniem. Czy będzie wówczas istniał wektor mnożników Lagrange'a, dla którego warunki Kuhn'a-Tucker'a są spełnione w x¯?

  2. Załóżmy, że warunki Kuhn'a-Tucker'a są spełnione w x¯. Czy x¯ jest rozwiązaniem problemu optymalizacyjnego?

  3. Niech x¯ będzie rozwiązaniem. Co możesz powiedzieć o związku pomiędzy pi/pj a uix¯/ujx¯, gdy

    • x¯i>0 i x¯j>0?

    • x¯i=0 i x¯j>0?

    • x¯i=0 i x¯j=0?

Ćwiczenie 7.21

Rozwiąż problem optymalizacyjny

x+ymax,px+yI,x,y0,

gdzie p,I>0 są parametrami.

Ćwiczenie 7.22

Niech A będzie macierzą symetryczną n×n dodatnio określoną, zaś b0,. Rozwiąż problem optymalizacyjny:

-logdetXmin,trAXb,

w zbiorze macierzy XRn×n symetrycznych i dodatnio określonych.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.