3.1. Optymalizacja
Aby analizować zagadnienia teorii wyboru, potrzebujemy trochę teorii
optymalizacji. Niektóre z poniższych faktów są zapewne
państwu znane.
Zaczniemy od warunku koniecznego optymalności (tzw. warunku pierwszego rzędu).
Twierdzenie 3.1
(mnożniki Lagrange'a)
Niech X=Rn i niech funkcje f:X→R i
gi:X→R dla i=1,…,m będą
różniczkowalne. Jeżeli w punkcie x*∈X, jest
przyjmowane maximum (minimum) f na zbiorze {x:gi(x)=0 dla i=1,…,m} i gradienty funkcji gi są liniowo niezależne w
x*, to istnieje taki wektor λ∈Rm, że ∇fx*-λT∇gx*=0.
Definicja 3.1
Funkcję Lλ,x=fx-λTgx nazywamy lagrangianem, a wektor λ nazywamy mnożnikami Lagrange'a.
Twierdzenie można sformułować następująco: punkt optymalny
dla optymalizacji z ograniczeniami równościowymi wraz wektorem
mnożników musi być punktem krytycznym lagrangianu (zerowanie
pochodnej po λ to równości definiujące zbiór
dopuszczalny).
Uwaga: Dla uproszczenia zapisu wyników maksymalizacji
(minimalizacji) funkcji f po zbiorze Γ, wprowadzimy symbole Argmaxx∈Γfx (Argminx∈Γfx) na
zbiór tych punktów, w których maksimum (minimum) jest
przyjmowane.
Ponadto, jeżeli maksymalizujemy funkcję po pewnym zbiorze i ten
zbiór okaże się pusty, wówczas za maksimum przyjmujemy -∞ (analogicznie za minimum +∞).
Przykład 3.1
Znajdowanie maksimum ściśle monotonicznej,
ściśle wklęsłej i różniczkowalnej funkcji
użyteczności u na Walrasowskim zbiorze budżetowym x∈R+2:pTx≤m (gdzie pi,m>0) przy pomocy
mnożników Lagrange'a.
W niniejszym przykładzie rozwiązujemy zagadnienie, z jakim mamy do
czynienia zazwyczaj przy wyborze konsumenta: funkcja użyteczności
jest ściśle monotoniczna, i wklęsła, a zbiory budżetowe są walrasowskie. Ponieważ u jest monotoniczna, więc maxx:p1x1+p2x2≤mux=maxx:p1x1+p2x2=mux. Ponieważ ponadto u
jest ściśle monotoniczna, także Argmaxx:p1x1+p2x2≤mux=Argmaxx:p1x1+p2x2=mux, co sprowadza optymalizację z
ograniczeniem nierównościowym do optymalizacji z ograniczeniem
równościowym.
Lagrangian zagadnienia ma postać Lλ,x=ux-λp1x1+p2x2-m, a więc warunki konieczne na to, aby w
punkcie x o obu współrzędnych dodatnich było przyjmowane
maksimum to:
∂ux∂x1-λp1=0,
∂ux∂x2-λp2=0,
p1x1+p2x2=m.
Przeanalizujmy dwa pierwsze równania:
∂ux∂x1=λp1,
∂ux∂x2=λp2.
Ponieważ u jest ściśle monotoniczna, w x nie może
być przyjmowane maksimum globalne u, a ponieważ funkcja jest
ściśle wklęsła, pochodna może się zerować tylko w
maksimum globalnym, stąd wiemy, że λ≠0. Możemy więc podzielić równania przez siebie stronami. Otrzymamy ∂ux∂x1∂ux∂x2=λp1λp2=p1p2.
Jest to warunek konieczny maksymalizacji w naszym przypadku. Ma on
interpretacje zarówno ekonomiczną jak i graficzną. Obie będą bardziej oczywiste, jeżeli powyższe równanie pomnożymy
przez -1:
-∂ux∂x1∂ux∂x2=-p1p2.
Prawa strona to oczywiście nachylenie ograniczenia budżetowego,
natomiast lewa to nachylenie krzywej obojętności przechodzącej
przez punkt x (co łatwo wynika z twierdzenia o funkcji uwikłanej), a więc to, co otrzymaliśmy, to warunek konieczny styczności:
równość nachyleń w punkcie styczności.
Interpretacja ekonomiczna brzmi: krańcowa stopa substytucji równa się, co do modułu, stosunkowi cen.
Definicja 3.2
Krańcową stopą substytucji pomiędzy dobrami 1 i 2
w punkcie x nazywamy współczynnik kierunkowy krzywej obojętności w punkcie x. Oznaczamy ją skrótem MRSx1,x2
(od angielskiego marginal rate of substitution).
Z twierdzenia o funkcji uwikłanej mamy więc MRSx1,x2=-∂ux∂x1∂ux∂x2.
Uwaga 3.1
W niektórych podręcznikach krańcowa stopa substytucji
jest definiowana bez minusa, a czasem nawet zdarzają się
niekonsekwencje: jest definiowana jako nachylenie, a więc z minusem, a potem minus ginie w stwierdzeniu ”krańcowa stopa substytucji równa
się stosunkowi cen” i tym podobnych.
Uwaga 3.2
Interpetacja łopatologiczna słowa ”krańcowy”, czyli
pochodnych w ekonomii, jako skutku zmiany o jednostkę. W przypadku
teorii wyboru konsumenta ma to niewielki sens, natomiast w przypadku wyboru
producenta, przy bardzo dużych nakładach produkcji może być w
miarę przyzwoitym przybliżeniem.
A więc ekonomista może zdefiniować krańcową stopę
substytucji słowami: ”o ile musi zmienić się konsumpcja dobra 2
jesłi konsumpcja dobra 1 zwiększyła się o jednostkę,
abyśmy pozostali na tej samej krzywej obojętności”.
Warunek dostateczny optymalności uogólnia warunek dostateczny dla
przypadku optymalizacji bez ograniczeń: jeśli w dopuszczalnym x*
spełniony jest warunek pierwszego rzędu i macierz drugiej pochodnej
jest dodatnio określona w dowolnym kierunku dopuszczalnym (tzn. hT⋅D2fx*⋅h≥0 dla h takich, że ∇gx*⋅h=0), to w punkcie x* jest przyjmowane minimum,
jeśli natomiast ujemnie określona – maksimum. Ponieważ jednak
badanie określoności macierzy dla wektorów z pewnej
podprzestrzeni nie jest trywialne, sformułujemy ten warunek
równoważnie.
Twierdzenie 3.2
Niech m=1. Jeśli w dopuszczalnym punkcie x* spełnione są
warunki pierwszego rzędu dla pewnego mnożnika λ* i
jeśli dla k≥3 minory główne Δk macierzy D2Lλ*,x* spełniają warunek signΔk=-1, to w x* jest przyjmowane minimum, jeśli natomiast signΔk=-1k+1, to maksimum.
Twierdzenie 3.3
Jeśli funkcja f jest wklęsła, g liniowa i x* dopuszczalny
spełnia warunek pierwszego rzędu, to w x* jest przyjmowane
maksimum, a jeśli f jest wypukła, to minimum.
W przypadku ograniczeń nierównościowych mamy podobne warunki
pierwszego rzędu.
Twierdzenie 3.4
(warunki konieczne Kuhna-Tuckera albo Karusha-Kuhna-Tuckera)
Niech X=Rn i niech funkcje f:X→R i
gi,hi:X→R będą różniczkowalne. Jeżeli w punkcie x*∈X, jest przyjmowane
maximum f na zbiorze {x:gi(x)≤0 dla i=1,…,m; hix=0
dla i=1,…,k} i gradienty w x* funkcji hi oraz tych z
funkcji gi, dla których gix*=0, są liniowo
niezależne, to istnieją takie wektory λ∈R+m,
μ∈Rk że ∇fx*-λT∇gx*-μT∇hx*=0. Ponadto jeśli gix*≠0,
to λi=0.
Ćwiczenie 3.1
Powtórzyć analizę przykładu 3.1 bez założenia ścisłej dodatniości współrzędnych przy użyciu warunków koniecznych Kuhna-Tuckera.
Warunków koniecznych Kuhna-Tuckera można użyć nawet do rozwiązania zagadnień maksymalizacjnych, do których zazwyczaj nie przyszłoby nam do głowy liczenie pochodnej – maksymalizacji funkcji liniowej przy ograniczeniach liniowych.
Ćwiczenie 3.2
Rozwiązać zagadnienie maksymalizacji ux=a1⋅x1+a2⋅x2 (doskonałe substytuty) na Walrasowskim zbiorze budżetowym w R+2.
W przypadku ograniczeń nierównościowych wektor mnożników
(tzw. mnożników Kuhna-Tuckera) jest nieujemny, istotny jest więc
kierunek nierówności. Dlatego, aby uzyskać nieujemny wektor
mnożników w przypadku zagadnienia minimalizacji, musimy zapisać
ograniczenia w postaci gix≥0. Musimy na to też
zwrócić uwagę przy warunkach drugiego rzędu.
Twierdzenie 3.5
Jeśli x* dopuszczalny spełnia warunek pierwszego rzędu, a
funkcja f jest wklęsła, funkcje gi wypukłe, hi liniowe,
to w x* jest przyjmowane maksimum f na zbiorze {x:gi(x)≤0
dla i=1,…,m; hix=0 dla i=1,…,k}, a jeśli f
jest wypukła a funkcje gi wklęsłe, hi liniowe, to minimum f na zbiorze {x:gi(x)≥0 dla i=1,…,m, ; hix=0 dla i=1,…,k}.
Definicja 3.3
Funkcję f:Rn→R nazywamy górnie (dolnie) półciągła, jeśli dla każdego x∈Rn i ϵ>0 istnieje δ>0, taka że dla y dla
których x-y<δ zachodzi własność fx-fy>-ϵ (dla dolnej półciągłości fx-fy<ϵ).
Definicja 3.4
a) Funkcję f:Rn→R nazywamy quasi-wklęsłą, jeśli dla każdego x,y i dla każdego 0<t<1
zachodzi warunek ftx+1-ty≥minfx,fy.
b) Funkcja f jest ściśle quasi-wklęsła, jeśli dla
każdego x≠y i dla każdego 0<t<1 zachodzi warunek ftx+1-ty>minfx,fy.
c) Funkcja f jest quasi-wypukła (ściśle),
jeśli funkcja -f jest quasi wklęsła (ściśle).
Każda funkcja wklęsła jest quasi wklęsła, natomiast nie na
odwrót. W szczególności funkcja quasi wklęsła nie musi
być ciągła, a funkcja wklęsła określona na zbiorze
otwartym jest ciągła. Funkcją quasi-wklęsłą może
być nawet funkcja ściśle wypukła określona na odcinku, o
ile nie ma minimum w jego wnętrzu: na przykład x2:R+→R+.
Stwierdzenie 3.1
a) Funkcja f jest quasi wklęsła wtedy i tylko wtedy, gdy ∀r
y:uy≥r jest wypukły;
b) Funkcja f jest ściśle quasi wklęsła wtedy i tylko wtedy,
gdy ∀r y:uy≥r jest wypukły i ∀r∈R,x≠y∈X jeśli ux=uy=r, to ∀t∈0,1 utx+1-ty>r.
Na mocy tego stwierdzenia możemy coś powiedzieć na temat funkcji
użyteczności odzwierciedlającej wypukłe preferencje.
Stwierdzenie 3.2
Każda funkcja użyteczności odzwierciedlająca wypukłe
preferencje jest quasi wklęsła, a ściśle wypukłe –
ściśle quasi wklęsła.
Twierdzenie 3.6
(istnienie i jednoznaczność maximum)
a) Jeżeli funkcja f:X→R jest górnie
półciągła a zbiór G niepusty, zwarty, to istnieje punkt
realizujący maksimum f na G.
b) Jeżeli funkcja f:X→R jest ściśle
quasi-wklęsła a zbiór G wypukły, to istnieje co najwyżej
jeden punkt realizujący maksimum f na G.
c) Jeżeli funkcja f:X→R jest quasi-wklęsła a zbiór G wypukły, to zbiór punktów realizujących
maksimum f na G jest wypukły.
Twierdzenie 3.7
(twierdzenie o obwiedni dla maksymalizacji z ograniczeniami)
a) Niech X=Rn i niech funkcje f:X×R→R i g:X×R→R będą
różniczkowalne i takie, że dla każdego a, maxgx,a=0fx,a jest przyjmowane w dokładnie jednym punkcie xa
dla jednoznacznego wektora mnożników λ i tak zdefiniowana
funkcja x jest różniczkowalna. Definiujemy Ma=maxgx,a=0fx,a. Dla funkcji M zachodzi następująca własność:
dMda=∂Lλ,x,a∂ax=xa,λ=λa.
b) Niech X=Rn i niech funkcje f:X×R→R i g:X×R→R będą
różniczkowalne i takie, że dla każdego a, maxgx,a≤0fx,a jest przyjmowane w dokładnie jednym punkcie xa dla jednoznacznego wektora mnożników λ i tak
zdefiniowane funkcje x i λ są różniczkowalne.
Definiujemy Ma=maxgx,a≤0fx,a. Dla funkcji M zachodzi następująca własność:
dMda=∂Lλ,x,a∂ax=xa,λ=λa.
Wniosek 3.1
(twierdzenie o obwiedni dla maksymalizacji bez ograniczeń)
Niech X=Rn i niech funkcja f:X×R→R będzie różniczkowalna i taka, że dla
każdego a, maxx∈Xfx,a jest przyjmowane w
dokładnie jednym punkcie xa i tak zdefiniowana funkcja x jest
różniczkowalna. Definiujemy Ma=maxx∈Xfx,a. Dla
funkcji M zachodzi następująca własność: dMda=∂fx,a∂ax=xa.
Ćwiczenie 3.3
Udowodnić twierdzenia o obwiedni.
Definicja 3.5
Niech X=Rn i funkcja f:X→R. Funkcję f nazywamy (dodatnio) jednorodną stopnia r, jeżeli dla
każdego x∈X, t>0 mamy ftx=trfx.