Zagadnienia

3. Narzędzia

3.1. Optymalizacja

Aby analizować zagadnienia teorii wyboru, potrzebujemy trochę teorii optymalizacji. Niektóre z poniższych faktów są zapewne państwu znane.

Zaczniemy od warunku koniecznego optymalności (tzw. warunku pierwszego rzędu).

Twierdzenie 3.1

(mnożniki Lagrange'a)

Niech \mathbb{X}=\mathbb{R}^{{n}} i niech funkcje f:\mathbb{X}\rightarrow\mathbb{R} i g_{{i}}:\mathbb{X}\rightarrow\mathbb{R} dla i=1,\ldots,m będą różniczkowalne. Jeżeli w punkcie x^{{*}}\in\mathbb{X}, jest przyjmowane maximum (minimum) f na zbiorze \{ x:g_{{i}}(x)=0 dla i=1,\ldots,m\} i gradienty funkcji g_{{i}} są liniowo niezależne w x^{{*}}, to istnieje taki wektor \lambda\in\mathbb{R}^{{m}}, że \nabla f(x^{{*}})-\lambda^{{T}}\nabla g(x^{{*}})=0.

Definicja 3.1

Funkcję \mathcal{L}(\lambda,x)=f(x)-\lambda^{{T}}g(x) nazywamy lagrangianem, a wektor \lambda nazywamy mnożnikami Lagrange'a.

Twierdzenie można sformułować następująco: punkt optymalny dla optymalizacji z ograniczeniami równościowymi wraz wektorem mnożników musi być punktem krytycznym lagrangianu (zerowanie pochodnej po \lambda to równości definiujące zbiór dopuszczalny).

Uwaga: Dla uproszczenia zapisu wyników maksymalizacji (minimalizacji) funkcji f po zbiorze \Gamma, wprowadzimy symbole \mathop{\rm{Argmax}}_{{x\in\Gamma}}f(x) (\mathop{\rm{Argmin}}_{{x\in\Gamma}}f(x)) na zbiór tych punktów, w których maksimum (minimum) jest przyjmowane.

Ponadto, jeżeli maksymalizujemy funkcję po pewnym zbiorze i ten zbiór okaże się pusty, wówczas za maksimum przyjmujemy -\infty (analogicznie za minimum +\infty).

Przykład 3.1

Znajdowanie maksimum ściśle monotonicznej, ściśle wklęsłej i różniczkowalnej funkcji użyteczności u na Walrasowskim zbiorze budżetowym \{ x\in\mathbb{R}_{{+}}^{{2}}:\mathbf{p}^{{T}}x\leq m\} (gdzie p_{{i}},m>0) przy pomocy mnożników Lagrange'a.

W niniejszym przykładzie rozwiązujemy zagadnienie, z jakim mamy do czynienia zazwyczaj przy wyborze konsumenta: funkcja użyteczności jest ściśle monotoniczna, i wklęsła, a zbiory budżetowe są walrasowskie. Ponieważ u jest monotoniczna, więc \max _{{\{ x:p_{{1}}x_{{1}}+p_{{2}}x_{{2}}\leq m\}}}u(x)=\max _{{\{ x:p_{{1}}x_{{1}}+p_{{2}}x_{{2}}=m\}}}u(x). Ponieważ ponadto u jest ściśle monotoniczna, także \mathop{\rm{Argmax}}_{{\{ x:p_{{1}}x_{{1}}+p_{{2}}x_{{2}}\leq m\}}}u(x)=\mathop{\rm{Argmax}}_{{\{ x:p_{{1}}x_{{1}}+p_{{2}}x_{{2}}=m\}}}u(x), co sprowadza optymalizację z ograniczeniem nierównościowym do optymalizacji z ograniczeniem równościowym.

Lagrangian zagadnienia ma postać \mathcal{L}(\lambda,x)=u(x)-\lambda(p_{{1}}x_{{1}}+p_{{2}}x_{{2}}-m), a więc warunki konieczne na to, aby w punkcie x o obu współrzędnych dodatnich było przyjmowane maksimum to: \frac{\partial u(x)}{\partial x_{{1}}}-\lambda p_{{1}}=0, \frac{\partial u(x)}{\partial x_{{2}}}-\lambda p_{{2}}=0, p_{{1}}x_{{1}}+p_{{2}}x_{{2}}=m.

Przeanalizujmy dwa pierwsze równania: \frac{\partial u(x)}{\partial x_{1}}=\lambda p_{1}, \frac{\partial u(x)}{\partial x_{2}}=\lambda p_{2}.

Ponieważ u jest ściśle monotoniczna, w x nie może być przyjmowane maksimum globalne u, a ponieważ funkcja jest ściśle wklęsła, pochodna może się zerować tylko w maksimum globalnym, stąd wiemy, że \lambda\neq 0. Możemy więc podzielić równania przez siebie stronami. Otrzymamy \dfrac{\frac{\partial u(x)}{\partial x_{{1}}}}{\frac{\partial u(x)}{\partial x_{{2}}}}=\dfrac{\lambda p_{{1}}}{\lambda p_{{2}}}=\dfrac{p_{{1}}}{p_{{2}}}.

Jest to warunek konieczny maksymalizacji w naszym przypadku. Ma on interpretacje zarówno ekonomiczną jak i graficzną. Obie będą bardziej oczywiste, jeżeli powyższe równanie pomnożymy przez -1:

-\dfrac{\frac{\partial u(x)}{\partial x_{1}}}{\frac{\partial u(x)}{\partial x_{2}}}=-\dfrac{p_{1}}{p_{2}}.

Prawa strona to oczywiście nachylenie ograniczenia budżetowego, natomiast lewa to nachylenie krzywej obojętności przechodzącej przez punkt x (co łatwo wynika z twierdzenia o funkcji uwikłanej), a więc to, co otrzymaliśmy, to warunek konieczny styczności: równość nachyleń w punkcie styczności.

krańcowa stopa substytucji równa się, co do modułu, stosunkowi cen
Rys. 3.1. Warunek konieczny maksymalizacji – interpretacja graficzna.

Interpretacja ekonomiczna brzmi: krańcowa stopa substytucji równa się, co do modułu, stosunkowi cen.

Definicja 3.2

Krańcową stopą substytucji pomiędzy dobrami 1 i 2 w punkcie x nazywamy współczynnik kierunkowy krzywej obojętności w punkcie x. Oznaczamy ją skrótem MRS(x_{{1,}}x_{{2}}) (od angielskiego marginal rate of substitution).

Z twierdzenia o funkcji uwikłanej mamy więc MRS(x_{{1,}}x_{{2}})=-\dfrac{\frac{\partial u(x)}{\partial x_{{1}}}}{\frac{\partial u(x)}{\partial x_{{2}}}}.

Uwaga 3.1

W niektórych podręcznikach krańcowa stopa substytucji jest definiowana bez minusa, a czasem nawet zdarzają się niekonsekwencje: jest definiowana jako nachylenie, a więc z minusem, a potem minus ginie w stwierdzeniu ”krańcowa stopa substytucji równa się stosunkowi cen” i tym podobnych.

Uwaga 3.2

Interpetacja łopatologiczna słowa ”krańcowy”, czyli pochodnych w ekonomii, jako skutku zmiany o jednostkę. W przypadku teorii wyboru konsumenta ma to niewielki sens, natomiast w przypadku wyboru producenta, przy bardzo dużych nakładach produkcji może być w miarę przyzwoitym przybliżeniem.

A więc ekonomista może zdefiniować krańcową stopę substytucji słowami: ”o ile musi zmienić się konsumpcja dobra 2 jesłi konsumpcja dobra 1 zwiększyła się o jednostkę, abyśmy pozostali na tej samej krzywej obojętności”.

Warunek dostateczny optymalności uogólnia warunek dostateczny dla przypadku optymalizacji bez ograniczeń: jeśli w dopuszczalnym x^{{*}} spełniony jest warunek pierwszego rzędu i macierz drugiej pochodnej jest dodatnio określona w dowolnym kierunku dopuszczalnym (tzn. h^{T}\cdot D^{2}f(x^{{*}})\cdot h\geq 0 dla h takich, że \nabla g(x^{{*}})\cdot h=0), to w punkcie x^{{*}} jest przyjmowane minimum, jeśli natomiast ujemnie określona – maksimum. Ponieważ jednak badanie określoności macierzy dla wektorów z pewnej podprzestrzeni nie jest trywialne, sformułujemy ten warunek równoważnie.

Twierdzenie 3.2

Niech m=1. Jeśli w dopuszczalnym punkcie x^{{*}} spełnione są warunki pierwszego rzędu dla pewnego mnożnika \lambda^{{*}} i jeśli dla k\geq 3 minory główne \Delta _{{k}} macierzy D^{{2}}\mathcal{L}(\lambda^{{*}},x^{{*}}) spełniają warunek \mathop{\rm{sign}}\Delta _{{k}}=-1, to w x^{{*}} jest przyjmowane minimum, jeśli natomiast \mathop{\rm{sign}}\Delta _{{k}}=\left(-1\right)^{{k+1}}, to maksimum.

Twierdzenie 3.3

Jeśli funkcja f jest wklęsła, g liniowa i x^{{*}} dopuszczalny spełnia warunek pierwszego rzędu, to w x^{{*}} jest przyjmowane maksimum, a jeśli f jest wypukła, to minimum.

W przypadku ograniczeń nierównościowych mamy podobne warunki pierwszego rzędu.

Twierdzenie 3.4

(warunki konieczne Kuhna-Tuckera albo Karusha-Kuhna-Tuckera)

Niech \mathbb{X}=\mathbb{R}^{{n}} i niech funkcje f:\mathbb{X}\rightarrow\mathbb{R} i g_{{i}},h_{{i}}:\mathbb{X}\rightarrow\mathbb{R} będą różniczkowalne. Jeżeli w punkcie x^{{*}}\in\mathbb{X}, jest przyjmowane maximum f na zbiorze \{ x:g_{{i}}(x)\leq 0 dla i=1,\ldots,m; h_{{i}}(x)=0 dla i=1,\ldots,k\} i gradienty w x^{{*}} funkcji h_{{i}} oraz tych z funkcji g_{{i}}, dla których g_{{i}}(x^{{*}})=0, są liniowo niezależne, to istnieją takie wektory \lambda\in\mathbb{R}_{{+}}^{{m}}, \mu\in\mathbb{R}^{{k}} że \nabla f(x^{{*}})-\lambda^{{T}}\nabla g(x^{{*}})-\mu^{{T}}\nabla h(x^{{*}})=0. Ponadto jeśli g_{{i}}(x^{{*}})\neq 0, to \lambda _{{i}}=0.

Ćwiczenie 3.1

Powtórzyć analizę przykładu 3.1 bez założenia ścisłej dodatniości współrzędnych przy użyciu warunków koniecznych Kuhna-Tuckera.

Warunków koniecznych Kuhna-Tuckera można użyć nawet do rozwiązania zagadnień maksymalizacjnych, do których zazwyczaj nie przyszłoby nam do głowy liczenie pochodnej – maksymalizacji funkcji liniowej przy ograniczeniach liniowych.

Ćwiczenie 3.2

Rozwiązać zagadnienie maksymalizacji u(x)=a_{1}\cdot x_{1}+a_{2}\cdot x_{2} (doskonałe substytuty) na Walrasowskim zbiorze budżetowym w \mathbb{R}^{2}_{+}.

W przypadku ograniczeń nierównościowych wektor mnożników (tzw. mnożników Kuhna-Tuckera) jest nieujemny, istotny jest więc kierunek nierówności. Dlatego, aby uzyskać nieujemny wektor mnożników w przypadku zagadnienia minimalizacji, musimy zapisać ograniczenia w postaci g_{{i}}(x)\geq 0. Musimy na to też zwrócić uwagę przy warunkach drugiego rzędu.

Twierdzenie 3.5

Jeśli x^{{*}} dopuszczalny spełnia warunek pierwszego rzędu, a funkcja f jest wklęsła, funkcje g_{{i}} wypukłe, h_{{i}} liniowe, to w x^{{*}} jest przyjmowane maksimum f na zbiorze \{ x:g_{{i}}(x)\leq 0 dla i=1,\ldots,m; h_{{i}}(x)=0 dla i=1,\ldots,k\}, a jeśli f jest wypukła a funkcje g_{{i}} wklęsłe, h_{{i}} liniowe, to minimum f na zbiorze \{ x:g_{{i}}(x)\geq 0 dla i=1,\ldots,m, ; h_{{i}}(x)=0 dla i=1,\ldots,k\}.

Definicja 3.3

Funkcję f:\mathbb{R}^{{n}}\rightarrow\mathbb{R} nazywamy górnie (dolnie) półciągła, jeśli dla każdego x\in\mathbb{R}^{{n}} i \epsilon>0 istnieje \delta>0, taka że dla y dla których \left\| x-y\right\|<\delta zachodzi własność f(x)-f(y)>-\epsilon (dla dolnej półciągłości f(x)-f(y)<\epsilon).

Definicja 3.4

a) Funkcję f:\mathbb{R}^{{n}}\rightarrow\mathbb{R} nazywamy quasi-wklęsłą, jeśli dla każdego x,y i dla każdego 0<t<1 zachodzi warunek f(tx+(1-t)y)\geq\min(f(x),f(y)).

b) Funkcja f jest ściśle quasi-wklęsła, jeśli dla każdego x\neq y i dla każdego 0<t<1 zachodzi warunek f(tx+(1-t)y)>\min(f(x),f(y)).

c) Funkcja f jest quasi-wypukła (ściśle), jeśli funkcja -f jest quasi wklęsła (ściśle).

Każda funkcja wklęsła jest quasi wklęsła, natomiast nie na odwrót. W szczególności funkcja quasi wklęsła nie musi być ciągła, a funkcja wklęsła określona na zbiorze otwartym jest ciągła. Funkcją quasi-wklęsłą może być nawet funkcja ściśle wypukła określona na odcinku, o ile nie ma minimum w jego wnętrzu: na przykład x^{{2}}:\mathbb{R}_{{+}}\rightarrow\mathbb{R}_{{+}}.

Stwierdzenie 3.1

a) Funkcja f jest quasi wklęsła wtedy i tylko wtedy, gdy \forall r \{ y:u(y)\geq r\} jest wypukły;

b) Funkcja f jest ściśle quasi wklęsła wtedy i tylko wtedy, gdy \forall r \{ y:u(y)\geq r\} jest wypukły i \forall r\in\mathbb{R},x\neq y\in\mathbb{X} jeśli u(x)=u(y)=r, to \forall t\in(0,1) u(tx+(1-t)y)>r.

Na mocy tego stwierdzenia możemy coś powiedzieć na temat funkcji użyteczności odzwierciedlającej wypukłe preferencje.

Stwierdzenie 3.2

Każda funkcja użyteczności odzwierciedlająca wypukłe preferencje jest quasi wklęsła, a ściśle wypukłe – ściśle quasi wklęsła.

Twierdzenie 3.6

(istnienie i jednoznaczność maximum)

a) Jeżeli funkcja f:\mathbb{X}\rightarrow\mathbb{R} jest górnie półciągła a zbiór G niepusty, zwarty, to istnieje punkt realizujący maksimum f na G.

b) Jeżeli funkcja f:\mathbb{X}\rightarrow\mathbb{R} jest ściśle quasi-wklęsła a zbiór G wypukły, to istnieje co najwyżej jeden punkt realizujący maksimum f na G.

c) Jeżeli funkcja f:\mathbb{X}\rightarrow\mathbb{R} jest quasi-wklęsła a zbiór G wypukły, to zbiór punktów realizujących maksimum f na G jest wypukły.

Twierdzenie 3.7

(twierdzenie o obwiedni dla maksymalizacji z ograniczeniami)

a) Niech \mathbb{X}=\mathbb{R}^{{n}} i niech funkcje f:\mathbb{X}\times\mathbb{R}\rightarrow\mathbb{R} i g:\mathbb{X\times R}\rightarrow\mathbb{R} będą różniczkowalne i takie, że dla każdego a,\quad \max _{{g(x,a)=0}}f(x,a) jest przyjmowane w dokładnie jednym punkcie x(a) dla jednoznacznego wektora mnożników \lambda i tak zdefiniowana funkcja x jest różniczkowalna. Definiujemy M(a)=\max _{{g(x,a)=0}}f(x,a). Dla funkcji M zachodzi następująca własność:

\frac{dM}{da}=\left.\frac{\partial\mathcal{L}(\lambda,x,a)}{\partial a}\right|_{{x=x(a),\lambda=\lambda(a)}}.

b) Niech \mathbb{X}=\mathbb{R}^{{n}} i niech funkcje f:\mathbb{X}\times\mathbb{R}\rightarrow\mathbb{R} i g:\mathbb{X\times R}\rightarrow\mathbb{R} będą różniczkowalne i takie, że dla każdego a,\quad \max _{{g(x,a)\leq 0}}f(x,a) jest przyjmowane w dokładnie jednym punkcie x(a) dla jednoznacznego wektora mnożników \lambda i tak zdefiniowane funkcje x i \lambda są różniczkowalne. Definiujemy M(a)=\max _{{g(x,a)\leq 0}}f(x,a). Dla funkcji M zachodzi następująca własność:

\frac{dM}{da}=\left.\frac{\partial\mathcal{L}(\lambda,x,a)}{\partial a}\right|_{{x=x(a),\lambda=\lambda(a)}}.

Wniosek 3.1

(twierdzenie o obwiedni dla maksymalizacji bez ograniczeń)

Niech \mathbb{X}=\mathbb{R}^{{n}} i niech funkcja f:\mathbb{X}\times\mathbb{R}\rightarrow\mathbb{R} będzie różniczkowalna i taka, że dla każdego a,\quad \max _{{x\in\mathbb{X}}}f(x,a) jest przyjmowane w dokładnie jednym punkcie x(a) i tak zdefiniowana funkcja x jest różniczkowalna. Definiujemy M(a)=\max _{{x\in\mathbb{X}}}f(x,a). Dla funkcji M zachodzi następująca własność: \frac{dM}{da}=\left.\frac{\partial f(x,a)}{\partial a}\right|_{{x=x(a)}}.

Ćwiczenie 3.3

Udowodnić twierdzenia o obwiedni.

Definicja 3.5

Niech \mathbb{X}=\mathbb{R}^{{n}} i funkcja f:\mathbb{X}\rightarrow\mathbb{R}. Funkcję f nazywamy (dodatnio) jednorodną stopnia r, jeżeli dla każdego x\in\mathbb{X}, t>0 mamy f(tx)=t^{{r}}f(x).

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.