Условный экстремум

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Усло́вный экстре́мум — максимальное или минимальное значение, которое функция, определённая на множестве G и принимающая вещественные значения, достигает в предположении, что значения некоторых других функций с той же областью определения подчинены определённым ограничительным условиям (если такие дополнительные условия отсутствуют, то говорят о безусловном экстремуме)[1].

В частности, множество G может быть подмножеством арифметического векторного пространства \R^n, а упомянутые ограничительные условия, в свою очередь, могут быть заданы в виде равенств или неравенств; если при этом среди условий имеются заданные в виде неравенств, то задача нахождения условного экстремума является задачей нелинейного программирования. Ниже рассматриваются классическая задача на условный экстремум, в которой все условия заданы в виде равенств, а также задача Лагранжа — одна из классических задач вариационного исчисления[1].

Постановка классической задачи на условный экстремум[править | править вики-текст]

Пусть {G \subset \R^n} — открытое множество, и на нём заданы функции  y_{i} = f_{i}(\vec x),\; i = 1,2,\dots,m.  Пусть E = \lbrace\, \vec x \in G :\,f_{i}(\vec x) = 0\;\; \forall\,i = 1, 2, \dots, m\,\rbrace.

Уравнения

(*)\qquad f_{i}(\vec x) = 0

называют уравнениями связей (терминология заимствована из механики).

Пусть на G определена также функция y = f_{0}(\vec x).  Точка \vec x_{0} \in E называется точкой условного экстремума данной функции относительно уравнений связей (*), если она является точкой обычного (безусловного) экстремума функции f_{0} на множестве E  (модификация определения экстремума сводится к тому, что в нём вместо окрестностей U_{E}(\vec x_{0}) рассматриваются окрестности U_{E}(\vec x_{0})\bigcap E)[2].

Метод множителей Лагранжа для решения задачи условного экстремума[править | править вики-текст]

Теорема[править | править вики-текст]

Предположим, что все фигурирующие в постановке классической задачи на условный экстремум функции непрерывно дифференцируемы, и пусть \vec x_{0} — точка условного экстремума функции f_{0} при выполнении уравнений связей (*).  Тогда в этой точке градиенты \nabla f_{i},\,i = 0,1,\dots,m  являются линейно зависимыми, т. e.  \exists\,\lambda_{i},\,i = 0,1,\dots,m\,\colon\; \sum^{m}_{i=0} |\lambda_{i}| \ne 0,  но  \sum^{m}_{i=0} \lambda_{i} \nabla f_{i} = 0 [3].

Числа \lambda_{i},\,i = 0,1,\dots,m называются множителями Лагранжа и определены с точностью до умножения на произвольную ненулевую константу. Наибольший интерес представляет случай, когда \lambda_{0} \ne 0  (тогда, умножив все \lambda_{i} на подходящую ненулевую константу, можно сделать множитель \lambda_{0} равным 1 и, таким образом, вообще исключить его из рассмотрения). В такой ситуации вместо только что сформулированной теоремы пользуются следующим следствием из неё[4].

Следствие[править | править вики-текст]

Если \vec x_{0} — точка условного экстремума функции f_{0} относительно уравнений связей (*), и в ней градиенты \nabla f_{i}, i = 1,\dots,m  линейно независимы, то  \exists\,\lambda _{1},\dots,\lambda _{m} такие, что в данной точке  \nabla f_{0} + \lambda _{1} \nabla f_{1} + \dots + \lambda _{m} \nabla f_{m} = 0.  В координатном виде это векторное равенство эквивалентно выполнению равенств

(**)\qquad \frac{\partial f_{0}}{\partial x_{i}}(\vec x_{0}) + \lambda _{1}\frac{\partial f_{1}}{\partial x_{i}}(\vec x_{0}) + \dots + \lambda _{m}\frac{\partial f_{m}}{\partial x_{i}}(\vec x_{0}) = 0\,,

где i = 0,1,\dots,n [3].

Равенствам (**) можно дать следующую интерпретацию. Предположим, что для чисел \lambda_{1},\dots,\lambda_{m} данные равенства выполняются, и объединим их в столбец \vec \lambda_{0}.  Составим функцию Лагранжа:

L(\vec x; \vec f, \vec \lambda) = f_{0}(\vec x) + \sum_{i=1}^m\lambda_i\,f_{i}(\vec x)\,,

где \lambda _{1},\dots,\lambda _{m} — уже произвольные числа. Тогда при \vec \lambda = \vec \lambda_{0} точка \vec x_{0} является стационарной точкой функции Лагранжа, а равенства (**) могут быть записаны в виде

\frac{\partial L}{\partial x_{1}} \,=\, \frac{\partial L}{\partial x_{2}} \,=\, \dots \,=\, \frac{\partial L}{\partial x_{n}} \,=\, 0\,;

эти соотношения и являются условиями стационарности точки \vec x_{0}.  Добавляя к ним уравнения связей (*), получаем n+m уравнений относительно n+m неизвестных x_{1},\dots,x_{n},\lambda_{1},\dots,\lambda_{m}[5][6].

Пример.  Найдём стороны прямоугольника максимальной площади, вписанного в окружность x^2 + y^2 = r^2.  Здесь n=2,  m=1,  f_{0}(x,y) = 4xy,  f_{1}(x,y) = x^2 + y^2 - r^2.  Составив функцию Лагранжа

L(x,y) \,=\, 4xy + \lambda (x^2 + y^2 - r^2)

и записав условия её стационарности в точке условного экстремума

\frac{\partial L}{\partial x} \equiv 4y + 2\lambda x \,=\, 0\,,\qquad \frac{\partial L}{\partial y} \equiv 4x + 2\lambda y \,=\, 0\,,

находим:  \lambda=-2  и  x = y = r/\sqrt{2}  (прямоугольник максимальной площади оказался квадратом)[6].

Достаточное условие условного экстремума[править | править вики-текст]

Если равенства (**) при \vec \lambda = \vec \lambda_{0} выполнены и при этом (дополнительно предполагается, что в точке \vec x_{0} все фигурирующие в постановке классической задачи на условный экстремум функции двукратно непрерывно дифференцируемы)  {\rm d}^2 L представляет собой отрицательно (положительно) определённую квадратичную форму переменных {\rm d}x_{1},\dots,{\rm d}x_{n},  то \vec x_{0} является точкой строгого условного максимума функции f_{0} (строгого условного минимума для положительно определенной формы). Если же рассматриваемая квадратичная форма не является знакоопределённой, тогда условного экстремума нет[7].

Задача Лагранжа[править | править вики-текст]

Данная задача относится к вариационному исчислению и является одним из возможных обобщений классической задачи на условный экстремум. В задаче Лагранжа требуется найти непрерывно дифференцируемую функцию \vec x = \vec x(t),  заданную на отрезке [t_0, t_1]  и доставляющую экстремум (максимум или минимум) функционалу

J \;=\; \int\limits_{t_0}^{t_1} F\,(t, \vec x(t), \dot{\vec x}(t))\,\, {\rm d}t

(точкой обозначена операция дифференцирования по t)  при фиксированных граничных условиях  \vec x(t_0) = {\vec x}_0,  \vec x(t_1) = {\vec x}_1  и выполнении уравнений связей

f_{i}\,(t, \vec x(t), \dot{\vec x}(t)) \,=\, 0\,,

где i = 1,2,\dots,m [8][9].

В данной задаче также применим метод множителей Лагранжа. Предполагая уравнения связей независимыми, вводят в рассмотрение m неизвестных функций \lambda_{1}(t),\dots,\lambda_{m}(t)  и сводят исходную задачу к задаче безусловной оптимизации, заменяя подынтегральную функцию функцией

\Phi \,=\, F\,(t, \vec x(t), \dot{\vec x}(t)) \,+\, \sum_{i=1}^m\lambda_i(t)\,f_{i}\,(t, \vec x(t), \dot{\vec x}(t))\,;

в качестве аналога равенств (**) (т. e. в роли необходимых условий экстремума) теперь выступают уравнения Эйлера — Лагранжа, имеющие в рассматриваемом случае вид

\frac{{\rm d}}{{\rm d}t} \frac{\partial \Phi}{\partial \dot{x}_k} - \frac{\partial \Phi}{\partial x_k} \,=\, 0\,,

где k = 1,2,\dots,n.  Из этих n обыкновенных дифференциальных уравнений, дополненных уравнениями связей, находят (с учётом имеющихся граничных условий) n+m неизвестных функций x_{1}(t),\dots,x_{n}(t),\lambda_{1}(t),\dots,\lambda_{m}(t) [10].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

Литература[править | править вики-текст]