Вариационное исчисление

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Вариацио́нное исчисле́ние — раздел анализа, в котором изучаются вариации функционалов. Наиболее типичная задача — найти функцию, на которой заданный функционал достигает экстремального значения.

Методы вариационного исчисления широко применяются в различных областях математики. Например, в дифференциальной геометрии с их помощью ищут геодезические линии и минимальные поверхности. В физике вариационный метод — одно из мощнейших орудий получения уравнений движения (см. например Принцип наименьшего действия), как для дискретных, так и для распределённых систем, в том числе и для физических полей. Методы вариационного исчисления применимы и в статике (см. Вариационные принципы).

Термины и определения[править | править вики-текст]

Важнейшими понятиями вариационного исчисления являются следующие:

  • вариация (первая вариация),
  • вариационная производная (первая вариационная производная),
  • кроме первой вариации и первой вариационной производной, рассматриваются и вариации и вариационные производные второго и высших порядков.

Никак не связана с вариационным вычислением совпадающая по названию вариация функции в анализе.

Термин варьирование (варьировать) — применяется в вариационном исчислении для обозначения нахождения вариации или вариационной производной (это аналог термина дифференцирование для случая бесконечномерного аргумента, являющегося предметом вариационного исчисления). Также нередко для краткости (особенно в приложениях) термин варьирование применяется для обозначения решения вариационной задачи, сводимой к нахождению вариационной производной и приравнивания её нулю.

Вариационная задача означает, как правило, нахождение функции (в рамках вариационного исчисления — уравнения на функцию), удовлетворяющей условию стационарности некоторого заданного функционала, то есть такой функции, (бесконечно малые) возмущения которой не вызывают изменения функционала по крайней мере в первом порядке малости. Также вариационной задачей называют тесно связанную с этим задачу нахождения функции (уравнения на функцию), на которой данный функционал достигает локального экстремума (во многом эта задача сводится к первой, иногда практически полностью). Обычно при таком употреблении терминов подразумевается, что задача решается методами вариационного исчисления.

Типичными примерами вариационной задачи являются изопериметрические задачи в геометрии и механике; в физике — задача нахождения уравнений поля из заданного вида действия для этого поля.

История[править | править вики-текст]

Ещё в античные времена появились первые вариационные проблемы, относящиеся к категории изопериметрических задач — например, задача Дидоны. Древнегреческим математикам уже было известно[1]:

  1. Из всех фигур с заданным периметром наибольшую площадь имеет круг.
  2. Из всех многоугольников с заданным числом сторон и заданным периметром наибольшую площадь имеет правильный многоугольник.
  3. Из всех тел с заданной площадью поверхности наибольший объём имеет шар. Аналогичную задачу для шаровых сегментов решил Архимед, а Зенодор во II веке до н. э. написал книгу «Об изопериметрических фигурах» (сохранились обширные цитаты из неё в трудах других авторов).

Первый вариационный принцип сформулировал для траекторий отражённых световых лучей Герон Александрийский в работе «Катоптрика» (I век н. э.)[2].

В средневековой Европе изопериметрическими задачами занимались И. Сакробоско (XIII век) и Т. Брадвардин (XIV век). После разработки анализа появились новые типы вариационных задач, в основном механического характера. Ньютон в «Математических началах натуральной философии» (1687) решает задачу: найти форму тела вращения, обеспечивающую наименьшее сопротивление при движении в газе или жидкости (при заданных размерах). Важной исторической задачей, давшей толчок к развитию современного варианта вариационного исчисления, стала задача о брахистохроне (1696). Её быстрое решение сразу несколькими математиками показало огромные возможности новых методов. Среди других задач стоит отметить определение формы цепной линии (то есть формы равновесия тяжёлой однородной нити, 1690 год). Общих методов решения вариационных задач в этот период ещё не существовало, каждая задача решалась с помощью остроумных (и не всегда безупречных) геометрических рассуждений.

Пьер Ферма сформулировал основной принцип геометрической оптики, в силу которого свет в неоднородной среде выбирает путь, занимающий наименьшее время. В 1746 году Мопертюи обобщил это правило, введя в науку первый принцип наименьшего действия.

Решающий вклад в развитие вариационного исчисления внесли Леонард Эйлер и Жозеф Лагранж. Эйлеру принадлежит первое систематическое изложение вариационного исчисления и сам термин (1766 год). Лагранж независимо получил (с 1755 года) многие основополагающие результаты и ввёл понятие вариации.

На этом этапе были выведены уравнения Эйлера — Лагранжа. Они представляют собой необходимое условие экстремума, ставшее аналитическим фундаментом вариационных методов. Вскоре, однако, выяснилось, что решения этих уравнений не во всех случаях дают реальный экстремум, и встала задача найти достаточные условия, гарантирующие экстремум. Первое глубокое исследование (второй вариации) предпринял Лежандр, однако Лагранж обнаружил в его работе ошибку. Результаты Лежандра уточнил и дополнил Якоби (1837), затем его ученик Гессе (1857) и позднее Вейерштрасс. Сейчас эти достаточные условия называются уравнениями Якоби[3].

Неформальное обсуждение[править | править вики-текст]

Содержанием вариационного исчисления является обобщение понятия дифференциала и производной функции конечномерного векторного аргумента на случай функционала — функции, областью определения которой служит некое множество или пространство функций, а значения лежат в множестве вещественных, либо комплексных чисел.

  • Всюду ниже в этом параграфе подразумевается, что функции и функционалы обладают необходимой гладкостью, то есть вопрос существования тех или иных производных специально не рассматривается, тем более что во многих конкретных задачах этот вопрос не имеет практического значения (нужная гладкость заведомо есть).

Функционал \Phi[f] ставит в соответствие каждой конкретной функции f из его области определения — определённое число.

Нетрудно написать для функционала аналоги дифференциала и производной по направлению.

Вариация[править | править вики-текст]

Аналогом дифференциала (первого дифференциала) является в вариационном исчислении вариация (первая вариация):

\delta\Phi=\Phi[f+\delta f]-\Phi[f]

(как и в случае дифференциала имеется в виду линейная часть этого приращения, а выражаясь традиционным образом — \delta f выбирается бесконечно малой, и при вычислении разности отбрасываются бесконечно малые высших порядков). При этом \delta f — играющее роль дифференциала или малого приращения независимой переменной — называется вариацией f.

Как видим, \delta\Phi сама в свою очередь является функционалом, так как она, вообще говоря, различна для разных f (также и для разных \delta f).

Таким образом, это — в применении к функционалам — прямой аналог дифференциала функции конечномерного (в том числе одномерного) аргумента:

dy=y(x+dx)-y(x)

— точно так же понимаемого как линейная часть приращения функции y при бесконечно малом приращении аргумента x (или линейный член при разложении y по степеням dx вблизи точки x).

Производная по направлению[править | править вики-текст]

(Производная Гато) Производной функционала \Phi в точке f по направлению g, очевидно, будет

\frac{d\Phi[f+\alpha g]}{d\alpha}\bigg|_{\alpha=0}.

Этого в принципе уже достаточно для решения типичной вариационной задачи — нахождения «стационарных точек», то есть таких функций f, для которых первая вариация или производная по направлению обращается в ноль для любой бесконечно малой \delta f или любой конечной g. Именно эти «точки» в пространстве функций — то есть именно такие функции — являются кандидатами в экстремали (проверку того, действительно ли они являются экстремалями, то есть достигается ли на них локальный экстремум, надо делать отдельно, как и в случае функций конечномерного аргумента; интересно, что во многих задачах физики важнее найти не экстремали, а именно стационарные точки).

Вариационная производная[править | править вики-текст]

Для интегральных функционалов, которые являются очень важным для математики и приложений случаем, можно ввести не только аналог дифференциала и производную по направлению, но и производную Фреше — аналог конечномерного градиента, называемую вариационной производной.

То есть, в полной аналогии с конечномерным случаем, когда

\vec{dy}=\big(\vec\nabla y,\;d\vec x\big)=\left(\frac{dy}{d\vec x},\;d\vec x\right)=\sum_i\partial_i y\,dx_i,

где \vec\nabla y — обозначение градиента (или производной Фреше) функции y, а (\;,\;) — скалярное произведение; \partial_i — оператор частной производной по i-той координате, сумма представляет собой полный дифференциал.

Для функционала имеем

\delta\Phi=\left(\frac{\delta\Phi}{\delta f},\;\delta f\right)=\int\frac{\delta\Phi}{\delta f}(x)\delta f(x)\,dx,

где \frac{\delta\Phi}{\delta f} — обозначение вариационной производной \Phi, а суммирование конечномерной формулы естественно заменено интегрированием.

Итак,

\frac{\delta\Phi}{\delta f} — стандартное обозначение вариационной производной. Это также некая функция как от x, так и f (вообще говоря, это обобщённая функция, но эта оговорка выходит за рамки рассмотрения, так как предполагается, что все функции и функционалы сколь угодно гладки и не имеют особенностей).

Иными словами, если можно представить вариацию

\delta\Phi=\Phi[f+\delta f]-\Phi[f]

в виде

\delta\Phi=\int A(x)\delta f(x)\,dx, где A — некоторая функция x,

то A есть вариационная производная \Phi по f («по f» здесь означает, что остальные аргументы или параметры не меняются; речевой оборот «по f» можно опустить в случае, когда точно определено, функционалом от какой функции рассматривается \Phi, что на практике может быть не ясным из самой его формулы, в которую могут входить и другие параметры и функции — см. также ниже). То есть

\frac{\delta\Phi}{\delta f} = A.

Легко видеть, что это определение обобщается на любую размерность интеграла. Для n-мерного случая верна прямо обобщающая одномерный случай формула:

\delta\Phi=\int\limits_\Omega\left(\frac{\delta\Phi}{\delta f}\right)\delta f(x)\,d^nx.

Так же легко обобщается понятие вариационной производной на случай функционалов от нескольких аргументов[4]:

\delta\Phi[f,\;g,\;\ldots]=\int\limits_\Omega\left(\frac{\delta\Phi}{\delta f}\delta f(x)+\frac{\delta\Phi}{\delta g}\delta g(x)+\ldots\right)\,d\Omega.

Вариации и вариационные производные второго и высших порядков[править | править вики-текст]

Как это описано выше для первого порядка, можно ввести понятие второй вариации и второй вариационной производной функционала, а также n-ой вариации и n-ой вариационной производной:

\delta^2\Phi,\;\frac{\delta^2\Phi[f]}{\delta f^2},\;\delta^n\Phi,\;\frac{\delta^n\Phi[f]}{\delta f^n}.

Для функционалов, зависящих от нескольких функций, можно также ввести понятие смешанных вариационных производных разного порядка, например:

\frac{\delta^3\Phi[f,\;g]}{\delta f^2\delta g}.

Здесь мы не будем останавливаться на этом подробно, всё делается полностью аналогично введению соответствующих дифференциалов и производных для функции конечномерного аргумента.

Функционал вблизи конкретной точки в пространстве функций раскладывается в ряд Тейлора, если, конечно, вариационные производные всех порядков существуют. Как и в конечномерных случаях, сумма конечного числа членов этого ряда даёт значение функционала с определённой точностью (соответствующего порядка малости) лишь при небольших отклонениях его аргумента (при бесконечно малых). Кроме того, как и в случае функций конечномерного аргумента, ряд Тейлора (сумма всех членов) может не сходиться к функционалу, в него разложенному, при любых ненулевых конечных смещениях, хотя такие случаи достаточно редки в приложениях.

Применение вариационного исчисления[править | править вики-текст]

Хотя задачи, к которым применимо вариационное исчисление, заметно шире, в приложениях они главным образом сводятся к двум основным задачам:

  1. нахождение точек в пространстве функций, на котором определён функционал — точек стационарного функционала, стационарных функций, линий, траекторий, поверхностей и т. п., то есть нахождение для заданного \Phi[f] таких f, для которых \delta\Phi=0 при любом (бесконечно малом) \delta f, или, иначе, где \frac{\delta\Phi}{\delta f}=0,
  2. нахождение локальных экстремумов функционала, то есть в первую очередь определение тех f, на которых \Phi[f] принимает локально экстремальные значения — нахождение экстремалей (иногда также определение знака экстремума).

Очевидно, обе задачи тесно связаны, и решение второй сводится (при должной гладкости функционала) к решению первой, а затем проверке, действительно ли достигается локальный экстремум (что делается независимо вручную, или — более систематически — исследованием вариационных производных второго и, если все они одного знака и хотя бы одна из них равна нулю, то и более высокого порядка). В описанном процессе выясняется и тип экстремума. Нередко (например, когда функция стационарного функционала единственная, а все изменения функционала при любом большом возмущении имеют один и тот же знак) решение вопроса, экстремум ли это и какого он типа, заранее очевидно.

При этом очень часто задача (1) оказывается не менее или даже более важной, чем задача (2), даже когда классификация стационарной точки неопределённа (то есть она может оказаться минимумом, максимумом или седловой точкой, а также слабым экстремумом, точкой, вблизи которой функционал точно постоянен или отличается от постоянного в более высоком порядке, чем второй). Например, в механике (и вообще в физике) кривая или поверхность стационарной потенциальной энергии означает равновесие, а вопрос, является ли она экстремалью, связан лишь с вопросом об устойчивости этого равновесия (который далеко не всегда важен). Траектории стационарного действия отвечают возможному движению, независимо от того, минимально действие на такой траектории, максимально, или седловидно. То же можно сказать о геометрической оптике, где любая линия стационарного времени (а не только минимального, как в простой формулировке принципа наименьшего времени Ферма) соответствует возможному движению светового луча неоднородной оптической среде. Есть системы, где вообще нет экстремалей, но стационарные точки существуют.

Способы нахождения условных экстремумов и условных стационарных точек (см. ниже) делают вариационное исчисление ещё более мощным орудием решения обеих задач.

Техника варьирования[править | править вики-текст]

Главным и обычным техническим приемом при нахождении вариационной производной интегрального функционала \Phi[f], в подынтегральное выражение которого входит не только значение функции f в точке x, но и значения ее производных, то есть не только f(x), но и df/dx, d^2f/dx^2 и так далее (в принципе могут входить производные любого порядка, хотя в практических задачах порядки выше второго, встречаются гораздо реже, а чаще всего порядок производных не выше первого; производные же какого-то порядка входят в практически интересные функционалы едва ли не всегда: например, такой функционал, как длина кривой, содержит производные первого порядка, а потенциальная энергия изогнутого упругого стержня — производные по меньшей мере второго порядка), служит интегрирование по частям. Оно, вслед за достаточно прозрачной и очевидной записью выражения вариации функционала прямо по рецепту, описанному в статье выше, позволяет достичь цели: нахождения вариационной производной.

Само выражение для вариации функционала выписывается достаточно прямо и просто. Но при этом возникает одно типичное неудобство[5], заключающееся в том, что при этом в выражении \delta\Phi[f] появляются под интегралом не только члены с \delta f, но и с \delta(df/dx). Это неудобство устраняется интегрированием по частям.

Рассмотрим это сначала на простом частном примере, а затем на общем.

Пример: Пусть требуется найти вариационную производную функционала

\Phi[f]=\int\limits_1^2\left((f'(x))^2+(f(x))^3\right)\,dx,

где штрихом обозначена производная по x, и найти f(x), для которых значение \Phi экстремально.

Нетрудно выписать

\delta\Phi=\delta\int\limits_1^2\left((f'(x))^2+(f(x))^3\right)\,dx=\int\limits_1^2\left(\delta\left((f'(x))^2\right)+\delta\left((f(x))^3\right)\right)\,dx=
=\int\limits_1^2\left(2f'(x)\delta(f'(x))+3(f(x))^2\delta f(x)\right)\,dx.

Очевидно, операцию взятия производной по x свободно можно поменять местами с операцией \delta. Тогда

\delta\Phi=\int\limits_1^2\left(2f'(x)(\delta f(x))'+3(f(x))^2\delta f(x)\right)\,dx.

Теперь, чтобы \delta f(x) не стояло под знаком производной, мешающим вынести за скобки \delta f(x) из обоих членов (оставшееся в скобках суть вариационная производная), надо в первом слагаемом воспользоваться интегрированием по частям:

\delta\Phi=\int\limits_1^2 2f'(x)(\delta f(x))'\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx=
=2f'(x)\delta f(x)\bigg|_1^2-\int\limits_1^2(2f'(x))'\delta f(x)\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx.

Теперь можно опять превратить сумму интегралов в один и вынести за скобки \delta f:

\delta\Phi=2f'(x)\delta f(x)\bigg|_1^2-\int\limits_1^2(2f'(x))'\delta f(x)\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx=
=2f'(x)\delta f(x)\bigg|_1^2+\int\limits_1^2\left(-(2f'(x))'\delta f(x)+3(f(x))^2\delta f(x)\right)\,dx=
=2f'(x)\delta f(x)\bigg|_1^2+\int\limits_1^2\left(-(2f'(x))'+3(f(x))^2\right)\delta f(x)\,dx,

оставив граничный член 2f'(x)\delta f(x)\bigg|_1^2=2f'(2)\delta f(2)-2f'(1)\delta f(1), стоящим отдельно.

Граничный член можно приравнять нулю[6], решив тем самым задачу нахождения вариационной производной (действительно, она по определению есть то, что стоит под интегралом в больших скобках, соответствовать определению мешает только граничный член). Объяснение факта равенства нулю граничного члена не слишком строго (см. примечание [6]), но ограничимся им, чтобы сосредоточить внимание на главном.

Для начала зафиксируем f в граничных точках, тогда граничный член исчезнет, так как \delta f должно будет при такой фиксации обращаться в ноль при x=1 и x=2. Для многих задач такая фиксация граничных условий имеет место изначально. При поиске экстремума и вариационной производной на классе функций с такими граничными условиями граничный член можно просто отбросить. Но если граничные условия не наложены самой задачей, их можно наложить искусственно, решить задачу для фиксированных условий, а затем среди множества решений для разных граничных условий можно выбрать оптимальное (это обычно не составляет труда). Короче говоря, решение задачи с обнулением граничного члена содержит в себе среди прочих и решение первоначальной задачи, нужно лишь сузить класс уже найденных решений, меняя f(1) и f(2) и подобрав среди них лучшее. (Более аккуратный и общий подход — см. ниже).

Таким образом, здесь под вариационной производной будем понимать вариационную производную по классу функций с фиксированными концами, которая (при поиске экстремали и в подобных задачах) будучи приравненной нулю, определяет поведение функции внутри отрезка [1;\;2]. В этом смысле, для нашего примера имеем:

\frac{\delta\Phi}{\delta f}=(-2f'(x))'+3(f(x))^2,

а необходимое условие экстремальности состоит в равенстве её нулю, то есть имеем уравнение для f:

-2f''(x)+3(f(x))^2=0.\

Решение этого дифференциального уравнения даст явный вид f(x), но задача нахождения решений дифференциального уравнения лежит уже за рамками вариационного исчисления. Задача последнего ограничена получением такого уравнения и, возможно, дополнительных условий, ограничивающих класс допустимых решений.

Пример в более общей записи: Пусть требуется найти вариационную производную функционала (предыдущий пример есть частный случай этого и может служить к нему иллюстрацией):

\Phi[f]=\int\limits_a^b L \left(f(x), f'(x), f''(x), ...)\right)\,dx,

где штрихом обозначена производная по x, двумя штрихами - вторая производная по x, и могут еще иметься производные высших порядков, обозначенные многоточием, и найти f(x), для которых значение \Phi экстремально. Здесь под L понимается некоторая (как правило, вполне определенная и конкретная для каждой конкретной задачи, как в примере выше, но здесь записанная для общности абстрактно) функция нескольких аргументов. Значения производных функции f в каждой точке области интегрирования (которая здесь обозначена как отрезок, но может представлять собой и всю числовую ось) подставляются как аргументы в L, после чего производится интегрирование по x.

Нетрудно выписать

\delta\Phi=\delta\int\limits_a^b L \left(f(x), f'(x), f''(x), ...)\right)\,dx =
= \int\limits_a^b\left( \frac{\partial L}{\partial f}\delta f(x)
 + \frac{\partial L}{\partial f'}\delta f'(x)
 + \frac{\partial L}{\partial f''}\delta f''(x) + ... \right)\,dx,

где под частными производными \frac{\partial L}{\partial f}, \frac{\partial L}{\partial f'}, \frac{\partial L}{\partial f''} итд подразумеваются просто частные производные функции L по ее соответствующим аргументам, то есть в этой записи под f, f', f'' понимаются просто соответствующие параметры (смысл же - нахождение бесконечно малой разности между

L \left(f(x) + \delta f(x), (f(x) + \delta f(x))', (f(x) + \delta f(x))'', ...\right)

и

L \left(f(x), f'(x), f''(x), ...\right).

Очевидно, операцию взятия производной по x свободно можно поменять местами с операцией \delta, как это подробно разобрано в примере выше. Поэтому здесь мы просто не ставим скобок, указывающих порядок этих операций в выражениях \delta f'(x), \delta f''(x) итд.

Теперь, чтобы \delta f(x) не стояло под знаком производной, мешающего вынести за скобки \delta f(x) из всех членов подынтегрального выражения (оставшееся в скобках - и будет вариационная производная), надо (представив интегралл суммы как сумму интегралов) ко второму слагаемому применить интегрированием по частям, к третьему - применить интегрирование по частям два раза, к дальнейшим, содержащим высшие производные (которые тут обозначены многоточием) применять интергрирование по частям три и более раз, пока все штрихи не уйдут с \delta f'''(x) итд:

\int\limits_a^b\left( \frac{\partial L}{\partial f}\delta f(x)
 + \frac{\partial L}{\partial f'}\delta f'(x)
 + \frac{\partial L}{\partial f''}\delta f''(x) + ... \right)\,dx
=  \int\limits_a^b \frac{\partial L}{\partial f}\delta f(x)\,dx
 + \int\limits_a^b \frac{\partial L}{\partial f'}\delta f'(x)\,dx
 + \int\limits_a^b \frac{\partial L}{\partial f''}\delta f''(x)\,dx
 + ...\, =
= \int\limits_a^b \frac{\partial L}{\partial f}\delta f(x)\,dx

 + \frac{\partial L}{\partial f'} \delta f(x) \bigg|_a^b
 - \int\limits_a^b \bigg(\frac{\partial L}{\partial f'}\bigg)' \delta f(x)\,dx

 + \frac{\partial L}{\partial f''} \delta f'(x) \bigg|_a^b
 - \bigg(\frac{\partial L}{\partial f''}\bigg)' \delta f(x) \bigg|_a^b
 + \int\limits_a^b \bigg(\frac{\partial L}{\partial f''}\bigg)''\delta f(x)\,dx

 + ...

Теперь можно опять превратить сумму интегралов в один и вынести за скобки \delta f:

\delta \Phi =

 \frac{\partial L}{\partial f'} \delta f(x) \bigg|_a^b
 + \frac{\partial L}{\partial f''} \delta f'(x) \bigg|_a^b
 - \bigg(\frac{\partial L}{\partial f''}\bigg)' \delta f(x) \bigg|_a^b
 + ...

+ \int\limits_a^b
\bigg(
 \frac{\partial L}{\partial f}
 - \bigg(\frac{\partial L}{\partial f'}\bigg)'
 + \bigg(\frac{\partial L}{\partial f''}\bigg)''
 + ...
\bigg)
\delta f(x)\,dx

оставив граничный член стоящим отдельно. Граничный член можно приравнять нулю, как это описано и объяснено в частном примере выше, а также - более аккуратно - в отдельных параграфах ниже, посвященных отдельно вопросам, связанным с граничным членом.

Таким образом, здесь под вариационной производной будем понимать вариационную производную по классу функций с фиксированными концами, которая (при поиске экстремали и в подобных задачах) будучи приравненной нулю, определяет поведение функции внутри отрезка [a;\;b]. В этом смысле, для нашего примера имеем:

\frac{\delta\Phi}{\delta f}=\frac{\partial L}{\partial f}
 - \bigg(\frac{\partial L}{\partial f'}\bigg)'
 + \bigg(\frac{\partial L}{\partial f''}\bigg)''
 + ...
,

а необходимое условие экстремальности состоит в равенстве её нулю, то есть имеем уравнение для f:

\frac{\partial L}{\partial f}
 - \bigg(\frac{\partial L}{\partial f'}\bigg)'
 + \bigg(\frac{\partial L}{\partial f''}\bigg)''
 + ...
=0.\
  • (Подставив сюда конкретный вид функции L, получаем вместо этой записи конкретное уравнение, например, подставив в этот общий вид уравнения функцию в соответствии с частным примером, разобранным выше, а именно L(f,f') = f^3 + f'^2,\ получим и соответствующий тому примеру частный вид уравнения, т.к. здесь \frac{\partial L}{\partial f} = 3 f, \frac{\partial L}{\partial f'} = 2 f', а производных второго и высших (обозначенных многоточием) порядков - просто нет - они все равны нулю).

Решение же такого дифференциального уравнения, как уже было сказано выше, в принципе дает явный вид f(x), что, впрочем лежит за рамками вариационного исчисления, ограничивающегося получением дифференциального уравнения и, возможно, дополнительных условий, ограничивающих класс допустимых решений (в связи с анализом граничного члена).

Использование обобщённых функций[править | править вики-текст]

В этом разделе рассматривается такой частный, но практически важный, случай применения обобщённых функций при решении вариационных задач, как использование дельта-функции Дирака.

Использование \delta-функции (не следует путать ее обозначение \delta(x) с символом вариации!), как и использование обобщённых функций вообще, позволяет значительно расширить класс функционалов, которые могут быть записаны в форме интегральных функционалов, и к которым, следовательно, применимы основные приёмы варьирования (описанные выше). При этом в число функционалов, записываемых в такой форме, попадают такие практически важные функционалы, как краевые функционалы, что сильно облегчает работу с ними и делает её систематичной.

  • Для облегчения восприятия данного раздела, будем выделять дельта-функцию жирным шрифтом: \boldsymbol\delta — чтобы отличать от символа вариации.

Рассмотрим простой пример. Пусть надо найти функцию f(x), минимизирующую функционал W[f]=\frac{1}{2}\int\limits_0^1(f'(x))^2\,dx притом, что на неё наложены условия f(0)=10,\;f(1)=20.

Для того, чтобы было удобно решать эту задачу, наложенные условия полезно записать в виде \Gamma_0[f]=10,\;\Gamma_1[f]=20 (в этом случае, \Gamma_0[f]=f(0),\;\Gamma_1[f]=f(1) суть функционалы). Не ограничиваясь этим, используя основное свойство дельта-функции, запишем \Gamma_0 и \Gamma_1 в интегральной форме:

\Gamma_0[f]=\int\limits_{-\infty}^{+\infty}\boldsymbol\delta(x-0)f(x)\,dx,
\Gamma_1[f]=\int\limits_{-\infty}^{+\infty}\boldsymbol\delta(x-1)f(x)\,dx.

Теперь можно (расширив область интегрирования в определении W, хотя бы на бесконечно малую величину, за пределы отрезка [0;1]) свободно складывать и вычитать[7] функционалы W,\;\Gamma_0,\;\Gamma_1, что позволяет формально просто свести решение исходной задачи к задаче об условном экстремуме функционала (см. ниже), сводящейся к отысканию экстремума нового функционала V=W-\lambda_0\Gamma_0-\lambda_1\Gamma_1 с постоянными множителями \lambda_0,\;\lambda_1, конкретные значения которых после решения задачи по отысканию минимума V нужно подобрать, решив соответствующие алгебраические уравнения. Таким образом, граничные условия будут удовлетворены. А главное, функционал V при этом будет иметь вполне прозрачную интегральную форму, удобную для варьирования.

Сходный приём удобен при наложении на искомую функцию не граничных условий, а условий удовлетворения некоторому уравнению в каждой точке x.

Условные экстремумы[править | править вики-текст]

  • Для краткости будем говорить в этом разделе об условных экстремумах, однако всё здесь написанное ра́вно приложимо к нахождению стационарных точек вообще.

Условным экстремумом называется экстремум не на всей области определения функции (функционала), а на определённом её подмножестве, выделяемом специально наложенным условием (или условиями). Обычно, речь идёт о выделении этим условием (условиями) подмножества области определения с меньшей размерностью, что для конечномерных областей имеет определённый наглядный смысл, но для бесконечномерных (каковы обычно области определения функционалов) налагаемые условия приходится рассматривать лишь абстрактно (что теоретически не мешает иметь в виду полезную аналогию с конечномерным случаем).

Пусть надо найти экстремум функционала \Phi[f] при некотором наложенном условии.

Основные виды задачи на условный экстремум, которые имеет смысл рассмотреть, таковы:

  1. Надо найти экстремум функционала U[f]\ при условии равенства нулю другого функционала V[f]=0\ ; (то, что в правой части нуль, не нарушает общности).
  2. Надо найти экстремум функционала U[f]\ при условии V_1[f]=0,\;V_2[f]=0,\;\ldots,\;V_N[f]=0.
  3. Надо найти экстремум функционала U[f]\ при условии выполнения для f\ уравнения v(f,\;f',\;f'',\;\ldots,\;f^{(n)})=0, где v\  — некоторая функция f\ и/или производных f\ , обозначенных штрихами.

(Третий тип условия выписан здесь не в самом общем виде, но для наших целей этого достаточно.)

К первым двум случаям практически прямо (на принятом сейчас нами уровне строгости нет смысла проводить тут границу между случаем функций конечномерного аргумента, и функционалами) применим метод неопределенных множителей Лагранжа. А именно, для нахождения условного экстремума U[f]\ при наложении соответствующих условий, нужно решить вариационную задачу для функционала \hat U[f] = U[f] - \lambda V[f] в первом и \hat U[f] = U[f] - \lambda_1 V_1[f] - \lambda_2 V_2[f]- \dots - \lambda_N V_N[f] во втором случае, а затем подобрать (решив уравнение d \hat U/ d \lambda = 0 в первом случае и N уравнений с частными производными по каждому из \lambda_i во втором) такие \lambda, которые реализуют минимум в найденном семействе функций f, для которого эти \lambda являются параметрами. То есть, что касается вариационного исчисления, то ключевым моментом является нахождение и приравнивание нулю вариации (или вариационной производной) для некоего нового функционала \hat U[f], для этих двух случаев:

  1. \delta \hat U = \delta (U - \lambda V) = 0,
  2. \delta \hat U = \delta (U - \lambda_1 V_1- \lambda_2 V_2 - \dots - \lambda_N V_N) = \delta (U - \sum_i\lambda_i V_i) = 0,

Третий же случай рассмотрим здесь для интегрального функционала U[f] = \int\limits_\Omega \dots d\Omega. Тогда нахождение условного экстремума сводится сначала к варьированию функционала

\hat U[f] = U[f] -  \int\limits_\Omega \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)})d\Omega
\int\limits_\Omega \bigg( \dots - \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)}) \bigg)d\Omega,

где x — переменная, принадлежащая области интегрирования \Omega (одномерной или n-мерной), а \lambda(x) — некая неопределенная функция x, которая войдет в уравнение, полученное после вычисления вариационной производной и приравнивания ее нулю.

Обоснованием такого решения для случая 3 может служить представление для каждой точки x_0 из \Omega выполнения равенства v(f(x_0), f'(x_0), \dots, f^{(n)}(x_0)) = 0 в x_0 как приравнивание нулю функционала V_{x_0} = \int\limits_\Omega \delta(x-x_0) \lambda(x_0) v(f,\;f',\;f'',\;\ldots,\;f^{(n)})d\Omega с использованием дельта-функции Дирака. Далее можно считать на рассматриваемом здесь неформальном уровне очевидным, что задача стала аналогичной варианту 2, и, после суммирования по всем x_0, ее решение сводится к описанному выше.

Таким образом, ключевой момент с точки зрения вариационного исчисления в нахождении условного экстремума третьего типа сводится к

3.\delta \hat U = \delta \int\limits_\Omega \bigg( \dots - \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)}) \bigg)d\Omega = 0.


Уравнение Эйлера — Лагранжа[править | править вики-текст]

Одним из основных классических результатов вариационного исчисления, имеющих огромное практическое значение, являются уравнения Эйлера — Лагранжа — дифференциальные уравнения, которым должна удовлетворять функция, являющаяся стационарной для довольно общего в своем классе и очень важного вида интегрального функционала (а значит и функция, на которой такой функционал достигает локального экстремума, также должна удовлетворять этим уравнениям).

Достаточно стандартным для получения уравнений Эйлера — Лагранжа является обычный путь с нахождением вариационной производной и приравнивании ее нулю или практически совпадающий с ним способ выписывания вариации с использованием стандартных обозначений, как это описано выше.

Здесь же для расширения типов примеров приводится вывод уравнений Эйлера — Лагранжа с использованием производной функционала по направлению.

Вывод с использованием производной по направлению. Частный пример[править | править вики-текст]

Для гладких функций вещественной переменной или конечномерного векторного аргумента максимум и минимум заданной функции может быть найден путём нахождения точек, в которых производная обращается в нуль (по крайней мере, это необходимое условие экстремума). Аналогично решение гладких задач вариационного исчисления может быть получено путём решения соответствующего уравнения Эйлера — Лагранжа.

Чтобы проиллюстрировать этот процесс, рассмотрим сначала конкретную задачу нахождения кратчайшей кривой на плоскости, соединяющей две точки (x_1,\;y_1) и (x_2,\;y_2). Длина кривой определяется выражением

A[f]=\int\limits_{x_1}^{x_2}\sqrt{1+[f'(x)]^2}\,dx,

где

f'(x)=\frac{df}{dx},

и где y=f(x), f(x_1)=y_1 и f(x_2)=y_2. Функция f должна иметь хотя бы одну производную. Если f_0 — локальный минимум и f_1 — подходящая функция, обращающаяся в нуль в граничных точках  x_1 и x_2 и имеющая хотя бы первую производную, тогда мы получим

A[f_0]\leqslant A[f_0+\varepsilon f_1]

для любого \varepsilon, близкого к 0. Следовательно, производная A[f_0+\varepsilon f_1] по \varepsilon (соответствующая, с точностью до ненулевого множителя, первой вариации A, вычисленной через производную по направлению) должна обращаться в нуль при \varepsilon=0 для любой функции f_1. Таким образом,

\int\limits_{x_1}^{x_2}\frac{f_0'(x)f_1'(x)}{\sqrt{1+[f_0'(x)]^2}}\,dx=0

при любом выборе функции f_1. Если предположить, что f_0 имеет вторую непрерывную производную, тогда можно воспользоваться формулой интегрирования по частям:

\int\limits_a^b u(x)v'(x)\,dx=u(x)v(x)\bigg|_a^b-\int\limits_a^b u'(x)v(x)\,dx.

После замены

u(x)=\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}},\quad v'(x)=f_1'(x),

получается

u(x)v(x)\bigg|_{x_1}^{x_2}-\int\limits_{x_1}^{x_2} f_1(x)\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]\,dx=0,

но первое слагаемое обращается в нуль, поскольку v(x)=f_1(x) было выбрано таким образом, чтобы обращаться в нуль в точках x_1 и x_2. Следовательно,

\int\limits_{x_1}^{x_2} f_1(x)\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]\,dx=0

для любой дважды дифференцируемой функции f_1, которая обращается в нуль на концах интервала. Это особый случай основной леммы вариационного исчисления:

I=\int\limits_{x_1}^{x_2} f_1(x)H(x)\,dx=0

для любой дифференцируемой функции f_1(x), которая обращается в нуль на концах интервала. Поскольку f_1(x) есть произвольная функция в интервале интегрирования, можно сделать вывод, что H(x)=0. Тогда,

\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]=0.

Из этого уравнения следует, что

\frac{d^2f_0}{dx^2}=0.

Таким образом, экстремумом в нашей задаче являются отрезки прямых линий.

  • Легко заметить, что этот способ практически совпадает с обычным (использующим стандартные обозначения), если заменить \varepsilon f_1 на \delta f\ .

Вывод с использованием производной по направлению. Более общий случай[править | править вики-текст]

Подобные же вычисления можно провести и в общем случае[8], когда

A[f]=\int\limits_{x_1}^{x_2} L(x,\;f,\;f')\,dx

и f должна иметь две непрерывные производные. Повторяя рассуждения, находим экстремаль f_0, принимаем f=f_0+\varepsilon f_1, находим производную по \varepsilon, затем подставляем \varepsilon=0:

\left.\frac{dA}{d\varepsilon}\right|_{\varepsilon=0}=\int\limits_{x_1}^{x_2} \left.\frac{dL}{d\varepsilon}\right|_{\varepsilon=0}\,dx=
=\int\limits_{x_1}^{x_2}\left(\frac{\partial L}{\partial f}f_1+\frac{\partial L}{\partial f'}f'_1\right)\,dx=\int\limits_{x_1}^{x_2}\left(\frac{\partial L}{\partial f}f_1-f_1\frac{d}{dx}\frac{\partial L}{\partial f'}\right)\,dx+\left.\frac{\partial L}{\partial f'}f_1\right|_{x_1}^{x_2}=
=\int\limits_{x_1}^{x_2}f_1\left(\frac{\partial L}{\partial f}-\frac{d}{dx}\frac{\partial L}{\partial f'}\right)\,dx=0.

Наконец, в силу основной леммы вариационного исчисления можно заключить, что функция L должна удовлетворять уравнению Эйлера — Лагранжа

-\frac{d}{dx}\frac{\partial L}{\partial f'}+\frac{\partial L}{\partial f}=0.

В общем случае, это уравнение является обыкновенным дифференциальным уравнением второго порядка, решив которое, можно найти экстремаль f.

Уравнение Эйлера — Лагранжа является необходимым, но не достаточным условием наличия экстремума. Дополнительные условия формулируются отдельно.

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Рыбников, 1949, с. 356-378
  2. Рыбников, 1949, с. 377-378
  3. Вторая вариация функционала. Достаточное условие минимума функционала.
  4. Формально можно свести функционал нескольких аргументов \Phi_n[f_1,\;f_2,\;\ldots,\;f_n], использовав функцию с множеством значений в n-мерном пространстве: f(x):=(f_1(x),\;f_2(x),\;\ldots,\;f_n(x)), к функционалу, зависящему от одной этой новой функции \Phi_1[f], но чисто технически нередко бывает удобнее использовать первоначальный вариант без изменений, так как при конкретных вычислениях всё сводится в конечном счёте к покомпонентному расчёту, когда все f_1(x),\;f_2(x),\;\ldots,\;f_n(x) — вещественнозначные (в крайнем случае, комплекснозначные) функции.
  5. Неудобство тут прежде всего в том, что производные мешают вынести все \delta f за скобки, приведя \delta\Phi к виду \int(\ldots)\delta f(x)\,dx, что и означает нахождение вариационной производной (которая есть всё, что стоит в скобках и обозначено многоточием). Но даже если функционал таков, что производная легко выносится за скобки, то есть вариацию можно представить в виде \int(\ldots)\delta\frac{df(x)}{dx}\,dx, то от дифференцирования \delta f всё равно необходимо избавиться. Это необходимо, исходя из тех соображений, что по определению (и по смыслу) при вариационной производной под интегралом должно стоять только \delta f, и что df/dx оказывается уже не «любой» функцией x. В противном случае, при поиске экстремума, может найтись неучтённое направление, по которому \delta\Phi\ne 0. То, что df/dx — уже не любая функция, легко увидеть при наложении граничных условий. Как описано в статье, это затруднение легко разрешаемо.
  6. 1 2 Используя дельта-функцию, можно получить более строгий результат сразу с учётом граничного члена, но здесь, для упрощения изложения, обойдёмся таким подходом.
  7. Конечно, операция сложения и вычитания функционалов в принципе определена независимо от формы их записи, однако использование одинаковой формы сводит ее к совершенно автоматической, прозрачной и технически удобной, так как всё теперь сводится просто к сложению интегралов по одной и той же области, а значит — к сложению подынтегральных выражений.
  8. Здесь явно разобран случай, где функция Лагранжа L имеет аргументами всего одну функцию f и одну её первую производную (этот случай наиболее важен практически), причём интегрирование ведётся по одной вещественной переменной. Однако теорема и доказательство достаточно легко и прямо обобщаются на любое конечное число аргументов, любой конечный порядок по производным, и на формулировку с интегрированием по конечномерной области.

Литература[править | править вики-текст]

  • Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979
  • Афанасьев В. Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. — М.: Высшая школа, 2003. — 614 с. — ISBN 5-06-004162-X.
  • Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия: Методы и приложения. — М.: Наука, 1979
  • Зейферт Г., Трельфалль В. Вариационное исчисление в целом 2-е изд., — М.: РХД, 2000
  • Краснов М. Л., Макаренко Г. И., Киселев А. И. Вариационное исчисление, задачи и упражнения. — М.: Наука, 1973
  • Петров Ю. П. Из истории вариационного исчисления и теории оптимальных процессов // Историко-математические исследования. — М.: Наука, 1990. — № 32/33. — С. 53-73..
  • Рыбников К. А. Первые этапы развития вариационного исчисления // Историко-математические исследования. — М.-Л.: ГИТТЛ, 1949. — № 2. — С. 355-498.
  • Фейнман Р., Лейтон Р., Сэндс М. Фейнмановские лекции по физике. Том 6: Электродинамика. Перевод с английского (издание 3). — Эдиториал УРСС. — ISBN 5-354-00704-6. — глава 19: Принцип наименьшего действия. (Очень простое, неформальное и наглядное введение в технику варьирования на примере принципа наименьшего действия; рекомендуется для старших школьников и, быть может, студентов младших курсов).
  • Фоменко А. Т. Вариационные методы в топологии. — М.: Наука, 1982
  • Эльсгольц Л. Э. Дифференциальные уравнения и вариационное исчисление. — М.: Наука, 1969.