Функциональная производная

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

В математике и теоретической физике, функциональная производная является обобщением производной по направлению. Разница заключается в том, что для последней дифференцирование производится в направлении какого-нибудь вектора, а для первой речь идёт о функции. Оба эти понятия можно рассматривать как обобщение обычного дифференциального исчисления.

Существуют два основных вида функциональных производных, соответствующих общему определению производной Фреше и производной Гато функции на банаховом пространстве. На практике они зачастую не различаются.

Определение[править | править исходный текст]

Пусть F — некоторый функционал, то есть функция, определённая на некотором множестве функций. Значение функционала F на функции \phi обозначают F[\phi]. Его производная Гато (производная по направлению) есть предел (если он существует) выражения \lim_{\varepsilon \to 0} \frac{F[\phi + \varepsilon \delta \phi] - F[\phi]}{\varepsilon}. Здесь \delta \phi — некоторая функция из области определения F. Отметим, что такая производная, вообще говоря, зависит от выбора функции \delta \phi. В этом смысле ситуация вполне аналогичная конечномерной. Например, функция y=|x| дифференцируема в точке x=0 справа и слева, но эти односторонние производные различны, а в обычном смысле эта функция в 0 не дифференцируема.

Гораздо чаще в приложениях возникает производная функционала, аналогичная классической конечномерной производной и являющаяся частным случаем производной Гато. Не давая общего определения, рассмотрим типичный пример: поиск экстремума функционала на множестве траекторий, проходящих через две заданные точки. Такая задача возникает при исследовании задач классической механики с помощью принципа наименьшего действия, подобного же типа задача о нахождении фигуры максимальной площади с заданным периметром и т. п.

Пусть функционал F имеет интегральный вид

F[\phi] = \int_a^b L(\phi, \dot \phi, t)dt

Его первой вариацией называется выражение

\delta F = F[\phi + \delta \phi] - F[\phi]

Если она представима в виде

\delta F = \int_a^b S(\phi, \dot \phi, t) \delta\phi(t)dt

с точностью до величин второго порядка по \delta \phi, то функция S называется функциональной производной F по \phi и обозначается \frac{\delta F}{\delta \phi}. Функционал при этом называют дифференцируемым.

Конкретно в данной задаче \frac{\delta F}{\delta \phi} = \frac{\partial L}{\partial \phi} - \frac{d}{dt}\frac{\partial L}{\partial \dot \phi}, но в общем случае ответ существенно зависит от постановки задачи и граничных условий.

Вторая вариация[править | править исходный текст]

Если функционал дифференцируем, то можно определить аналог второй производной (в данном случае он скорее аналогичен матрице вторых частных производных). Раскладывая полную вариацию \delta F до второго порядка по \delta \varphi и отбрасывая величины первого порядка, получим выражение, называемое второй вариацией функционала:

\delta^2 F = \iint \frac{\delta^2 F}{\delta \varphi \delta \varphi^\prime} \delta \varphi(x) \delta \varphi^\prime (x^\prime) dx dx^\prime

Свойства[править | править исходный текст]

Функциональная производная по свойствам аналогично обычной. Например:

  • Линейность. \frac{\delta}{\delta \phi}(\lambda F + \mu G) = \lambda \frac{\delta F}{\delta \phi} + \mu \frac{\delta G}{\delta \phi},\ \lambda,\mu\in \C
  • Тождество Лейбница. \frac{\delta FG}{\delta \phi} = \frac{\delta F}{\delta \phi} G + F \frac{\delta G}{\delta \phi}
  • Разложение полной вариации по частным производным: \delta F[\phi, \psi] = \frac{\delta F}{\delta \phi} \delta \phi + \frac{\delta F}{\delta \psi} \delta \psi
  • В точке экстремума функционала его производная равна 0. Точка экстремума является точкой минимума (максимума), если вторая вариация — положительно (отрицательно) определённая квадратичная форма.

и так далее.

Примеры[править | править исходный текст]

Энтропия[править | править исходный текст]

Информационная энтропия дискретной случайной величины это функционал функции вероятности.


\begin{align}
H[p(x)] = -\sum_x p(x) \log p(x)
\end{align}

Поэтому,


\begin{align}
\left\langle \frac{\delta H}{\delta p}, \phi \right\rangle 
& {} = \sum_x \frac{\delta H[p(x)]}{\delta p(x')} \, \phi(x') \\
& {} = \left. \frac{d}{d\epsilon} H[p(x) + \epsilon\phi(x)] \right|_{\epsilon=0}\\
& {} = -\frac{d}{d\varepsilon} \left. \sum_x [p(x) + \varepsilon\phi(x)] \log [p(x) + \varepsilon\phi(x)] \right|_{\varepsilon=0} \\
& {} = \displaystyle -\sum_x [1+\log p(x)]\phi(x)\\
& {} = \left\langle -[1+\log p(x)], \phi \right\rangle.
\end{align}

Поэтому,


\frac{\delta H}{\delta p} = -[1+\log p(x)].

Экспонента[править | править исходный текст]

Пусть

 F[\varphi(x)]= e^{\int \varphi(x) g(x)dx}.

Использую в качестве пробной функции дельта-функцию,


\begin{align}
\frac{\delta F[\varphi(x)]}{\delta \varphi(y)} 
& {} = \lim_{\varepsilon\to 0}\frac{F[\varphi(x)+\varepsilon\delta(x-y)]-F[\varphi(x)]}{\varepsilon}\\
& {} = \lim_{\varepsilon\to 0}\frac{e^{\int (\varphi(x)+\varepsilon\delta(x-y)) g(x)dx}-e^{\int \varphi(x) g(x)dx}}{\varepsilon}\\
& {} = e^{\int \varphi(x) g(x)dx}\lim_{\varepsilon\to 0}\frac{e^{\varepsilon \int \delta(x-y) g(x)dx}-1}{\varepsilon}\\
& {} = e^{\int \varphi(x) g(x)dx}\lim_{\varepsilon\to 0}\frac{e^{\varepsilon g(y)}-1}{\varepsilon}\\
& {} = e^{\int \varphi(x) g(x)dx}g(y).
\end{align}

Поэтому,

 \frac{\delta F[\varphi(x)]}{\delta \varphi(y)} = g(y) F[\varphi(x)].