Гессиан функции

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции f, дважды дифференцируемой в точке x\in \R^n

H(x) = \sum_{i=1}^n \sum_{j=1}^n a_{ij} x_i x_j

или

H(z) = \sum_{i=1}^n \sum_{j=1}^n a_{ij} z_i \overline{z}_j

где a_{ij}=\partial^2 f/\partial x_i \partial x_j (или a_{ij}=\partial^2 f/\partial z_i \partial \overline{z}_j) и функция f задана на n-мерном вещественном пространстве \mathbb{R}^n (или комплексном пространстве \mathbb{C}^n) с координатами x_1,\ldots,x_n (или z_1,\ldots,z_n ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы (a_{ij}),\, см. ниже.

Матрица Гессе[править | править вики-текст]

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

H(f) = \begin{bmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\  \\
\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\  \\
\vdots & \vdots & \ddots & \vdots \\  \\
\frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix}

Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 1242 дня].

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

При анализе стационарных точек ППЕ исследуют матрицу других производных полной энергии молекулы, которую называют гессианом:

|F_{ij}|=\left \vert \frac{\partial^2 E}{\partial q_i \partial q_j} \right \vert=\begin{vmatrix} \frac{\partial^2 E}{\partial q^2_1} & \frac{\partial^2 E}{\partial q_1 \partial q_2} & ... & \frac{\partial^2 E}{\partial q_1 \partial q_{3N-6}} \\ \frac{\partial^2 E}{\partial q_2 \partial q_1} & \frac{\partial^2 E}{\partial q^2_2} & ... & \frac{\partial^2 E}{\partial q_2 \partial q_{3N-6}} \\ ... & ... & ... &... \\ \frac{\partial^2 E}{\partial q_{3N-6}\partial q_1} & \frac{\partial^2 E}{\partial q_{3N-6}\partial q_2} &...& \frac{\partial^2 E}{\partial q^2_{3N-6}} \end{vmatrix}.

Всегда возможно превращение этой матрицы к диагональному виду:

\begin{vmatrix} f_1 & 0 & ... & 0 \\ 0 & f_2 & ...& 0 \\ ... & ... & ... &... \\ 0 & 0 & ...& f_{3N-6} \end{vmatrix}.

Наиболее существенное значение в химии имеют стойкие состояния молекул. Стойкость означает, что по всех внутренних координатах молекулы полная энергия минимальна. Такому состоянию соответствует диагональный вид матрицы Гессе со всеми силовыми константами, поскольку они характеризуют частоты колебаний атомов один относительно друга. Силовые константы используются в теоретически расчетах ИК-спектров химических соединений.

Примеры[править | править вики-текст]

В качестве примера рассмотрим простые примеры анализа функции на наличие экстремумов.

  1. f(x_1, x_2)=0,5x^2_1-4x_1x_2+9x^2_2+3x_1-14x_2+2.

\frac{\partial f}{\partial x_1}=x_1-4x_2+3=0; \frac{\partial f}{\partial x_2}=18x_2-4x_1-14=0.

Данная система уравнений имеет единое решение x_1=x_2=1

\frac{\partial^2 f}{\partial x^2_1}=1; \frac{\partial^2 f}{\partial x^2_2}=18; \frac{\partial f}{\partial x_1 \partial x_2}=\frac{\partial^2 f}{\partial x_2 \partial x_1}=-4.

Матрица Гессе имеет вид

D=\begin{vmatrix} 1 & -4 \\ -4 & 18 \end{vmatrix}=\begin{vmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{vmatrix}.

Чтобы её диагонилизировать, необходимо найти \lambda из уравнения:

D'=\begin{vmatrix} 1-\lambda & -4 \\ -4 & 18-\lambda \end{vmatrix}=0 или \lambda^2-19\lambda+2=0;

\lambda_1=\frac{19-\sqrt353}{2}=0,106; \lambda_2=\frac{19+\sqrt353}{2}=18,894.

Оба диагональных элемента позитивные, значит, в точке (x_1=1; x_2=1) функция f (x_1, x_2) имеет минимум.

2. f(x_1, x_2)=x^2_1-3x_1x_2+2x^2_2+x_1-2.

\frac{\partial f}{\partial x_1}=2x_1-3x_2+1=0; \frac{\partial f}{\partial x_2}=4x_2-3x_1=0.

Решением системы уравнения является x_1=4; x_2=3.

\frac{\partial^2 f}{\partial x_1^2}=2; \frac{\partial^2 f}{x^2_2}=4; \frac{\partial^2 f}{\partial x_2 \partial x_1}=-3.

D'=\begin{vmatrix} 2-\lambda & -3 \\ -3 & 4-\lambda \end{vmatrix}=0 или \lambda^2-6\lambda-1=0;

\lambda_1=3-\sqrt{10}=-0.162; \lambda_2=3+\sqrt{10}=6.162.

Стационарная точка (x_1=4, x_2=3) является точкой минимакса, то есть по одному направлению поверхность f(x_1,x_2) в данной точке имеет минимум, а по другому - максимум. Другое название таких точек - "седловые". Наконец, если один из диагональных элементов гессиан равен нулю, то такой рельеф называется "обезьяньим седлом". Он не имеет большого значения с химической точки зрения, но иногда бывает достаточно тяжело отличить его от точки минимакса, который имеет, наоборот, большое значение. Неверная интерпретация типа стационарной точки может породить неправильное толкование результатов квантово-химических расчетов.

Симметрия матрицы Гессе[править | править вики-текст]

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

\frac {\partial}{\partial x_i} \left( \frac { \partial f }{ \partial x_j} \right) =
       \frac {\partial}{\partial x_j} \left( \frac { \partial f }{ \partial x_i} \right)

Это можно также записать как

f_{x_i x_j} = f_{x_j x_i}, \quad \forall i,j \in \{1,\ldots, n\}.

В этом случае матрица Гессе симметрична.

Критические точки функции[править | править вики-текст]

Если градиент f (её векторная производная) равен нулю в некоторой точке x_0, то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то x_0 — точка локального минимума функции f(x),
  • если гессиан отрицательно определён, то x_0 — точка локального максимума функции f(x),
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (\det H(f) \neq 0), то x_0 — седловая точка функции f(x).

Вариации и обобщения[править | править вики-текст]

Если f — векторнозначная функция, то есть

f = (f_1, f_2, \dots, f_n),

то её вторые частные производные образуют не матрицу, а тензор ранга 3.

История[править | править вики-текст]

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

Ссылки[править | править вики-текст]

  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.