Гессиан функции

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Гессиан функции — симметрическая квадратичная форма[источник не указан 680 дней], описывающая поведение функции во втором порядке.

Для функции f, дважды дифференцируемой в точке x\in \R^n

H(x) = \sum_{i=1}^n \sum_{j=1}^n a_{ij} x_i x_j

или

H(z) = \sum_{i=1}^n \sum_{j=1}^n a_{ij} z_i \overline{z}_j

где a_{ij}=\partial^2 f/\partial x_i \partial x_j (или a_{ij}=\partial^2 f/\partial z_i \partial \overline{z}_j) и функция f задана на n-мерном вещественном пространстве \mathbb{R}^n (или комплексном пространстве \mathbb{C}^n) с координатами x_1,\ldots,x_n (или z_1,\ldots,z_n ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы (a_{ij}),\, см. ниже.

Матрица Гессе[править | править вики-текст]

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

H(f) = \begin{bmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\  \\
\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\  \\
\vdots & \vdots & \ddots & \vdots \\  \\
\frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix}

Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 680 дней].

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы Гессе[править | править вики-текст]

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

\frac {\partial}{\partial x_i} \left( \frac { \partial f }{ \partial x_j} \right) =
       \frac {\partial}{\partial x_j} \left( \frac { \partial f }{ \partial x_i} \right)

Это можно также записать как

f_{x_i x_j} = f_{x_j x_i}, \quad \forall i,j \in \{1,\ldots, n\}.

В этом случае матрица Гессе симметрична.

Критические точки функции[править | править вики-текст]

Если градиент f (её векторная производная) равен нулю в некоторой точке x_0, то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то x_0 — точка локального минимума функции f(x),
  • если гессиан отрицательно определён, то x_0 — точка локального максимума функции f(x),
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (\det H(f) \neq 0), то x_0 — седловая точка функции f(x).

Вариации и обобщения[править | править вики-текст]

Если f — векторнозначная функция, то есть

f = (f_1, f_2, \dots, f_n),

то её вторые частные производные образуют не матрицу, а тензор ранга n+1.

История[править | править вики-текст]

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]

  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.