Равенство смешанных производных

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.

Теорема[править | править исходный текст]

Определение смешанной производной[править | править исходный текст]

Пусть дана достаточно гладкая (скалярная) функция f многих переменных:

(1) \qquad f = f(x_1, x_2, \dots x_n)

Мы можем взять частную производную этой функции по одному из аргументов x_i, считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:

(2) \qquad \phi(x_i) = {\partial f \over \partial x_i} \bigg|_{x_1,\dots x_{i-1}, x_{i+1}, \dots x_n = const}

Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение \phi в общем случае зависит от тех же переменных x_1, x_2, \dots x_n, что и оригинальная функция f:

(3) \qquad \phi = \phi(x_1, x_2, \dots x_n)

Если функция \phi окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу x_j:

(4) \qquad {\partial \phi \over \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}

Если j \ne i, то выражение в правой части равенства (4) называется смешанной производной.

Основа теоремы[править | править исходный текст]

Для достаточно гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:

(5) \qquad {\partial^2 f \over \partial x_i \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}

Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.

Необходимая степень гладкости[править | править исходный текст]

Уточнять необходимую степень гладкости следует поэтапно.

  • 1. Справедливость для аналитической функции (теорема).
  • 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
(6) \qquad {\partial f \over \partial x_i}, \; {\partial f \over \partial x_j}, \; {\partial^2 f \over \partial x_i \partial x_j}, {\partial^2 f \over \partial x_j \partial x_i}
  • 3. Поскольку для фиксированных индексов i,j все производные из перечня (6) берутся при условии, что любой третий аргумент x_k является константой, то функция f (а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
f(x_1, x_2, \dots x_n) = \Phi(x_i, x_j) + Z(\dots x_{i-1}, x_{i+1}, \dots x_{j-1}, x_{j+1}, \dots)

где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.

Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.

Доказательство теоремы[править | править исходный текст]

Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения x_i, x_j на x, y, то есть будем рассматривать такую ​​функцию двух переменных:

(7) \qquad f = f(x, y)

Также для упрощения формул будем обозначать частные производные индексами внизу функции:

(8) \qquad f_x(x, y) = {\partial f(x, y) \over \partial x}, \; f_y(x, y) = {\partial f(x, y) \over \partial y}
(8a) \qquad f_{xy} = {\partial^2 f \over \partial x \partial y}, \; f_{yx} = {\partial^2 f \over \partial y \partial x}

Пусть в точке (x, y) существует смешанная производная:

(9) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {f_y(x + \Delta  x, y) - f_y(x, y) \over \Delta x}

Предположим, что смешанная производная f_{xy} существует в точке (x, y), а также существует первая производная f_y(x, y) вдоль (горизонтальной) прямой y = const.

Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:

(10) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \left [ f(x + \Delta x, y) - f(x, y) \right ]

Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.

Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:

(11) \qquad f_{xy} (x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x}  {\partial \over \partial y} \int_x^{x+\Delta x} f_x(\xi, y) d \xi

Нужно, чтобы существовала частная производная f_x вдоль прямой y = const.

Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:

(12) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} {1 \over \Delta y} \left ( \int_x^{x + \Delta x} f_x(\xi, y + \Delta y) d \xi - \int_x^{x + \Delta x} f_x(\xi, y) d \xi \right )

Как видно, надо, чтобы частная производная f_x существовала не только на прямой y = const, но в некоторой двухмерной окрестности точки (x, y).

Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель {1 \over \Delta y}:

(13) \qquad f_{xy} =  \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} d \xi

Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.

По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:

(14) \qquad {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} = f_{yx}(\xi, \eta)

Средняя точка является функцией:

(14a) \qquad \eta = \eta(\xi, \Delta y),

значения которой лежат в интервале (если, например, \Delta y > 0)

(14b) \qquad \eta \in \, ]y, y + \Delta y[

Для справедливости (14) нужно существование смешанной производной f_{yx} = {\partial^2 f \over \partial y \partial x} в некоторой двухмерной окрестности точки (x, y).

Для окончания доказательства надо принять, что смешанная производная непрерывна в точке (x, y) как функция двух переменных. Значение этой производной в близкой точке (\xi, \eta) равно с точностью до бесконечно малого слагаемого значению производной в точке (x, y):

(15) \qquad f_{yx}(\xi, \eta) = f_{yx}(x, y) + o(\xi - x, \eta -y)

Смешанная производная f_{yx} существует в двухмерной окрестности точки (x, y) и непрерывна в этой точке как функция двух переменных.

Подставим (14) и (15) в (13):

(16) \qquad f_{xy} =  \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi

Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое f_{yx}(x,y) является константой по переменной интегрирования \xi, то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:

(17) \qquad \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi = \int_x^{x+\Delta x} f_{yx}(x,y) d \xi + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi =
= f_{yx} \Delta x + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi

После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:

(18) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \left ( f_{yx}(x,y) \Delta x +  {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \right ) =
= f_{yx}(x, y) + \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi

Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число \epsilon. Непрерывность смешанной производной f_{yx} в точке (x, y) означает, что существует такое положительное число \delta, что для каждой точки (\xi, \eta) внутри квадрата |\xi - x| < \delta, \; |\eta - y| < \delta справедливо неравенство:

(19) \qquad |o(\xi-x, \eta - y)| = |f_{yx}(\xi, \eta) - f_{yx}(x,y)| < \epsilon

Если мы возьмём положительные числа \Delta x < \delta, \; \Delta y < \delta, то интеграл в последнем слагаемом формулы (18) оценивается сверху:

(20) \qquad \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi < \int_x^{x+\Delta x} \epsilon d \xi = \epsilon \Delta x

Обозначим это слагаемое L

(21) \qquad L = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \le \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \epsilon \Delta x = \epsilon

Аналогично (если взять -\epsilon < \Delta x < 0), имеем оценку снизу:

(22) \qquad L \ge -\epsilon

Поскольку положительное число \epsilon может быть сколь угодно малым, то с необходимостью следует L = 0. Теорема доказана.

Уточнение гладкости функции[править | править исходный текст]

Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например, f_{xy}) в точке, а также существование второй смешанной производной f_{yx} в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной f_y вдоль отрезка прямой y = const и существование производной f_x в двумерной окрестности точки.

Кроме того, существование f_{xy} в точке (x, y) следует из двух фактов: (а) существует производная f_y вдоль отрезка прямой y = const, проходящей через точку (x, y), (б) смешанная производная f_{yx} существует и непрерывна в этой точке.

Пример[править | править исходный текст]

Рассмотрим функцию

(23) \qquad f(x, y) = xy + y^2 \chi(y)

где функция Дирихле \chi(y) равна нулю в рациональных точках y={m \over n} и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой y = 0 и разрывна во всех других точках плоскости.

Везде существует непрерывная частная производная:

(24) \qquad f_x(x, y) = {\partial f \over \partial x} = y

а также одна из смешанных производных:

(25) \qquad f_{yx}(x, y) = {\partial^2 f \over \partial y \partial x} = 1

Частная производная по игрек существует лишь в точках прямой y=0:

(26) \qquad f_y(x, 0) = x

Также в этих же точках прямой существует вторая смешанная производная:

(27) \qquad f_{xy}(x, 0) = \lim_{\Delta x \rightarrow 0} {f_y(x+\Delta x, 0) - f_y(x, 0) \over \Delta x} = 1

Как видим, для точек прямой y = 0 условия теоремы выполняются, и обе смешанные производные равны.

Контрпример[править | править исходный текст]

Рассмотрим функцию двух переменных x, y

(28) \qquad f(x, y) = {|a x + b y|^3 \over \sqrt{x^2 + y^2}}

где буквами a, b обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат x=0, \; y=0. Мы можем доопределить функцию f(x,y) в начале координат

(29) \qquad f(0,0) = 0

Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя r \rightarrow 0):

(30) \qquad f(r, \phi) = (a^2+b^2)^{3 \over 2} \, r^2 |\sin(\phi + \phi_0)|^3

Покажем, что для этой доопределённой функции f(x,y) смешанные производные в начале координат существуют, но не равны между собой.

Сначала вычислим первые производные f_x, \, f_y. Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:

(31) \qquad {d \over d x} |x|^3 = 3 x |x|
(31a) \qquad {d^2 \over d x^2} |x|^3 = {d \over d x} (3 x |x|) = 6 |x|

Теперь, учитывая (28) и (31), запишем первые производные функции f(x,y) в точке плоскости, отличной от начала координат (r = \sqrt{x^2 + y^2}):

(32) \qquad f_x = 3 a {(a x + b y)|a x + b y| \over r} - {x \over r^3} |a x + b y|^3
(33) \qquad f_y = 3 b {(a x + b y)|a x + b y| \over r} - {y \over r^3} |a x + b y|^3

Можно также вычислить первые производные в начале координат, исходя из определения производной:

(32a) \qquad f_x(0, 0) = \lim_{x \rightarrow 0} {f(x, 0) - f(0,0) \over x} = \lim_{x \rightarrow 0} {|ax|^3 \over {x |x|}} = 0

Аналогично

(33a) \qquad f_y(0, 0) = 0

Перейдём теперь к вычислению смешанных производных в начале координат:

(34) \qquad f_{xy}(0, 0) = \lim_{x \rightarrow 0} {f_y(x, 0) - f_y(0,0) \over x} =  \lim_{x \rightarrow 0} {1 \over x} \left ({3 b a x |a x| \over |x|} \right ) = 3 a b |a|

Аналогичное вычисление даёт:

(35) \qquad f_{yx}(0, 0) = 3 a b |b|

Легко видеть, что формулы (34) и (35) дают разные результаты, если:

(36) \qquad |a| > 0, \; |b| > 0, \; |a| \ne |b|

Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.

Можно также рассмотреть функцию

f(x, y) = {x y (x^2 - y^2) \over x^2 + y^2}

Упрощенное доказательство для аналитических функций[править | править исходный текст]

Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:

(37) \qquad f(x, y) = \sum_{n, m = 0}^{\infty} a_{nm} (x - x_0)^n (y - y_0)^m

Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:

(38) \qquad f_x =  \sum_{n, m = 0}^{\infty} n a_{nm} (x - x_0)^{n-1} (y - y_0)^m
(39) \qquad f_y = \sum_{n, m = 0}^{\infty} m a_{nm} (x - x_0)^n (y - y_0)^{m-1}

Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:

(40) \qquad f_{xy} = f_yx = \sum_{n, m = 0}^{\infty} n m a_{nm} (x - x_0)^{n-1} (y - y_0)^{m-1}

См. также[править | править исходный текст]

Литература[править | править исходный текст]