Матричный логарифм

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Матричный логарифм — матрица, для которой матричная экспонента равна исходной матрице — обобщение логарифма и в некотором смысле обратная функция матричной экспоненты. Не все матрицы имеют логарифм, но те матрицы, которые имеют логарифм, могут иметь более одного логарифма. Изучение логарифмов матриц приводит к теории Ли[en], так как если матрица имеет логарифм, то она является элементом группы Ли, а логарифм является соответствующим элементом векторного пространства алгебры Ли.

Определение[править | править код]

Матричная экспонента A определяется как:

.

Дана матрица B, другая матрица A называется матричным логарифмом от B, если eA = B. Поскольку экспоненциальная функция не является биективной для комплексных чисел (например ), числа могут иметь несколько комплексных логарифмов, и, как следствие этого, некоторые матрицы могут иметь более одного логарифма, как объясняется ниже.

Выражение степенного ряда[править | править код]

Если B достаточно близка к единичной матрице, то логарифм B можно вычислить с помощью следующего степенного ряда:

.

В частности, если , то предыдущий ряд сходится и [1].

Пример: Логарифм вращений на плоскости[править | править код]

Вращение на плоскости даёт простой пример. Вращение на угол α вокруг начала координат представляется матрицей 2×2

Для любого целого числа n матрица

является логарифмом A.


Таким образом, матрица A имеет бесконечно много логарифмов. Это соответствует тому факту, что угол поворота определяется только до кратных 2π.

На языке теории Ли матрицы вращения A являются элементами группы Ли SO(2). Соответствующие логарифмы B являются элементами алгебры Ли SO(2), которая состоит из всех кососимметричных матриц. Матрица

является генератором алгебры Ли so(2).

Существование[править | править код]

Вопрос о том, имеет ли матрица логарифм, имеет самый простой ответ, когда рассматривается в комплексной постановке. Комплексная матрица имеет логарифм тогда и только тогда, когда она является невырожденной[2]. Логарифм не является единственным, но если матрица не имеет отрицательных действительных собственных значений, то существует единственный логарифм, собственные значения которого лежат на {zC | −π < Im z < π}. Этот логарифм известен как главный логарифм[3].

В реальных условиях ответ более сложен. Действительная матрица имеет действительный логарифм тогда и только тогда, когда она обратима и каждый Жорданов блок, относящийся к отрицательному собственному числу, встречается чётное число раз[4]. Если обратимая вещественная матрица не удовлетворяет условию с Жордановыми блоками, то она имеет только невещественные логарифмы. Это можно увидеть в скалярном случае: ни одна ветвь логарифма не может быть вещественна при −1. Существование вещественных матричных логарифмов вещественных матриц размера 2×2 рассматривается в следующем разделе.

Подстановка[править | править код]

Если A и B обе являются положительно определёнными матрицами, тогда

Предположим, что A и B коммутируют, это означает, что AB = BA. Тогда

тогда и только тогда, когда , где является собственным вектором для и является соответственно собственным вектором для [5]. В частности, , когда A и B коммутируют и обе положительно определены. Подстановка B = A−1 в это уравнение даёт

Аналогично для некоммутирующих и , можно показать, что[6]

В более общем случае, разложение ряда по степеням можно получить, используя интегральное определение логарифма

применимо к и в пределе .

Дополнительный пример: Логарифм вращений в трёхмерном пространстве[править | править код]

Вращение R ∈ SO(3) в ℝ³ задается с помощью ортогональной матрицы размерности 3×3.

Логарифм такой матрицы вращения R можно легко вычислить из антисимметричной части формулы поворота Родрига, явно выраженной с помощью угла поворота вокруг оси. Таким образом, получим логарифм с минимальной нормой Фробениуса, но это не работает, когда R имеет собственные значения, равные −1, где это не уникально.

Далее заметим, что, учитывая матрицы вращения A и B, геодезическое расстояние на трёхмерном многообразии матриц вращения

.

Вычисление логарифма диагонализируемой матрицы[править | править код]

Метод нахождения ln A для диагонализируемой матрицы A заключается в следующем:

Найдём матрицу V собственных векторов A (каждый столбец V является собственным вектором A).
Найдём невырожденную матрицу V−1 от V.
Пусть
Тогда A будет диагональной матрицей, диагональные элементы которой являются собственными значениями A.
Заменим каждый диагональный элемент A на его (натуральный) логарифм, чтобы получить .
Тогда

То, что логарифм A может быть комплексной матрицей, даже если A вещественная, следует из того, что матрица с вещественными и положительными элементами может иметь отрицательные или даже комплексные собственные значения (это верно, например, для матрицы поворота). Неединственность логарифма матрицы следует из неединственности логарифма комплексного числа.

Логарифм недиагонализуемой матрицы[править | править код]

Алгоритм, проиллюстрированный выше, не работает для недиагонализуемых матриц, таких как

Для таких матриц нужно найти её нормальную форму Жордана и вместо вычисления логарифма диагональных элементов, как указано выше, можно было бы вычислить логарифм Жордановой матрицы.

Последнее достигается, если заметить, что можно записать жорданов блок в виде

где K — матрица с нулями на главной диагонали и под ней. (Число является ненулевым в предположении, что матрица, логарифм которой пытаются взять, невырождена.)

Затем, по ряду Меркатора

получаем

Этот ряд имеет конечное число членов (Km равен нулю, если m — размерность K), и поэтому ряд сходится.

Используя этот подход, можно найти

Перспектива функционального анализа[править | править код]

Квадратная матрица представляет собой линейное отображение на евклидово пространство Rn, где n — это размерность матрицы. Поскольку такое пространство является конечномерным, этот оператор фактически является ограниченным.

Используя инструменты голоморфного функционального исчисления[en], учитывая что голоморфная функция f определена на открытом множестве в комплексной плоскости и линейный оператор T ограничен, можно рассчитать f(T) до тех пор, пока f определена на спектре T.

Функция f(z)=log z может быть определена на любом односвязном пространстве открытого множества в комплексной плоскости, не содержащем начало координат, и она голоморфна на такой области. Это означает, что можно определить ln T до тех пор, пока спектр T не содержит начало координат и существует путь из начала координат в бесконечность, не пересекающий спектр T (например, если спектр T представляет собой круг с началом координат внутри него, то невозможно определить ln T).

Спектр линейного оператора на Rn — это множество собственных значений его матрицы, и поэтому является конечным множеством. Пока начало координат не находится в спектре (матрица невырождена), условие пути из предыдущего раздела выполняется, и ln T однозначно определено. Неединственность матричного логарифма следует из того, что можно выбрать более одной ветви логарифма, который определён на множестве собственных значений матрицы.

Перспектива теории групп Ли[править | править код]

В теории групп Ли существует экспоненциальное отображение[en] из алгебры Ли к соответствующей группе Ли G

Для матричных групп Ли элементы и G являются квадратными матрицами, а экспоненциальное отображение задаётся как экспонента матрицы. Обратное отображение является многозначным и совпадает с обсуждаемым здесь матричным логарифмом. Отображение логарифма отображается из группы Ли G в алгебру Ли . Обратите внимание, что экспоненциальное отображение является локальным диффеоморфизмом между окрестностью U нулевой матрицы и окрестностью V для единичной матрицы [7]. Таким образом, (матричный) логарифм однозначно определён как отображение,

Важным следствием формулы Якоби является

Ограничения в случае 2 × 2[править | править код]

Если вещественная матрица 2 × 2 имеет отрицательный определитель, она не имеет действительного логарифма. Прежде всего заметим, что любую вещественную матрицу 2 × 2 можно рассматривать как один из трёх типов комплексного числа z = x + y ε, где ε² ∈ { −1, 0, +1 }. z является точкой на комплексной подплоскости кольца матриц[8].

Случай, когда определитель отрицателен, возникает только в плоскости с ε² =+1, то есть в плоскости гиперболических чисел. Только одна четверть этой плоскости является образом экспоненциального отображения, поэтому логарифм определяется только в этой четверти (квадранте). Остальные три квадранта являются образами этого квадранта при четверной группе Клейна, порождённой ε и −1.

Например, пусть a = log 2 ; тогда cosh a = 5/4 и sinh a = 3/4. Для матриц это означает, что

.

Итак, эта последняя матрица имеет логарифм: .

Однако эти матрицы не имеют логарифма: . Они представляют три других сопряжения четверной группы матрицы выше, которая имеет логарифм.

Невырожденная матрица 2 x 2 не обязательно имеет логарифм, но она сопряжена по четверной группе с матрицей, которая имеет логарифм.

Из этого также следует, что, например, квадратный корень из матрицы 2x2 A можно получить непосредственно из возведения в степень (logA)/2,

Для лучшего примера возьмём пифагорову тройку (p, q, r) и пусть a = log(p + r) − log q. Тогда

.

Теперь

.

И тогда

имеет матричный логарифм

,

где a = log(p + r) − log q.

См. также[править | править код]

Примечания[править | править код]

  1. Hall, 2015 Theorem 2.8
  2. Higham (2008), Theorem 1.27
  3. Higham (2008), Theorem 1.31
  4. Culver (1966)
  5. APRAHAMIAN, MARY; HIGHAM, NICHOLAS J. (2014). "The Matrix Unwinding Function, with an Application to Computing the Matrix Exponential". SIAM Journal on Matrix Analysis and Applications. 35 (1): 97. doi:10.1137/130920137. Архивировано из оригинала 13 декабря 2022. Дата обращения: 13 декабря 2022.
  6. Unpublished memo Архивная копия от 7 апреля 2023 на Wayback Machine by S Adler (IAS)
  7. Hall, 2015 Theorem 3.42

Литература[править | править код]