Матричный логарифм

Матричный логарифм — матрица, для которой матричная экспонента равна исходной матрице — обобщение логарифма и в некотором смысле обратная функция матричной экспоненты. Не все матрицы имеют логарифм, но те матрицы, которые имеют логарифм, могут иметь более одного логарифма. Изучение логарифмов матриц приводит к теории Ли^[en], так как если матрица имеет логарифм, то она является элементом группы Ли, а логарифм является соответствующим элементом векторного пространства алгебры Ли.

Определение[править | править код]

Матричная экспонента A определяется как:

e^{A}\equiv \sum _{n=0}^{\infty }{\frac {A^{n}}{n!}}

.

Дана матрица B, другая матрица A называется матричным логарифмом от B, если e^A = B. Поскольку экспоненциальная функция не является биективной для комплексных чисел (например $e^{\pi i}=e^{3\pi i}=-1$ ), числа могут иметь несколько комплексных логарифмов, и, как следствие этого, некоторые матрицы могут иметь более одного логарифма, как объясняется ниже.

Выражение степенного ряда[править | править код]

Если B достаточно близка к единичной матрице, то логарифм B можно вычислить с помощью следующего степенного ряда:

\log(B)=\sum _{k=1}^{\infty }{(-1)^{k+1}{\frac {(B-I)^{k}}{k}}}=(B-I)-{\frac {(B-I)^{2}}{2}}+{\frac {(B-I)^{3}}{3}}-{\frac {(B-I)^{4}}{4}}+\cdots

.

В частности, если $\left\|B-I\right\|<1$ , то предыдущий ряд сходится и $e^{\log(B)}=B$ ^[1].

Пример: Логарифм вращений на плоскости[править | править код]

Вращение на плоскости даёт простой пример. Вращение на угол α вокруг начала координат представляется матрицей 2×2

A={\begin{pmatrix}\cos(\alpha )&-\sin(\alpha )\\\sin(\alpha )&\cos(\alpha )\\\end{pmatrix}}.

Для любого целого числа n матрица

B_{n}=(\alpha +2\pi n){\begin{pmatrix}0&-1\\1&0\\\end{pmatrix}},

является логарифмом A.

Доказательство

$\log(A)=B_{n}~$ $~~e^{B_{n}}=A$

$e^{B_{n}}=\sum _{k=0}^{\infty }{1 \over k!}B_{n}^{k}~$ где

$(B_{n})^{0}=1~I_{2},$

$(B_{n})^{1}=(\alpha +2\pi n){\begin{pmatrix}0&-1\\+1&0\\\end{pmatrix}},$

$(B_{n})^{2}=(\alpha +2\pi n)^{2}{\begin{pmatrix}-1&0\\0&-1\\\end{pmatrix}},$

$(B_{n})^{3}=(\alpha +2\pi n)^{3}{\begin{pmatrix}0&1\\-1&0\\\end{pmatrix}},$

$(B_{n})^{4}=(\alpha +2\pi n)^{4}~I_{2}$
…

$\sum _{k=0}^{\infty }{1 \over k!}B_{n}^{k}={\begin{pmatrix}\cos(\alpha )&-\sin(\alpha )\\\sin(\alpha )&\cos(\alpha )\\\end{pmatrix}}=A~.$
ч. т. д.

Таким образом, матрица A имеет бесконечно много логарифмов. Это соответствует тому факту, что угол поворота определяется только до кратных 2π.

На языке теории Ли матрицы вращения A являются элементами группы Ли SO(2). Соответствующие логарифмы B являются элементами алгебры Ли SO(2), которая состоит из всех кососимметричных матриц. Матрица

{\begin{pmatrix}0&1\\-1&0\\\end{pmatrix}}

является генератором алгебры Ли so(2).

Существование[править | править код]

Вопрос о том, имеет ли матрица логарифм, имеет самый простой ответ, когда рассматривается в комплексной постановке. Комплексная матрица имеет логарифм тогда и только тогда, когда она является невырожденной^[2]. Логарифм не является единственным, но если матрица не имеет отрицательных действительных собственных значений, то существует единственный логарифм, собственные значения которого лежат на {z ∈ C | −π < Im z < π}. Этот логарифм известен как главный логарифм^[3].

В реальных условиях ответ более сложен. Действительная матрица имеет действительный логарифм тогда и только тогда, когда она обратима и каждый Жорданов блок, относящийся к отрицательному собственному числу, встречается чётное число раз^[4]. Если обратимая вещественная матрица не удовлетворяет условию с Жордановыми блоками, то она имеет только невещественные логарифмы. Это можно увидеть в скалярном случае: ни одна ветвь логарифма не может быть вещественна при −1. Существование вещественных матричных логарифмов вещественных матриц размера 2×2 рассматривается в следующем разделе.

Подстановка[править | править код]

Если A и B обе являются положительно определёнными матрицами, тогда

\operatorname {tr} {\log {(AB)}}=\operatorname {tr} {\log {(A)}}+\operatorname {tr} {\log {(B)}}.

Предположим, что A и B коммутируют, это означает, что AB = BA. Тогда

\log {(AB)}=\log {(A)}+\log {(B)}.\,

тогда и только тогда, когда $\operatorname {arg} (\mu _{j})+\operatorname {arg} (\nu _{j})\in (-\pi ,\pi ]$ , где $\mu _{j}$ является собственным вектором для $A$ и $\nu _{j}$ является соответственно собственным вектором для $B$ ^[5]. В частности, $\log(AB)=\log(A)+\log(B)$ , когда A и B коммутируют и обе положительно определены. Подстановка B = A⁻¹ в это уравнение даёт

\log {(A^{-1})}=-\log {(A)}.

Аналогично для некоммутирующих $A$ и $B$ , можно показать, что^[6]

\log {(A+tB)}=\log {(A)}+t\int _{0}^{\infty }dz~{\frac {I}{A+zI}}B{\frac {I}{A+zI}}+O(t^{2}).

В более общем случае, разложение ряда $\log {(A+tB)}$ по степеням $t$ можно получить, используя интегральное определение логарифма

\log {(X+\lambda I)}-\log {(X)}=\int _{0}^{\lambda }dz{\frac {I}{X+zI}},

применимо к $X=A$ и $X=A+tB$ в пределе $\lambda \rightarrow \infty$ .

Дополнительный пример: Логарифм вращений в трёхмерном пространстве[править | править код]

Вращение R ∈ SO(3) в ℝ³ задается с помощью ортогональной матрицы размерности 3×3.

Логарифм такой матрицы вращения R можно легко вычислить из антисимметричной части формулы поворота Родрига, явно выраженной с помощью угла поворота вокруг оси. Таким образом, получим логарифм с минимальной нормой Фробениуса, но это не работает, когда R имеет собственные значения, равные −1, где это не уникально.

Далее заметим, что, учитывая матрицы вращения A и B, геодезическое расстояние на трёхмерном многообразии матриц вращения

d_{g}(A,B):=\|\log(A^{\top }B)\|_{F}

.

Вычисление логарифма диагонализируемой матрицы[править | править код]

Метод нахождения ln A для диагонализируемой матрицы A заключается в следующем:

Найдём матрицу V собственных векторов A (каждый столбец V является собственным вектором A).

Найдём невырожденную матрицу V⁻¹ от V.

Пусть

A'=V^{-1}AV.\,

Тогда A будет диагональной матрицей, диагональные элементы которой являются собственными значениями A.

Заменим каждый диагональный элемент A на его (натуральный) логарифм, чтобы получить

\log A'

.

Тогда

\log A=V(\log A')V^{-1}.\,

То, что логарифм A может быть комплексной матрицей, даже если A вещественная, следует из того, что матрица с вещественными и положительными элементами может иметь отрицательные или даже комплексные собственные значения (это верно, например, для матрицы поворота). Неединственность логарифма матрицы следует из неединственности логарифма комплексного числа.

Логарифм недиагонализуемой матрицы[править | править код]

Алгоритм, проиллюстрированный выше, не работает для недиагонализуемых матриц, таких как

{\begin{bmatrix}1&1\\0&1\end{bmatrix}}.

Для таких матриц нужно найти её нормальную форму Жордана и вместо вычисления логарифма диагональных элементов, как указано выше, можно было бы вычислить логарифм Жордановой матрицы.

Последнее достигается, если заметить, что можно записать жорданов блок в виде

B={\begin{pmatrix}\lambda &1&0&0&\cdots &0\\0&\lambda &1&0&\cdots &0\\0&0&\lambda &1&\cdots &0\\\vdots &\vdots &\vdots &\ddots &\ddots &\vdots \\0&0&0&0&\lambda &1\\0&0&0&0&0&\lambda \\\end{pmatrix}}=\lambda {\begin{pmatrix}1&\lambda ^{-1}&0&0&\cdots &0\\0&1&\lambda ^{-1}&0&\cdots &0\\0&0&1&\lambda ^{-1}&\cdots &0\\\vdots &\vdots &\vdots &\ddots &\ddots &\vdots \\0&0&0&0&1&\lambda ^{-1}\\0&0&0&0&0&1\\\end{pmatrix}}=\lambda (I+K)

где K — матрица с нулями на главной диагонали и под ней. (Число является ненулевым в предположении, что матрица, логарифм которой пытаются взять, невырождена.)

Затем, по ряду Меркатора

\log(1+x)=x-{\frac {x^{2}}{2}}+{\frac {x^{3}}{3}}-{\frac {x^{4}}{4}}+\cdots

получаем

\log B=\log {\big (}\lambda (I+K){\big )}=\log(\lambda I)+\log(I+K)=(\log \lambda )I+K-{\frac {K^{2}}{2}}+{\frac {K^{3}}{3}}-{\frac {K^{4}}{4}}+\cdots

Этот ряд имеет конечное число членов (K^m равен нулю, если m — размерность K), и поэтому ряд сходится.

Используя этот подход, можно найти

\log {\begin{bmatrix}1&1\\0&1\end{bmatrix}}={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

Перспектива функционального анализа[править | править код]

Квадратная матрица представляет собой линейное отображение на евклидово пространство Rⁿ, где n — это размерность матрицы. Поскольку такое пространство является конечномерным, этот оператор фактически является ограниченным.

Используя инструменты голоморфного функционального исчисления^[en], учитывая что голоморфная функция f определена на открытом множестве в комплексной плоскости и линейный оператор T ограничен, можно рассчитать f(T) до тех пор, пока f определена на спектре T.

Функция f(z)=log z может быть определена на любом односвязном пространстве открытого множества в комплексной плоскости, не содержащем начало координат, и она голоморфна на такой области. Это означает, что можно определить ln T до тех пор, пока спектр T не содержит начало координат и существует путь из начала координат в бесконечность, не пересекающий спектр T (например, если спектр T представляет собой круг с началом координат внутри него, то невозможно определить ln T).

Спектр линейного оператора на Rⁿ — это множество собственных значений его матрицы, и поэтому является конечным множеством. Пока начало координат не находится в спектре (матрица невырождена), условие пути из предыдущего раздела выполняется, и ln T однозначно определено. Неединственность матричного логарифма следует из того, что можно выбрать более одной ветви логарифма, который определён на множестве собственных значений матрицы.

Перспектива теории групп Ли[править | править код]

В теории групп Ли существует экспоненциальное отображение^[en] из алгебры Ли ${\mathfrak {g}}$ к соответствующей группе Ли G

\exp :{\mathfrak {g}}\rightarrow G.

Для матричных групп Ли элементы ${\mathfrak {g}}$ и G являются квадратными матрицами, а экспоненциальное отображение задаётся как экспонента матрицы. Обратное отображение $\log =\exp ^{-1}$ является многозначным и совпадает с обсуждаемым здесь матричным логарифмом. Отображение логарифма отображается из группы Ли G в алгебру Ли ${\mathfrak {g}}$ . Обратите внимание, что экспоненциальное отображение является локальным диффеоморфизмом между окрестностью U нулевой матрицы ${\underline {0}}\in {\mathfrak {g}}$ и окрестностью V для единичной матрицы ${\underline {1}}\in G$ ^[7]. Таким образом, (матричный) логарифм однозначно определён как отображение,

\log :G\supset V\rightarrow U\subset {\mathfrak {g}}.

Важным следствием формулы Якоби является

\log(\det(A))=\mathrm {tr} (\log A)~.

Ограничения в случае 2 × 2[править | править код]

Если вещественная матрица 2 × 2 имеет отрицательный определитель, она не имеет действительного логарифма. Прежде всего заметим, что любую вещественную матрицу 2 × 2 можно рассматривать как один из трёх типов комплексного числа z = x + y ε, где ε² ∈ { −1, 0, +1 }. z является точкой на комплексной подплоскости кольца матриц^[8].

Случай, когда определитель отрицателен, возникает только в плоскости с ε² =+1, то есть в плоскости гиперболических чисел. Только одна четверть этой плоскости является образом экспоненциального отображения, поэтому логарифм определяется только в этой четверти (квадранте). Остальные три квадранта являются образами этого квадранта при четверной группе Клейна, порождённой ε и −1.

Например, пусть a = log 2 ; тогда cosh a = 5/4 и sinh a = 3/4. Для матриц это означает, что

A=\exp {\begin{pmatrix}0&a\\a&0\end{pmatrix}}={\begin{pmatrix}\cosh a&\sinh a\\\sinh a&\cosh a\end{pmatrix}}={\begin{pmatrix}1.25&.75\\.75&1.25\end{pmatrix}}

.

Итак, эта последняя матрица имеет логарифм: $\log A={\begin{pmatrix}0&\log 2\\\log 2&0\end{pmatrix}}$ .

Однако эти матрицы не имеют логарифма: ${\begin{pmatrix}3/4&5/4\\5/4&3/4\end{pmatrix}},\ {\begin{pmatrix}-3/4&-5/4\\-5/4&-3/4\end{pmatrix}},\ {\begin{pmatrix}-5/4&-3/4\\-3/4&-5/4\end{pmatrix}}$ . Они представляют три других сопряжения четверной группы матрицы выше, которая имеет логарифм.

Невырожденная матрица 2 x 2 не обязательно имеет логарифм, но она сопряжена по четверной группе с матрицей, которая имеет логарифм.

Из этого также следует, что, например, квадратный корень из матрицы 2x2 A можно получить непосредственно из возведения в степень (logA)/2,

{\sqrt {A}}={\begin{pmatrix}\cosh((\log 2)/2)&\sinh((\log 2)/2)\\\sinh((\log 2)/2)&\cosh((\log 2)/2)\end{pmatrix}}={\begin{pmatrix}1.06&.35\\.35&1.06\end{pmatrix}}~.

Для лучшего примера возьмём пифагорову тройку (p, q, r) и пусть a = log(p + r) − log q. Тогда

e^{a}={\frac {p+r}{q}}=\cosh a+\sinh a

.

Теперь

\exp {\begin{pmatrix}0&a\\a&0\end{pmatrix}}={\begin{pmatrix}r/q&p/q\\p/q&r/q\end{pmatrix}}

.

И тогда

{\tfrac {1}{q}}{\begin{pmatrix}r&p\\p&r\end{pmatrix}}

имеет матричный логарифм

{\begin{pmatrix}0&a\\a&0\end{pmatrix}}

,

где a = log(p + r) − log q.

См. также[править | править код]

Примечания[править | править код]

↑ Hall, 2015 Theorem 2.8
↑ Higham (2008), Theorem 1.27
↑ Higham (2008), Theorem 1.31
↑ Culver (1966)
↑ APRAHAMIAN, MARY; HIGHAM, NICHOLAS J. (2014). "The Matrix Unwinding Function, with an Application to Computing the Matrix Exponential". SIAM Journal on Matrix Analysis and Applications. 35 (1): 97. doi:10.1137/130920137. Архивировано из оригинала 13 декабря 2022. Дата обращения: 13 декабря 2022.
↑ Unpublished memo Архивная копия от 7 апреля 2023 на Wayback Machine by S Adler (IAS)
↑ Hall, 2015 Theorem 3.42
↑
- Книги по теме Abstract Algebra/2x2 real matrices в Викиучебнике

Литература[править | править код]

Gantmacher, Felix R. (1959), The Theory of Matrices, vol. 1, New York: Chelsea, pp. 239—241.
Hall, Brian C. (2015), Lie Groups, Lie Algebras, and Representations An Elementary Introduction, Graduate Texts in Mathematics, vol. 222 (2nd ed.), Springer, ISBN 978-3319134666
Culver, Walter J. (1966), "On the existence and uniqueness of the real logarithm of a matrix", Proceedings of the American Mathematical Society, 17 (5): 1146—1151, doi:10.1090/S0002-9939-1966-0202740-6, ISSN 0002-9939.
Higham, Nicholas (2008), Functions of Matrices. Theory and Computation, SIAM, ISBN 978-0-89871-646-7.
Eng, Kenth (June 2001), "On the BCH-formula in so(3)", BIT Numerical Mathematics, 41 (3): 629—632, doi:10.1023/A:1021979515229, ISSN 0006-3835, S2CID 126053191

[1] Hall, 2015 Theorem 2.8

[2] Higham (2008), Theorem 1.27

[3] Higham (2008), Theorem 1.31

[4] Culver (1966)

[5] APRAHAMIAN, MARY; HIGHAM, NICHOLAS J. (2014). "The Matrix Unwinding Function, with an Application to Computing the Matrix Exponential". SIAM Journal on Matrix Analysis and Applications. 35 (1): 97. doi:10.1137/130920137. Архивировано из оригинала 13 декабря 2022. Дата обращения: 13 декабря 2022.

[6] Unpublished memo Архивная копия от 7 апреля 2023 на Wayback Machine by S Adler (IAS)

[7] Hall, 2015 Theorem 3.42

[8] 
Книги по теме Abstract Algebra/2x2 real matrices в Викиучебнике

[9] Книги по теме Abstract Algebra/2x2 real matrices в Викиучебнике

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Матричный логарифм

Содержание

Определение[править | править код]

Выражение степенного ряда[править | править код]

Пример: Логарифм вращений на плоскости[править | править код]

Существование[править | править код]

Подстановка[править | править код]

Дополнительный пример: Логарифм вращений в трёхмерном пространстве[править | править код]

Вычисление логарифма диагонализируемой матрицы[править | править код]

Логарифм недиагонализуемой матрицы[править | править код]

Перспектива функционального анализа[править | править код]

Перспектива теории групп Ли[править | править код]

Ограничения в случае 2 × 2[править | править код]

См. также[править | править код]

Примечания[править | править код]

Литература[править | править код]

Навигация

Матричный логарифм

Определение[править | править код]

Выражение степенного ряда[править | править код]

Пример: Логарифм вращений на плоскости[править | править код]

Существование[править | править код]

Подстановка[править | править код]

Дополнительный пример: Логарифм вращений в трёхмерном пространстве[править | править код]

Вычисление логарифма диагонализируемой матрицы[править | править код]

Логарифм недиагонализуемой матрицы[править | править код]

Перспектива функционального анализа[править | править код]

Перспектива теории групп Ли[править | править код]

Ограничения в случае 2 × 2[править | править код]

См. также[править | править код]

Примечания[править | править код]

Литература[править | править код]

Навигация

Поиск