Матрица (математика)

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Ма́трица — математический объект, записываемый в виде прямоугольной таблицы элементов кольца или поля (например, целых, действительных или комплексных чисел), которая представляет собой совокупность строк и столбцов, на пересечении которых находятся её элементы. Количество строк и столбцов матрицы задают размер матрицы. Хотя исторически рассматривались, например, треугольные матрицы[1], в настоящее время говорят исключительно о матрицах прямоугольной формы, так как они являются наиболее удобными и общими.

Матрицы широко применяются в математике для компактной записи систем линейных алгебраических или дифференциальных уравнений. В этом случае количество строк матрицы соответствует числу уравнений, а количество столбцов — количеству неизвестных. В результате решение систем линейных уравнений сводится к операциям над матрицами.

Для матрицы определены следующие алгебраические операции:

  • сложение матриц, имеющих один и тот же размер;
  • умножение матриц подходящего размера (матрицу, имеющую n столбцов, можно умножить справа на матрицу, имеющую n строк);
  • в том числе умножение на матрицу вектора (по обычному правилу матричного умножения; вектор является в этом смысле частным случаем матрицы);
  • умножение матрицы на элемент основного кольца или поля (то есть скаляр).

Относительно сложения матрицы образуют абелеву группу; если же рассматривать ещё и умножение на скаляр, то матрицы образуют модуль над соответствующим кольцом (векторное пространство над полем). Множество квадратных матриц замкнуто относительно матричного умножения, поэтому квадратные матрицы одного размера образуют ассоциативное кольцо с единицей относительно матричного сложения и матричного умножения.

Доказано, что каждому линейному оператору, действующему в n-мерном линейном пространстве, можно сопоставить единственную квадратную матрицу порядка n; и обратно — каждой квадратной матрице порядка n может быть сопоставлен единственный линейный оператор, действующий в этом пространстве.[2] Свойства матрицы соответствуют свойствам линейного оператора. В частности, собственные числа матрицы — это собственные числа оператора, отвечающие соответствующим собственным векторам.

То же можно сказать о представлении матрицами билинейных (квадратичных) форм.

В математике рассматривается множество различных типов и видов матриц. Таковы, например, единичная, симметричная, кососимметричная, верхнетреугольная (нижнетреугольная) и т. п. матрицы.

Особое значение в теории матриц занимают всевозможные нормальные формы, то есть канонический вид, к которому можно привести матрицу заменой координат. Наиболее важной (в теоретическом значении) и проработанной является теория жордановых нормальных форм. На практике, однако, используются такие нормальные формы, которые обладают дополнительными свойствами, например, устойчивостью.

История[править | править вики-текст]

Впервые матрицы упоминались ещё в древнем Китае, называясь тогда «волшебным квадратом». Основным применением матриц было решение линейных уравнений. Также волшебные квадраты были известны чуть позднее у арабских математиков, примерно тогда появился принцип сложения матриц. После развития теории определителей в конце 17-го века, Габриэль Крамер начал разрабатывать свою теорию в 18-м столетии и опубликовал «правило Крамера» в 1751 году. Примерно в этом же промежутке времени появился «метод Гаусса». Теория матриц начала своё существование в середине XIX века в работах Уильяма Гамильтона и Артура Кэли. Фундаментальные результаты в теории матриц принадлежат Вейерштрассу, Жордану, Фробениусу. Термин «матрица» ввел Джеймс Сильвестр в 1850 г.[3]

Введение[править | править вики-текст]

Матрицы естественным образом возникают при решении систем линейных уравнений, а, также, при рассмотрении линейных преобразований.

Системы линейных уравнений[править | править вики-текст]

Рассмотрим систему линейных уравнений вида:


\begin{cases}a_{11}x_1 + a_{12}x_2 + \ldots + a_{1n}x_n = b_1
\\a_{21}x_1 + a_{22}x_2 + \ldots + a_{2n}x_n = b_2
\\ \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots
\\a_{m1}x_1 + a_{m2}x_2 + \ldots + a_{mn}x_n = b_m
\end{cases}.

Эта система состоит из m линейных уравнений относительно n неизвестных. Она может быть записана в виде следующего матричного уравнения :

Ax = b,

где

A =
\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n}
\\a_{21} & a_{22} & \cdots & a_{2n}
\\ \vdots & \vdots & \ddots & \vdots
\\ a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} ;

\quad x = \begin{pmatrix} x_{1} \\
 x_{2} \\ \vdots \\ x_{n} \end{pmatrix} ;

\quad b = \begin{pmatrix} b_{1} \\
 b_{2} \\
 \vdots \\
 b_{m} \end{pmatrix}

Матрица A — это матрица коэффициентов системы линейных уравнений, вектор-столбец x — вектор неизвестных, а вектор-столбец b — некоторый заданный вектор.

Для того, чтобы система имела решение (хотя бы одно), необходимо и достаточно, чтобы вектор b был линейной комбинацией столбцов A, и тогда вектор x — это вектор, содержащий коэффициенты разложения вектора b по столбцам матрицыA.

На языке матриц условие разрешимости системы линейных уравнений формулируется в виде теоремы Кронекера-Капелли:

ранг матрицы A равен рангу расширенной матрицы [A|b],

составленной из столбцов A и столбца b.

Важный частный случай. Если количество уравнений совпадает с количеством неизвестных (m = n, т.е. матрица A - квадратная), то условие однозначной разрешимости является равносильным условию обратимости матрицы A.

(Замечание. Разрешимость системы ещё не влечёт невырожденности матрицы. Пример: 0x=0.)

В частности, если матрица A является обратимой, то решение системы может быть записано (а если вычислена A^{-1}, то и найдено) в виде

x = A^{-1}b.

Этот приводит к алгоритму вычисления значений неизвестных по правилу Крамера.

Линейные преобразования[править | править вики-текст]

Рассмотрим линейное преобразование \mathcal{A}\colon\mathbb{R}^n\to\mathbb{R}^m, действующее из n-мерного векторного пространства \mathbb{R}^n в m-мерное векторное пространство \mathbb{R}^m, имеющее следующий вид:


\left\{\begin{array}{rcl}y_1&=&a_{11}x_1 + a_{12}x_2 + \ldots + a_{1n}x_n\\
y_2&=&a_{21}x_1 + a_{22}x_2 + \ldots + a_{2n}x_n\\
& \cdots & \\
y_m&=&a_{m1}x_1 + a_{m2}x_2 + \ldots + a_{mn}x_n\\
\end{array}\right..

В матричной форме это преобразование уравнения вида:

y=Ax.

Матрица A — это матрица коэффициентов линейного преобразования.

Если рассмотреть действие линейного преобразования \mathcal{A} на векторы вида

e_j=(0,\dots,0,1_j,0,\dots,0)^T,\quad j=\overline{1,n},

составляюще базис пространства \mathbb{R}^n, то \mathcal{A}\mathbf{e}_j — это есть j-ый столбец матрицы A.

Таким образом, матрица A полностью описывает линейное преобразование \mathcal{A}, и, поэтому, называется матрицей линейного преобразования.

Определения[править | править вики-текст]

Пусть есть два конечных множества M=\{1,2,\dots,m\} и N=\{1,2,\dots,n\}, где m и n — натуральные числа.

Прямоугольная матрица[править | править вики-текст]

Назовём матрицей размера m\times n (читается m на n) с элементами из некоторого кольца или поля \mathcal{K} отображение вида

A\colon M\times N\to\mathcal{K}.

A(i,j) называется элементом матрицы, находящимся на пересечении i-й строки и j-го столбца;

  • i-я строка матрицы состоит из элементов вида A(i,j), где j пробегает всё множество N;
  • j-й столбец матрицы состоит из элементов вида A(i,j), где i пробегает всё множество M.

Если индекс i пробегает множество M, а j пробегает множество N, то совокупность элементов A(i,j) полностью определяет матрицу.

Таким образом, матрица размера m\times n состоит в точности из

  • m строк (по n элементов в каждой)
  • и n столбцов (по m элементов в каждом)
  • или m n элементов.

В соответствии с этим

  • каждую строку матрицы можно интерпретировать как вектор в n-мерном координатном пространстве \mathcal{K}^{n};
  • каждый столбец матрицы — как вектор в m-мерном координатном пространстве \mathcal{K}^{m}.

Сама матрица естественным образом интерпретируется как вектор в пространстве \mathcal{K}^{mn}, имеющем размерность mn. Это позволяет ввести покомпонентное сложение матриц и умножение матрицы на число (см. ниже); что касается матричного умножения, то оно существенным образом опирается на прямоугольную структуру матрицы.

Квадратная матрица[править | править вики-текст]

Если у матрицы количество строк m совпадает с количеством столбцов n, то такая матрица называется квадратной, а число m=n называется размером квадратной матрицы или её порядком.

Вектор-строка и вектор-столбец[править | править вики-текст]

Матрицы размера m\times 1 и 1\times n являются элементами пространств \mathcal{K}^{m} и \mathcal{K}^{n} соответственно:

  • матрица размера m\times 1 называется вектор-столбцом и имеет специальное обозначение:
\mathrm{colon}\,(a_1,\dots,a_i,\dots,a_m)
=\left( \begin{array}{c}a_1 \\ \vdots \\ a_i \\ \vdots \\ a_m \end{array} \right)
=(a_1,\dots,a_i,\dots,a_m)^{T};
  • матрица размера 1\times n называется вектор-строкой и имеет специальное обозначение:
\mathrm{row}\,(a_1,\dots,a_i,\dots,a_n)=(a_1,\dots,a_i,\dots,a_n);

Элементарные преобразования матриц[править | править вики-текст]

Элементарными преобразованиями строк матрицы называются следующие преобразования:

  1. Умножение строки на число отличное от нуля,
  2. Прибавление одной строки к другой строке,
  3. Перестановка местами двух строк.

Элементарные преобразования столбцов матрицы определяются аналогично.

Ранг матрицы[править | править вики-текст]

Строки и столбцы матрицы являются элементами соответствующих векторных пространств:

  • столбцы матрицы A составляют элементы пространства размерности m;
  • строки матрицы A составляют элементы пространства размерности n.

Рангом матрицы называют количество линейно независимых столбцов матрицы (столбцовый ранг матрицы) или количество линейно независимых строк матрицы (строчный ранг матрицы). Этому определению эквивалентно определение ранга матрицы как порядка максимального отличного от нуля минора матрицы.

При элементарных преобразованиях ранг матрицы не меняется.

Обозначения[править | править вики-текст]

Обычно матрицу обозначают заглавной буквой латинского алфавита: пусть

A\colon M\times N\to\mathcal{K},

тогда A — матрица, которая интерпретируется как прямоугольный массив элементов поля \mathcal{K} вида a_{ij}=A(i,j), где

  • первый индекс означает индекс строки: i=\overline{1,m};
  • второй индекс означает индекс столбца: j=\overline{1,n};

таким образом, a_{ij} — элемент матрицы A, находящийся на пересечении i-й строки и j-го столбца. В соответствии с этим принято следующее компактное обозначение для матрицы размера m\times n:

A=(a_{ij})_{i=1,j=1}^{m,n}

или просто:

A=(a_{ij}),

если нужно просто указать обозначение для элементов матрицы.

Иногда, вместо a_{ij}, пишут a_{i,j}, чтобы отделить индексы друг от друга и избежать смешения с произведением двух чисел.

Если необходимо дать развёрнутое представление матрицы в виде таблицы, то используют запись вида

\begin{pmatrix}
a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{m1} & \cdots & a_{mj} & \cdots & a_{mn}
\end{pmatrix},\quad\left[\begin{array}{ccccc} 
a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{m1} & \cdots & a_{mj} & \cdots & a_{mn}
\end{array}\right],\quad\left\|\begin{array}{ccccc} 
a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\
\vdots & \ddots & \vdots & \ddots & \vdots \\ 
a_{m1} & \cdots & a_{mj} & \cdots & a_{mn}
\end{array}\right\|

Можно встретить как обозначения с круглыми скобками «(…)», так и обозначения с квадратными скобками «[…]». Реже можно встретить обозначения с двойными прямыми линиями "||…||").

Поскольку матрица состоит из строк и столбцов, для них используются следующие обозначения:

a_{i\cdot}=A_i=[
\begin{array}{ccccc}
a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\
\end{array}] — это i-тая строка матрицы A,

а

a_{\cdot j}=A^j=\left[
\begin{array}{c}
a_{1j}\\\vdots \\a_{ij} \\\vdots \\a_{mj} \\
\end{array}\right] — это j-тый столбец матрицы A.

Таким образом, матрица обладает двойственным представлением — по столбцам:

A=[
\begin{array}{ccccc}
A^{1} & \cdots & A^{j} & \cdots & A^{n} \\
\end{array}]

и по строкам:

A=\left[
\begin{array}{c}
A_{1}\\\vdots \\A_{i} \\\vdots \\A_{m} \\
\end{array}\right].

Такое представление позволяет формулировать свойства матриц в терминах строк или в терминах столбцов.

Транспонированная матрица[править | править вики-текст]

С каждой матрицей A=(a_{ij}) размера m\times n связана матрица B=(b_{ji}) размера n\times m вида

b_{ji}=a_{ij},\quad i=\overline{1,n},\quad j=\overline{1,m}.

Такая матрица называется транспонированной матрицей для A и обозначается так A^{T}.

Транспонированную матрицу можно получить, поменяв строки и столбцы матрицы местами.

Диагональная матрица[править | править вики-текст]

Диагональная матрица — квадратная матрица, все элементы которой кроме диагональных — нулевые (i \neq j: a_{ij} = 0), иногда записывается как:

\mathrm{diag}(a_1, a_2, \dots, a_n).

Единичная матрица[править | править вики-текст]

Единичная матрица — матрица, при умножении на которую любая матрица (или вектор) остается неизменной, является диагональной матрицей с единичными (всеми) диагональными элементами:

\mathrm{diag}(1, 1, \dots, 1).

Для ее обозначения чаще всего используется обозначение I или E, а также просто 1 (или 1 специальным шрифтом).

Для обозначения ее элементов также используется символ Кронекера \delta_{ij}, определяемый как:

\delta_{ii} = 1
\delta_{ij} = 0 при i \neq j.

Нулевая матрица[править | править вики-текст]

Для обозначения нулевой матрицы — матрицы, все элементы которой нули (при сложении ее с любой матрицей та остается неизменной, а при умножении на любую получается нулевая матрица) — используется обычно просто 0 или 0 специальным шрифтом, или буква, начертанием похожая на ноль, например \Theta.

Операции над матрицами[править | править вики-текст]

Умножение матрицы на число[править | править вики-текст]

Умножение матрицы A на число  \lambda \in \mathcal{K} заключается в построении матрицы \lambda A = ( \lambda a_{ij} ).

Свойства умножения матриц на число:

  • 1. 1A = A;
  • 2. (λβ)A = λ(βA)
  • 3. (λ+β)A = λA + βA
  • 4. λ(A+B) = λA + λB

Сложение матриц[править | править вики-текст]

Складывать можно только матрицы одинакового размера.

Сложение матриц A + B есть операция нахождения матрицы C, все элементы которой равны попарной сумме всех соответствующих элементов матриц A и B, то есть каждый элемент матрицы C равен

\ c_{ij} = a_{ij} + b_{ij}

Свойства сложения матриц:

  • 3.сложение с нулевой матрицей: A + Θ = A;
  • 4.существование противоположной матрицы: A + (-A) = Θ;

Все свойства линейных операций повторяют аксиомы линейного пространства и поэтому справедлива теорема:

Множество всех матриц одинаковых размеров mxn с элементами из поля P (поля всех действительных или комплексных чисел) образует линейное пространство над полем P (каждая такая матрица является вектором этого пространства). Впрочем, прежде всего во избежание терминологической путаницы, матрицы в обычных контекстах избегают без необходимости (которой нет в наиболее обычных стандартных применениях) и четкого уточнения употребления термина называть векторами.

Умножение матриц[править | править вики-текст]

Matrix multiplication diagram.svg

Умножение матриц (обозначение: A B, реже со знаком умножения A\times B) — есть операция вычисления матрицы C, каждый элемент которой равен сумме произведений элементов в соответствующей строке первого множителя и столбце второго.

\! c_{ij} = \sum^n_{k=1} a_{ik} b_{kj}

Количество столбцов в матрице A должно совпадать с количеством строк в матрице B, иными словами, матрица A обязана быть согласованной с матрицей B. Если матрица A имеет размерность m \times n, B — n \times k, то размерность их произведения A B = C есть m \times k.

Свойства умножения матриц:

  • 3.произведение коммутативно в случае умножения с единичной матрицей: AI = IA;
  • 5.ассоциативность и коммутативность относительно умножения на число: (λA)B = λ(AB) = A(λB);

Умножение вектора на матрицу[править | править вики-текст]

По обычным правилам матричного умножения осуществляется умножение на матрицу слева вектора-столбца, а также умножение вектора-строки на матрицу справа. Поскольку элементы вектора-столбца или вектора-строки можно записать (что обычно и делается), используя один, а не два индекса, это умножение можно записать так:

для вектора-столбца v (получая новый вектор-столбец Av):

 (Av)_{i} = \sum^n_{k=1} a_{ik} v_{k},

для вектора-строки s (получая новый вектор-строку sA):

 (sA)_{i} = \sum^n_{k=1} s_k a_{ki}.

Вектор-строка, матрица и вектор-столбец могут быть умножены друг на друга, давая число (скаляр):

 sAv = \sum\limits_{k,i} s_k a_{ki} v_i.

(Порядок важен: вектор-строка слева, вектор-столбец справа от матрицы).

Эти операции являются основой матричного представления линейных операторов и линейных преобразований координат (смены базисов), таких, как повороты, масштабирования, зеркальные отражения, а также (последнее) матричного представления билинейных (квадратичных) форм.

  • При представлении вектора вещественного векторного пространства в ортонормированном базисе (что эквивалентно использованию прямоугольных декартовых координат) соответствующие ему вектор-столбец и вектор-строка, представляющие собой набор компонент вектора, будут совпадать (поэлементно), отличаясь лишь формально своим изображением для корректности матричных операций (то есть один получается из другого просто операцией транспонирования). При использовании же неортонормированных базисов (например, косоугольных координат или хотя бы разных масштабов по осям) вектор-столбец соответствует компонентам вектора в основном базисе, а вектор-строка — в базисе, дуальном основному[4] (Иногда о пространстве векторов-строк говорят также как об особом, дуальном пространству векторов-столбцов, пространстве ковекторов).

Заметим, что обычной мотивировкой введения матриц и определения операции матричного умножения (см.тж.в статье об умножении матриц) является именно введение их, начиная с умножения вектора на матрицу (которое вводится исходя из преобразований базиса или вообще линейных операций над векторами), а уже затем композиции преобразований сопоставляется произведение матриц. Действительно, если новый вектор Av, полученный из исходного вектора v преобразованием, представимым умножением на матрицу A, преобразовать теперь ещё раз, преобразованием, представимым умножением на матрицу B, получив B(Av), то, исходя из правила умножения вектора на матрицу, приведенного в начале этого параграфа (используя ассоциативность умножения чисел и меняя порядок суммирования), нетрудно увидеть в результате формулу, дающую элементы матрицы (BA), представляющую композицию первого и второго преобразований, и совпадающую с обычным определением матричного умножения.

Комплексное сопряжение[править | править вики-текст]

Если элементами матрицы A = (a_{ij}) являются комплексные числа, то комплексно сопряжённая (не путать с эрмитово сопряжённой! см. далее) матрица равна \bar A = (\bar a_{i,j} ). Здесь \bar a — число, комплексно сопряжённое к a.

Транспонирование и эрмитово сопряжение[править | править вики-текст]

Транспонирование уже обсуждалось выше: если A = (a_{ij}), то A^T = (a_{ji}). Для комплексных матриц более употребительно эрмитово сопряжение: A^* = \bar A^T. С точки зрения операторного взгляда на матрицы, транспонированная и эрмитово сопряжённая матрица — это матрицы оператора, сопряжённого относительно скалярного или эрмитова произведения, соответственно.

След[править | править вики-текст]

Для квадратной матрицы A сумма диагональных элементов (т.е. главных миноров первого порядка) называется следом:

\mathrm{Tr} A = \sum\limits_{i}a_{ii} = a_{11}+ \ldots +a_{nn}

(другие обозначения \mathrm{Trace}, \mathrm{Sp}, \mathrm{Spur}).

Свойства. 1. Если определены AB и BA, то

\mathrm{Tr} (AB) = \mathrm{Tr} (BA).

2. След является инвариантом преобразований подобия матрицы, т.е. если S невырождена, то \mathrm{Tr} A = \mathrm{Tr} (S^{-1}AS).
3. След равен сумме (всех, с учётом кратности) собственных значений матрицы:

\mathrm{Tr} A = \sum\limits_{i}\lambda_{i} = \lambda_{1}+ \ldots +\lambda_{n}.

Более того, для любого целого (положительного) числа k выполняется

\mathrm{Tr} (A^{k}) = \sum\limits_{i}\lambda_{i}^{k} = \lambda_{1}^{k}+ \ldots +\lambda_{n}^{k}.

Определитель (детерминант)[править | править вики-текст]

Перманент[править | править вики-текст]

Связанные понятия[править | править вики-текст]

Линейные комбинации[править | править вики-текст]

В векторном пространстве линейной комбинацией векторов \mathbf{x}_1,\dots,\mathbf{x}_n называется вектор

\mathbf{x}=a_1\mathbf{x}_1+\dots+a_n\mathbf{x}_n,

где a_1,\dots,a_n — коэффициенты разложения:

  • если все коэффициенты равны нулю, то такая комбинация называется тривиальной,
  • если же хотя бы один коэффициент отличен от нуля, то такая комбинация называется нетривиальной.

Это позволяет описать произведение C=AB матриц A и B терминах линейных комбинаций:

  • столбцы матрицы C — это линейные комбинации столбцов матрицы A с коэффициентами, взятыми из матрицы B;
  • строки матрицы C — это линейные комбинации строк матрицы B с коэффициентами, взятыми из матрицы A.

Линейная зависимость[править | править вики-текст]

Если какой-либо вектор можно представить в виде линейной комбинации, то говорят о линейной зависимости данного вектора от элементов комбинации.

Точнее, говорят так: некоторая совокупность элементов векторного пространства называется линейно зависимой, если существует равная нулю линейная комбинация элементов данной совокупности или

\mathbf{0}=a_1\mathbf{x_1}+\dots+a_n\mathbf{x_n},

где не все числа a_1,\dots,a_n равны нулю; если такой нетривиальной комбинации не существует, то данная совокупность векторов называется линейно независимой.

Линейная зависимость векторов означает, что какой-то вектор заданной совокупности линейно выражается через остальные векторы.

Каждая матрица представляет собой совокупность векторов (одного и того же пространства). Две такие матрицы — две совокупности. Если каждый вектор одной совокупности линейно выражается через векторы другой совокупности, то на языке теории матриц этот факт описывается при помощи произведения матриц:

  • если строки матрицы C линейно зависят от строк матрицы B, то C=AB для некоторой матрицы A;
  • если столбцы матрицы C линейно зависят от столбцов другой матрицы A, то C=AB для некоторой матрицы B.

Свойства[править | править вики-текст]

Матричные операции[править | править вики-текст]

Сложение и вычитание допускается только для матриц одинакового размера.

Существует нулевая матрица \Theta такая, что её прибавление к другой матрице A не изменяет A, то есть

A + \Theta = A

Все элементы нулевой матрицы равны нулю.

Возводить в степень можно только квадратные матрицы.

Примеры[править | править вики-текст]

Квадратная матрица и смежные определения[править | править вики-текст]

Если количество строк матрицы равно количеству столбцов, то такая матрица называется квадратной.

Для квадратных матриц существует единичная матрица E (аналог единицы для операции умножения чисел) такая, что умножение любой матрицы на неё не влияет на результат, а именно

EA = AE = A

У единичной матрицы единицы стоят только по главной диагонали, остальные элементы равны нулю

E = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix}

Для некоторых квадратных матриц можно найти так называемую обратную матрицу. Обратная матрица A^{-1} такова, что если матрицу умножить на обратную ей матрицу, то получится единичная матрица:

A A^{- 1} = E

Обратная матрица существует не всегда. Матрицы, для которых обратная матрица существует, называются невырожденными (или регулярными), а для которых нет — вырожденными (или сингулярными). Матрица невырождена, если все ее строки (столбцы) линейно независимы как векторы. Максимальное число линейно независимых строк (столбцов) называется рангом матрицы. Определителем (детерминантом) матрицы называется значение нормированной кососимметрической (антисимметрической) полилинейной формы валентности (p;\;0) на столбцах матрицы. Квадратная матрица над числовым полем вырождена тогда и только тогда, когда ее определитель равен нулю.

Кольцо матриц[править | править вики-текст]

Из указанных выше свойств сложения и умножения матриц (ассоциативность и коммутативность сложения, дистрибутивность умножения, существование нулевой и противоположной по сложению матрицы) следует, что квадратные матрицы n на n с элементами из любого кольца R образуют кольцо, изоморфное кольцу эндоморфизмов свободного модуля Rn. Это кольцо обозначается M(n,R) или M_n(R). Если же R — коммутативное кольцо, M(n,R) является также ассоциативной алгеброй над R. Определитель матрицы с элементами из коммутативного кольца можно вычислять по обычной формуле, при этом матрица будет обратима тогда и только тогда, когда её определитель обратим в R. Это обобщает ситуацию с матрицами с элементами из поля, так как в поле обратим любой элемент, кроме нуля.

Матрицы в теории групп[править | править вики-текст]

Матрицы играют важную роль в теории групп. Они используются при построении общих линейных групп, специальных линейных групп, диагональных групп, треугольных групп, унитреугольных групп.

Конечную группу (в частности, симметрическую) можно (изоморфно) промоделировать матрицами перестановок (содержащими только «0» и «1»),

например, для S_3 : 
\begin{pmatrix} 1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 1\end{pmatrix} , 
\begin{pmatrix} 0 & 1 & 0\\0 & 0 & 1\\1 & 0 & 0\end{pmatrix} , 
\begin{pmatrix} 0 & 0 & 1\\1 & 0 & 0\\0 & 1 & 0\end{pmatrix} ,  
\begin{pmatrix} 0 & 1 & 0\\1 & 0 & 0\\0 & 0 & 1\end{pmatrix} , 
\begin{pmatrix} 0 & 0 & 1\\0 & 1 & 0\\1 & 0 & 0\end{pmatrix} , 
\begin{pmatrix} 1 & 0 & 0\\0 & 0 & 1\\0 & 1 & 0\end{pmatrix} .

Поле  \mathbb{C} комплексных чисел может быть (изоморфно) промоделировано над полем  \mathbb{R} вещественных чисел:

для z = x + i y , \quad c = a + i b \in \mathbb{C} матричные аналоги 
Z = \begin{pmatrix} x & y\\-y & x \end{pmatrix}
, 
C = \begin{pmatrix} a & b\\-b & a \end{pmatrix}
, где x , y , a , b \in \mathbb{R}  ;

z + c = (x + a)+ i(y + b) соответствует 
Z + C = \begin{pmatrix} x + a & y + b\\- y - b & x + a\end{pmatrix}
 ;

z c = (x a - y b)+ i(x b + y a) соответствует 
Z C = \begin{pmatrix} x a - y b & x b + y a\\- y a - x b & - y b + x a\end{pmatrix}
 ;

\bar{z} = x - i y соответствует 
Z^T = \begin{pmatrix} x & -y\\y & x \end{pmatrix}
 ;

|z|^2 = z \bar{z}= x^2 + y^2=det(Z) \in \mathbb{R}  ;

\frac{1}{z} = \frac{\bar{z}}{z \bar{z}} = \frac{x - i y}{x^2 + y^2} 
при  z \ne 0 
соответствует 
Z^{-1} = \frac{Z^T}{det(Z)}
при det(Z) \ne 0  ;

e^z = e^{x + i y} = e^x (cos(y) + i\, sin(y)) соответствует 
e^x \begin{pmatrix} cos(y) & sin(y)\\-sin(y) & cos(y) \end{pmatrix}
.

В частности, для 
E = \begin{pmatrix} 1 & 0\\0 & 1 \end{pmatrix}
, 
I = \begin{pmatrix} 0 & 1\\-1 & 0 \end{pmatrix}

z = x + i y \in \mathbb{C} 
соответствует  
Z = x E + y I ,

где  I^2=-E .

Замечание. Модель имеет автоморфизм  (I \to -I) , то есть  Z \to Z^T

Тело кватернионов  \mathbb{H} может быть (изоморфно) промоделировано над полем  \mathbb{R} вещественных чисел:

для  q = t + i x + j y + k z  \in \mathbb{H} матричный аналог 
Q = \begin{pmatrix}
 t & x & y & -z\\
-x & t & -z & -y\\
-y & z & t & x\\
z & y & -x & t
\end{pmatrix}
, где t , x , y , z \in \mathbb{R} .

Для того, чтобы кватерниону  q = t + i x + j y + k z соответствовала матрица  Q = t E + x I + y J + z K ,

где  I^2=J^2=K^2=-E , 
IJ=-JI=K , 
JK=-KJ=I , 
KI=-IK=J ,

можно ввести базисные элементы


E = \begin{pmatrix} 1 & 0 & 0 & 0\\0 & 1 & 0 & 0\\0 & 0 & 1 & 0\\0 & 0 & 0 & 1\end{pmatrix}
, 
I = \begin{pmatrix} 0 & a & 0 & 0\\-a & 0 & 0 & 0\\0 & 0 & 0 & b\\0 & 0 & -b & 0\end{pmatrix}
, 
J = \begin{pmatrix} 0 & 0 & c & 0\\0 & 0 & 0 & d\\-c & 0 & 0 & 0\\0 & -d & 0 & 0\end{pmatrix}
, 
K = \begin{pmatrix} 0 & 0 & 0 & ad\\0 & 0 & -ac & 0\\0 & -bd & 0 & 0\\bc & 0 & 0 & 0\end{pmatrix}
.

Параметры должны удовлетворять условиям:  a , b , c , d \in \left \{ -1, +1 \right \} и  abcd = -1 .

Существует 8 решений (8 представлений).

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Под треугольными матрицами сейчас понимают матрицы, ненулевые элементы которых заполняют в таблице матрицы треугольную область, остальные же элементы — нули.
  2. Этот изоморфизм полностью задается выбором базиса в линейном пространстве: при фиксированном базисе изоморфизм фиксирован и таким образом реализована взаимная однозначность соответствия матриц операторам. Это не означает того, что такой изоморфизм в принципе единственный: в другом базисе тем же линейным операторам будут соответствовать другие матрицы (тоже взаимно однозначно при фиксации этого нового базиса).
  3. Даан-Дальмедико А., Пейффер Ж. Пути и лабиринты. Очерки по истории математики: Пер. с франц. — М.: Мир, 1986. — С. 397.
  4. Формально в этом определении всё симметрично, и можно было бы поменять «основной» и дуальный базис местами (они оба просто взаимно дуальны), однако принято именно описанное соглашение.

Литература[править | править вики-текст]

  • Беллман Р. Введение в теорию матриц. — М.: Мир, 1969 (djvu).
  • Биркгоф Г. (Garrett Birkhoff), Барти Т. (Thomas C. Bartee) Современная прикладная алгебра. — М.: Мир, 1976, 400 стр. с илл.
  • Ван дер Варден Б. Л. (B. L. van der Waerden) Алгебра. (2-е изд.) — М.: Наука, 1979, 624 стр. с илл.
  • Гантмахер Ф. Р. Теория матриц.- 5-е изд.— М.: ФизМатЛит, 2004.- 560 с.- ISBN 5-9221-0524-8.; (2-е изд.).- М.: Наука, 1966 (djvu).
  • Голуб Дж. (Gene H. Golub), Ван Лоун Ч. (Charles F. Van Loan) Матричные вычисления. — М.: Мир, 1999, 548с., ил. (ISBN 5-03-002406-9)
  • Курош А. Г. Курс высшей алгебры. (9-е изд.) — М.: Наука, 1968, 432 стр. с илл.
  • Курош А. Г. Лекции по общей алгебре. (2-е изд.) — М.: Наука, 1973, 400 стр. с илл.
  • Ланкастер П. (P. Lankaster) Теория матриц: Пер. с англ.- 2-е изд.- М.: Наука, 1982.- 272с.; (1-е изд.).- М.: Наука, 1973 (djvu).
  • Ленг С. (Serge Lang) Алгебра. — М.: Мир, 1968, 564с., ил.
  • Наймарк М. А. Теория представлений групп. — М.: Наука, 1976, 560 стр. с илл.
  • Соколов Н. П. Пространственные матрицы и их приложения. — М.: ГИФМЛ, 1960 (djvu).
  • Хорн Р. (Roger A. Horn), Джонсон Ч. (Charles C. Johnson) Матричный анализ. — М.: Мир, 1989, 655с., ил. (ISBN 5-03-001042-4)
  • Халмош П. Конечномерные векторные пространства = Finite-dimensional vector spaces. — М.: Физматгиз, 1963. — 264 с.