Теорема Карунена — Лоэва

Материал из Википедии — свободной энциклопедии
(перенаправлено с «Теорема Кархунена-Лоэва»)
Перейти к: навигация, поиск

Важным принципиальным вопросом теории дискретизации является вопрос об объеме дискретного описания сигналов, то есть о количестве N базисных функций, используемых для представления:

a(t)=\sum_{k=0}^{N-1}\alpha_{k}\varphi_{k}(t).

Чтобы найти оптимальный базис, нужно определить класс сигналов, для которого он отыскивается, а также задать точность восстановления для этого класса. При статистическом подходе к описанию сигналов оптимальным N - мерным базисом для представления отдельных реализаций сигналов обычно считается базис, при котором норма ошибки, усредненная по ансамблю реализаций, минимальна. В этом случае необходимые и достаточные условия минимума нормы ошибки представления сигнала в виде суммы базисных функций определяет теорема Карунена-Лоэва.

Популярная формулировка[править | править вики-текст]

Минимальное значение нормы ошибки представления сигналов на интервале протяженностью T достигается при использовании в качестве базиса собственных функций оператора, ядром которого является корреляционная функция сигналов R_{a}(t, \tau):

\int_{-\frac{T}{2}}^{\frac{T}{2}}R_{a}(t, \tau)\varphi_{k}(\tau)d\tau=\lambda_{k}\varphi_{k}(t),

соотвествующих N наибольшим собственным значениям. При этом норма ошибки равна:

\| \epsilon  \|^{2}_{min}=\|a(t)-\sum_{k=0}^{N-1}\alpha_{k}\varphi_{k}(t)\|^{2}_{min}=\sum_{k=N}^{\infty}\lambda_{k}.

Такое разложение является разложением Карунена-Лоэва[1][2].

Применение[править | править вики-текст]

В теории случайных процессов теорема Карунена-Лоэва (названа в честь Кари Карунена и Мишеля Лоэва) — представление случайного процесса в виде бесконечной линейной комбинации ортогональных функций, аналогичное представлению рядов Фурье — последовательному представлению функций на ограниченном интервале. В отличие от рядов Фурье, где коэффициенты являются действительными числами и базис представления состоит из синусоидальных функций (то есть, из функций синус и косинус с разными частотами), коэффициенты в теореме Карунена-Лоэва — случайные переменные, и базис представления зависит от процесса. Ортогональные базисные функции, использованные в этом представлении, определяет функция ковариации процесса. Если мы рассматриваем стохастический процесс как случайную функцию F, то есть процесс, в котором функция на интервале [a, b] принимает значение F, то эта теорема может рассматриваться как случайное ортонормальное разложение F.

Центрированный случайный процесс {Xt}t ∈ [a, b] (где центрирование означает, что математические ожидания E(Xt) существуют и равны нулю для всех значений параметра t из [a, b]), удовлетворяющий техническому условию непрерывности, допускает разложение следующего вида:

 \mathbf{X}_t = \sum_{k=1}^\infty \mathbf{Z}_k e_k(t).

где Zk — взаимнонекоррелированые случайные величины и функции ek — непрерывные вещественные функции на [a, b], ортогональные в L² [a, b]. В случае нецентрированного процесса имеет место аналогичное разложение, получаемое разложением функции математического ожидания в базисе ek.

Если процесс  \mathbf{X}_t гауссовский, то случайные величины Zk — тоже гауссовские и являются независимыми. Этот результат обобщает преобразования Карунена-Лоэва. Важным примером центрированного случайного процесса на интервале [0,1] является винеровский процесс, и теорема Карунена-Лоэва может быть использована для получения канонического ортогонального представления. В этом случае разложение состоит из синусоидальных функций.

Приведенные выше разложения в также известны как разложения или декомпозиция Карунена-Лоэва (эмпирическая версия, то есть, с коэффициентами из исходных числовых данных), как анализ главных компонент, собственное ортогональное разложение или преобразование Хотеллинга.

Формулировка[править | править вики-текст]

Сформулируем результат в терминах комплекснозначных стохастических процессов. Результаты могут быть применены к вещественнозначным процессам без модификаций, вспоминая, что число, комплексно-сопряженное с действительным числом, совпадает с ним самим.

Для случайных элементов X и Y скалярное произведение определяется формулой

 \langle \mathbf{X}|\mathbf{Y} \rangle = \operatorname{E}(\mathbf{X^*}\mathbf{Y})

где * обозначает операцию комплексного сопряжения.

Статистики второго порядка[править | править вики-текст]

Скалярное произведение корректно определено, если как X, так и Y имеют конечные вторые моменты, или, что то же самое, если они оба квадратично интегрируемы. Отметим, что скалярное произведение связано с ковариацией и корреляцией. В частности, для случайных переменных со средним нулевым значением, ковариация и скалярное произведение совпадают. Функция автоковариации K_\mathrm{XX}

 K_\mathrm{XX}(t,s) =  \operatorname{Cov}[ X(t),X(s)  ]  = \langle \mathbf{X}_t | \mathbf{X}_s \rangle
=  \mathrm{E} \{ [ X(t)-\mu_X(t) ]^* [ X(s)-\mu_X(s) ]  \}  \,
=  \mathrm{E} \{  X^*(t)  X(s)  \} - \mu^*_X(t) \mu_X(s)  \,
= R_\mathrm{XX}(t,s)   - \mu^*_X(t) \mu_X(s) . \,

Если процесс {Xt}t центрированный, то

\mu_X(t) = 0  \,

для всех t. Таким образом, автоковариация KXX равна автокорреляции RXX:

 K_\mathrm{XX}(t,s) = R_\mathrm{XX}(t,s) . \,

Отметим, что если {Xt}t центрированный и t1, ≤ t2, …, ≤ tN являются точками на интервале [a, b], следовательно

 \sum_{k,\ell} \operatorname{Cov}_{\mathbf{X}}(t_k,t_\ell) = \operatorname{Var}\left(\sum_{k=1}^N \mathbf{X}_k\right) \geq 0.

Формулировка теоремы[править | править вики-текст]

Теорема. Рассмотрим центрированный случайный процесс \{\mathbf{X}_t\}, индексированный t на интервале [a,b] с ковариационной функцией \mathrm{Cov}_{\mathbf{X}}. Предположим, что ковариационная функция \mathrm{Cov}_{\mathbf{X}}(t,s) непрерывна по совокупности переменных t, s. Тогда \mathrm{Cov}_{\mathbf{X}} — положительно определенное ядро, и по теореме Мерсера интегральный оператор T в L^2[a,b] (близкой к мере Лебега на [a,b]) имеет ортонормированный базис из собственных векторов. Пусть \{e_i\} являются собственными векторами T, соответствующими ненулевым собственным значениям и

 \mathbf{Z}_i = \int_a^b \mathbf{X}_t e_i(t) dt.

Тогда Z_i — центрированные ортогональные случайные величины и

 \mathbf{X}_t = \sum_{i=1}^\infty e_i(t) \mathbf{Z}_i

ряд сходится в среднем квадратичном, а также равномерно по t. Кроме того

 \operatorname{Var}(\mathbf{Z}_i) = \operatorname{E}(\mathbf{Z}_i^2) = \lambda_i.

где \lambda_i собственное значение, соответствующее собственному вектору e_i.

Суммы Коши[править | править вики-текст]

В формулировке теоремы интеграл в определении Z_i можно понимать как предел в среднем сумм Коши случайных величин

 \sum_{k=0}^{\ell-1} \mathbf{X}_{\xi_k} e_i(\xi_k) (t_{k+1} - t_k),

где

 a = t_0 \leq \xi_0 \leq t_1 \leq \cdots \leq \xi_{\ell-1} \leq t_n = b

Особый случай: гауссовское распределение[править | править вики-текст]

Так как предел в среднем квадратичном из совместно гауссовских случайных величин является гауссовским и совместно гауссовские случайные (центрированные) величины независимы тогда и только тогда, когда они являются ортогональными, мы можем также заключить:

Теорема. Случайные величины Z_i имеют гауссовское распределение и являются независимыми, если первоначальный процесс {Xt}t тоже является гауссовским.

В гауссовском случае, поскольку случайные величины Z_i являются независимыми, мы можем быть уверены в том, что:

 \lim_{N \rightarrow \infty} \sum_{i=1}^N e_i(t) \mathbf{Z}_i(\omega) = \mathbf{X}_t(\omega)

почти наверное.

Отметим, что обобщая теорему Мерсера, мы можем заменить интервал [a,b] другими компактными пространствами C , а меру Лебега на [a,b] — борелевской мерой с носителем в C.

Винеровский процесс[править | править вики-текст]

Винеровский процесс в теории случайных процессов — это математическая модель броуновского движения или случайного блуждания с непрерывным временем. Здесь мы определяем его как центрированный гауссовский процесс B(t) с ковариационной функцией

 \mathrm{K}_\mathrm{BB}(t,s)  = \operatorname{Cov}(B(t),B(s)) =  \min (s,t).

Легко видеть, что собственные векторы ковариации равны

 e_k(t) = \sqrt{2} \sin \left(k - \frac{1}{2}\right) \pi t

а соответствующие собственные значения

 \lambda_k = \frac{4}{(2 k -1)^2 \pi^2}.

Это позволяет получить нам следующее представление винеровского процесса:

Теорема. Существует последовательность {Wi}i независимых гауссовких случайных величин с нулевым средним и единичной дисперсией такая, что

 \mathbf{B}_t = \sqrt{2} \sum_{k=1}^\infty \mathbf{W}_k \frac{\sin \left(k - \frac{1}{2}\right) \pi t}{ \left(k - \frac{1}{2}\right) \pi}.

Сходимость является равномерной по t в норме L² так, что

 \operatorname{E}\left(\mathbf{B}_t - \sqrt{2} \sum_{k=1}^n \mathbf{W}_k \frac{\sin \left(k - \frac{1}{2}\right) \pi t}{ \left(k - \frac{1}{2}\right) \pi} \right)^2 \rightarrow 0

равномерно по t.

Использование[править | править вики-текст]

Было высказано мнение, что в проекте SETI следует использовать преобразования Карунена-Лоэва для обнаружения сигналов с очень широким спектром. Аналогично, в системах адаптивной оптики иногда используют функции Карунена-Лоэва для восстановления информации о фазе фронта волны. (Dai 1996, JOSA A).

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]

  • И. И. Гихман, А. В. Скороход, Введение в теорию случайных процессов.- М.: Наука, 1965.
  • B. Simon, Functional Integration and Quantum Physics, Academic Press, 1979
  • K. Karhunen, Kari, Uber lineare Methoden in der Wahrscheinlichkeitsrechnung, Ann. Acad. Sci. Fennicae. Ser. A. I. Math.-Phys., 1947, No. 37, 1-79
  • М. Лоев, Теория вероятностей, — М.: ИЛ, 1962.
  • G. Dai, Modal wave-front reconstruction with Zernike polynomials and Karhunen-Loeve functions, JOSA A, 13, 6, 1996

Примечания[править | править вики-текст]

Литература[править | править вики-текст]

  • Ярославский Л. П. Введение в цифровую обработку изображений. — М.: Советское радио, 1979. — 312 с.
  • Френкс Л. Теория сигналов. — М.: Советское радио, 1974. — 399 с.