Функция правдоподобия

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Фу́нкция правдоподо́бия в математической статистике — это совместное распределение выборки из параметрического распределения, рассматриваемое как функция параметра. При этом используется совместная функция плотности (в случае выборки из непрерывного распределения) либо совместная вероятность (в случае выборки из дискретного распределения), вычисленные для данных выборочных значений.

Понятия вероятности и правдоподобия тесно связаны. Сравните два предложения:

  • «Какова вероятность выпадения 12 очков в каждом из ста бросков двух костей?»
  • «Насколько правдоподобно, что кости не шулерские, если из ста бросков в каждом выпало 12 очков?»

Если распределение вероятности зависит от параметра, то с одной стороны можно рассматривать вероятность некоторых событий при заданном параметре, а с другой стороны — вероятность заданного события при различных значениях параметра. То есть в первом случае имеем функцию, зависящую от события, а во втором — от параметра при фиксированном событии. Последний вариант является функцией правдоподобия и показывает, насколько правдоподобен выбранный параметр при заданном событии. Неформально: если вероятность позволяет нам предсказывать неизвестные результаты, основанные на известных параметрах, то правдоподобие позволяет нам оценивать неизвестные параметры, основанные на известных результатах.

L(\theta \mid x) = p_\theta (x) = P_\theta (X=x),

Важно понимать, что по абсолютному значению правдоподобия нельзя делать никаких вероятностных суждений. Правдоподобие позволяет сравнить несколько вероятностных распределений с разными параметрами и оценить в контексте какого из них наблюдаемые события наиболее вероятны.

Определение[править | править исходный текст]

Пусть есть параметрическое семейство распределений вероятности \{\mathbb{P}_{\theta}\}_{\theta \in \Theta}. Пусть дана выборка X_1,\ldots, X_n \sim \mathbb{P}_{\theta} для некоторого \theta \in \Theta. Предположим, что совместное распределение этой выборки задаётся функцией f_{\mathbf{X}}(\mathbf{x} \mid \theta ),\; \mathbf{x}\in \mathbb{R}^n, где f_{\mathbf{X}} является либо плотностью вероятности, либо функцией вероятности случайного вектора \mathbf{X} = (X_1,\ldots, X_n)^{\top}.

Для фиксированной реализации выборки \mathbf{X} = \mathbf{x} функция f_{\mathbf{X}}(\mathbf{x}\mid \theta )\colon \Theta \to \mathbb{R} называется функцией правдоподобия.

Логарифмическая функция правдоподобия[править | править исходный текст]

Во многих приложениях необходимо найти максимум функции правдоподобия, что связано с вычислением производной. Логарифм — монотонно возрастающая функция, поэтому логарифм от функции достигнет максимума в той же точке, что и сама функция. С другой стороны, логарифм произведения является суммой, что упрощает дифференцирование. Поэтому для практических вычислений предпочитают использовать логарифм функции правдоподобия.

  • Функция L(\mathbf{x} \mid \theta ), где
L(\mathbf{x} \mid \theta ) = \ln f_{\mathbf{X}}(\mathbf{x} \mid \theta ),

называется логарифми́ческой фу́нкцией правдоподо́бия.

f_{\mathbf{X}}(\mathbf{x} \mid \theta ) = \prod\limits_{i=1}^n f_X(x_i \mid \theta),

где f_X(\cdot \mid \theta ) — плотность или функция вероятности распределения \mathbb{P}_{\theta}. Логарифмическая функция правдоподобия в этом случае имеет вид:

L(\mathbf{x} \mid \theta ) = \sum\limits_{i=1}^n \ln f_X(x_i \mid \theta ).

Замечания[править | править исходный текст]

Функция правдоподобия для оценки вероятности выпадения двух орлов, в зависимости от вероятности выпадения одного

Нельзя путать правдоподобие с вероятностью появления распределения с выбранным параметром. Как минимум, интеграл от функции плотности вероятности по параметру, не обязан быть единицей. Рассмотрим вероятность последовательного выпадания орла в двух бросках одной монеты. Вероятность OO = p_\text{O}^2. Если p_\text{O} = 0{,}5, то

P(\text{OO} \mid p_\text{O}=0{,}5) = 0{,}25.

Правдоподобность того, что вероятность выпадения одного орла равна 0,5, при условии того, что два выпадают с вероятностью 0,25.

L(p_\text{O}=0{,}5 \mid \text{OO}) = P(\text{OO} \mid p_\text{O}=0{,}5) = 0{,}25.

Но это не тоже самое, что «вероятность того, что p_\text{O} = 0{,}5, если выпало подряд два орла, равна 0,25». Заметьте, правдоподобность утверждения p_\text{O} = 1 равна единице.

История[править | править исходный текст]

Впервые правдоподобие было упомянуто в книге Торвальда Тиле, опубликованной в 1889 году[1].

Полное описание идеи правдоподобия впервые было дано Рональдом Фишером в 1922 году в работе «Математические основы теоретической статистики»[2] (англ.). В этой работе Фишер также использует термин метод максимального правдоподобия. Фишер возражает против использования обратной вероятности как основы статистических заключений и предлагает вместо неё использовать функцию правдоподобия.

См. также[править | править исходный текст]

Примечания[править | править исходный текст]

  1. Steffen L. Lauritzen, Aspects of T. N. Thiele’s Contributions to Statistics (1999). (англ.)
  2. Ronald A. Fisher. «On the mathematical foundations of theoretical statistics». Philosophical Transactions of the Royal Society, A, 222:309-368 (1922). («правдоподобие» упомянуто в разделе 6.)