Метод максимального правдоподобия
Материал из Википедии — свободной энциклопедии
| Эту страницу предлагается объединить с Принцип максимального правдоподобия
Пояснение причин и обсуждение — на странице Википедия:К объединению/3 июня 2009.
Обсуждение длится одну неделю (или дольше, если оно идёт медленно). Дата постановки — 3 июня 2009. Если обсуждение не требуется (очевидный случай), используйте другие шаблоны. |
Ме́тод максима́льного правдоподо́бия в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. (Фишер — 1912 г.[1])
Содержание |
[править] Определение
Пусть есть выборка
из распределения
, где
— неизвестный параметр. Пусть
— функция правдоподобия, где
. Точечная оценка
называется оце́нкой максима́льного правдоподо́бия параметра θ. Таким образом оценка максимального правдоподобия — это такая оценка, которая максимизирует функцию правдоподобия при фиксированной реализации выборки.
[править] Замечание
- Так как функция
монотонно возрастает на всей области определения, максимум любой функции f(θ) является максимумом функции lnf(θ), и наоборот. Таким образом
,
где L — логарифмическая функция правдоподобия.
- Оценка максимального правдоподобия, вообще говоря, может быть смещённой (см. примеры).
[править] Примеры
- Пусть
— независимая выборка из непрерывного равномерного распределения на отрезке [0,θ], где θ > 0 — неизвестный параметр. Тогда функция правдоподобия имеет вид
Последнее равенство может быть переписано в виде:
где
, откуда видно, что своего максимума функция правдоподобия достигает в точке
. Таким образом
.
- Пусть
— независимая выборка из нормального распределения с неизвестными средним и дисперсией. Построим оценку максимального правдоподобия
для неизвестного вектора параметров
. Логарифмическая функция правдоподобия принимает вид
.
Чтобы найти её максимум, приравняем к нулю частные производные:
откуда
[править] Примечания
- ↑ Математический энциклопедический словарь, М.: Советская энциклопедия, 1988.

![f(\mathbf{x} \mid \theta ) =
\left\{
\begin{matrix}
\frac{1}{\theta^n}, & \mathbf{x} \in [0,\theta]^n \subset \mathbb{R}^n \\
0, & \mathbf{x} \not\in [0,\theta]^n
\end{matrix}
\right..](http://upload.wikimedia.org/math/e/a/b/eab1e3688dfa5a6368b6f946162b777c.png)

![\left\{
\begin{matrix}
\displaystyle \frac{\partial}{\partial \mu} L(\mathbf{x} \mid \mu, \sigma^2 ) = 0 \\[10pt]
\displaystyle \frac{\partial}{\partial \sigma^2} L(\mathbf{x} \mid \mu, \sigma^2 ) = 0 \\
\end{matrix}
\right. \Rightarrow
\left\{
\begin{matrix}
\displaystyle \frac{ \sum\limits_{i=1}^n X_i - n \mu}{\sigma^2} = 0 \\[10pt]
\displaystyle -\frac{n}{2 \sigma^2} +\frac{\sum\limits_{i=1}^n (X_i - \mu)^2}{2 \left(\sigma^2\right)^2} = 0 \\
\end{matrix}
\right.,](http://upload.wikimedia.org/math/5/8/f/58ff1bcdf2079539bd5291b11fd29310.png)
—
— 
