Распределение вероятностей

Материал из Википедии — свободной энциклопедии
(перенаправлено с «Распределение вероятности»)
Перейти к: навигация, поиск

Распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода (появления).

Определение[править | править вики-текст]

Определение 1. Пусть задано вероятностное пространство (\Omega, \mathcal{F}, \mathbb{P}), и на нём определена случайная величина X:\Omega \to \mathbb{R}. В частности, по определению, X является измеримым отображением измеримого пространства (\Omega, \mathcal{F}) в измеримое пространство (\mathbb{R},\mathcal{B}(\mathbb{R})), где \mathcal{B}(\mathbb{R}) обозначает борелевскую сигма-алгебру на \mathbb{R}. Тогда случайная величина X индуцирует вероятностную меру \mathbb{P}^X на \mathbb{R} следующим образом:

\mathbb{P}^X(B) = \mathbb{P}(X^{-1}(B)),\; \forall B\in \mathcal{B}(\mathbb{R}).

Мера \mathbb{P}^X называется распределением случайной величины X. Иными словами, \mathbb{P}^X(B)=\mathbb{P}(X\in B), таким образом \mathbb{P}^X(B) задаёт вероятность того, что случайная величина X попадает во множество B\in \mathcal{B}(\mathbb{R}).

Способы задания распределений[править | править вики-текст]

Определение 2. Функция F_X(x) = \mathbb{P}^X((-\infty,x]) = \mathbb{P}(X \leqslant x) называется (кумулятивной) функцией распределения случайной величины X. Из свойств вероятности вытекает

Теорема 1. Функция распределения F_X(x) любой случайной величины удовлетворяет следующим трем свойствам:

  1. F_X — функция неубывающая;
  2. \lim_{x\to -\infty} F_X(x) = 0,\; \lim_{x\to \infty}F_X(x) = 1;
  3. F_X непрерывна справа.

Из того факта, что борелевская сигма-алгебра на вещественной прямой порождается семейством интервалов вида \{(-\infty,x]\}_{x\in \mathbb{R}}, вытекает

Теорема 2. Любая функция F(x), удовлетворяющая трём свойствам, перечисленным выше, является функцией распределения для какого-то распределения \mathbb{P}^X.

Для вероятностных распределений, обладающих определенными свойствами, существуют более удобные способы его задания.

Дискретные распределения[править | править вики-текст]

Определение 3. Случайная величина называется простой или дискретной, если она принимает не более, чем счётное число значений. То есть X(\omega) = a_i,\; \forall \omega \in A_i, где \{A_i\}_{i=1}^{\infty} — разбиение \Omega.

Распределение простой случайной величины тогда по определению задаётся: \mathbb{P}^X(B) = \sum_{i:a_i \in B} \mathbb{P}(A_i). Введя обозначение p_i = \mathbb{P}(A_i), можно задать функцию p(a_i) = p_i. Очевидно, что \sum_{i=1}^{\infty}p_i = 1. Используя счётную аддитивность \mathbb{P}, легко показать, что эта функция однозначно определяет распределение X.

Определение 4. Функция p(a_i) = p_i, где \sum_{i=1}^{\infty} p_i = 1 часто называется дискретным распределением.

Пример 1. Пусть функция p задана таким образом, что p(-1) = \frac{1}{2} и p(1) = \frac{1}{2}. Эта функция задаёт распределение случайной величины X, для которой \mathbb{P}(X=\pm 1) = \frac{1}{2} (распределение Бернулли).

Теорема 3. Дискретное распределение обладает следующими свойствами:

1.  p_i \geqslant 0;

2.  \sum_{i=1}^{n} p_i = 1.

Решётчатые распределения[править | править вики-текст]

Определение 5. Решётчатым называется распределение с дискретной функцией распределения и точки разрыва функции распределения образуют подмножество точек вида a+nh, где a - вещественное, h > 0, n - целое[1].

Пример 2. Распределение Пуассона является решётчатым.

Пример 3. Биномиальное распределение является решётчатым.

Теорема 4. Для того, чтобы функция распределения F была решётчатой с шагом h, необходимо и достаточно, чтобы её характеристическая функция f удовлетворяла соотношению |f(2 \pi/h)|=1[1].

Доказательство.

Необходимость. Обозначим как \left \{ a + nh \right \} множество, содержащее все точки разрыва функции F и p_{n}=F(a+nh)-F(a+nh-0). Тогда характеристическая функция f(t)=\sum_{n}p_{n}\exp\left [ i(a+nh)t \right ]. Следовательно, f(\frac{2\pi}{h}) = \exp(i \frac{2 \pi a}{h}) и \left | f(\frac{2\pi}{h}) \right |=1.

Достаточность. Если \left | f(\frac{2\pi}{h}) \right |=1, то f(\frac{2\pi}{h}) = \exp (i \frac{2 \pi a}{h}) для некоторого вещественного a. Тогда \int \exp \left [ \frac{i 2 \pi (x-a)}{h}\right ] dF(x)=1. Из этого равенства следует: \int ( 1 - \cos \left [ \frac{2 \pi (x-a)}{h} \right ] ) dF(x) = 0 В силу неотрицательности подынтегральной функции, мера множества \left \{ x:  1 - \cos \left [ \frac{2 \pi (x-a)}{h} \right ] > 0\right \} равна нулю. Таким образом, функция распределения F может иметь своими точками роста лишь точки из множества \left \{ a + nh \right \}[1].

Следствием этой теоремы является следующее свойство решётчатых распределений: если решётчатая функция распределения F c шагом h является свёрткой функций распределения F_{1} и F_{2} F = F_{1} * F_{2}, то F_{1} и F_{2} также являются решётчатыми с шагом h[1].

Доказательство. Обозначим через f, f_{1}, f_{2} характеристические функции функций распределения F, F_{1}, F_{2}. Тогда \left | f_{1}(\frac{2 \pi}{h}) \right | \left | f_{2}(\frac{2 \pi}{h}) \right | = \left | f(\frac{2 \pi}{h}) \right |. Так как модуль любой характеристической функции на вещественной оси не превосходит 1, то \left | f_{1}(\frac{2 \pi}{h}) \right |  = \left | f_{2}(\frac{2 \pi}{h}) \right | = 1 и доказательство завершено[1].

Непрерывные распределения[править | править вики-текст]

Непрерывное распределение — распределение, не имеющее атомов.

Абсолютно непрерывные распределения[править | править вики-текст]

Абсолютно непрерывными называют распределения, имеющие плотность вероятности. Кумулятивная функция таких распределений абсолютно непрерывна в смысле Лебега.

Определение 6. Распределение случайной величины X называется абсолютно непрерывным, если существует неотрицательная функция f_X:\mathbb{R}\to \mathbb{R}_+, такая что \mathbb{P}^X(B) \equiv \mathbb{P}(X\in B) = \int\limits_B f_X(x)\, dx. Функция f_X тогда называется плотностью распределения случайной величины X.

Пример 4. Пусть f(x) = 1, когда 0\leqslant x \leqslant 1, и 0 — в противном случае. Тогда \mathbb{P}(a < X < b) = \int\limits_a^b 1\, dx = b-a, если (a,b) \subset [0,1].

Очевидно, что для любой плотности распределения f_X верно равенство \int\limits_{-\infty}^{\infty} f_X(x)\, dx = 1. Верна и обратная

Теорема 5. Если функция f:\mathbb{R}\to \mathbb{R} такая, что:

  1. f(x) \geqslant 0,\; \forall x \in \mathbb{R};
  2. \int\limits_{-\infty}^{\infty} f(x)\, dx = 1,

то существует распределение \mathbb{P}^X такое, что f(x) является его плотностью.

Просто применение формулы Ньютона-Лейбница приводит к простому соотношению между кумулятивной функцией и плотностью абсолютно непрерывного распределения.

Теорема 6. Если f(x) — непрерывная плотность распределения, а F(x) — его кумулятивная функция, то

  1. F'(x) = f(x),\; \forall x \in \mathbb{R},
  2. F(x) = \int\limits_{-\infty}^x f(t)\, dt.

При построении распределения по эмпирическим (опытным) данным следует избегать ошибок округления.

Примечания[править | править вики-текст]

Литература[править | править вики-текст]

  • Рамачандран Б. Теория характеристических функций. — М.: Наука, 1975. — 224 с.


Bvn-small.png          Вероятностные распределения
Одномерные Многомерные
Дискретные: Бернулли | Биномиальное | Геометрическое | Гипергеометрическое | Логарифмическое | Отрицательное биномиальное | Пуассона | Дискретное равномерное Мультиномиальное
Абсолютно непрерывные: Бета | Вейбулла | Гамма | Гиперэкспоненциальное | Распределение Гомпертца | Колмогорова | Коши | Лапласа | Логнормальное | Нормальное (Гаусса) | Логистическое | Накагами | Парето | Пирсона | Полукруговое | Непрерывное равномерное | Райса | Рэлея | Стьюдента | Трейси — Видома | Фишера | Хи-квадрат | Экспоненциальное | Variance-gamma Многомерное нормальное | Копула