Квантиль

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью.

Определение[править | править исходный текст]

Рассмотрим вероятностное пространство (\Omega,\;\mathcal{F},\;\mathbb{P}) и \mathbb{P}^X — вероятностная мера, задающая распределение некоторой случайной величины X. Пусть фиксировано \alpha\in(0,\;1). Тогда \alpha-квантилью (или квантилью уровня \alpha) распределения \mathbb{P}^X называется число x_\alpha\in\R, такое что

x_\alpha\colon\begin{cases}\mathbb{P}(X\leqslant x_\alpha)\geqslant\alpha; \\ \mathbb{P}(X>x_\alpha)\leqslant\ 1 -\alpha.\end{cases}

В некоторых источниках (например, в англоязычной литературе) k-ой q-квантилью называется квантиль уровня k/q, то есть (k/q)-квантиль в предыдущих обозначениях.

Замечания[править | править исходный текст]

F_X(x_\alpha)=\alpha,

где F_X — функция распределения \mathbb{P}^X.

  • Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
\mathbb{P}\left(x_{\frac{1-\alpha}{2}}\leqslant X\leqslant x_{\frac{1+\alpha}{2}}\right)=\alpha.
  1. составляем вариационный ряд значений V_0\leqslant V_1\leqslant\dots\leqslant V_{N-1} (выборка имеет объём N), а также считаем, что V_N=V_{N-1} (это необходимо при вычислении 100% квантили по приводимым ниже формулам);
  2. находим величину K=\lfloor\alpha\cdot(N-1)\rfloor;
  3. сравниваем K и \alpha\cdot N:
a) если K+1<\alpha N, то полагаем x_\alpha=V_{K+1};
б) если K+1=\alpha N, то полагаем x_{\alpha}=(V_K+V_{K+1})/2;
в) если K+1>\alpha N, то полагаем x_{\alpha}=V_K.

Заданная таким образом \alpha-квантиль удовлетворяет приведенному выше определению.

В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства K+1=\alpha N можно использовать приближённое сравнение |K+1-\alpha N|<1/N (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).

Медиана и квартили[править | править исходный текст]

Квантили нормального распределения
  • 0,25-квантиль называется первым (или нижним) квартилем (от лат. quarta — четверть);
  • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым квартилем;
  • 0,75-квантиль называется третьим (или верхним) квартилем.

Интерквартильным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть x_{0{,}75}-x_{0{,}25}. Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

Дециль[править | править исходный текст]

Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля от 90 % наибольших величин, лежащих выше дециля.

Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение[1].

Перцентиль[править | править исходный текст]

p-ой перценти́лью называют квантиль уровня \alpha=p/100. При этом обычно рассматривают перцентили для целых p, хотя данное требование не обязательно. Соответственно, медиана является 50-й перцентилью, а первый и третий квартиль — 25-й и 75-й перцентилями.

В целом, понятия квантиль и перцентиль взаимозаменяемы, так же как и шкалы исчисления вероятностей — абсолютная и процентная.

Перцентили также называются процентилями или центилями.

Квантили стандартного нормального распределения[править | править исходный текст]

Вероятность (уровень квантили), % 99,99 99,90 99,00 97,72 97,50 95,00 90,00 84,13 50,00
Квантиль 3,715 3,090 2,326 2,000 1,960 1,645 1,282 1,000 0,000

См. также[править | править исходный текст]

Примечания[править | править исходный текст]

  1. Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969.