Закон больших чисел

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Иллюстрация закона больших чисел с использованием определённой серии бросков одной игральной кости. По мере увеличения количества бросков в серии, среднее значение всех исходов (выпавших значений) стремится к 3.5. В то время как разные серии бросков дадут различный профиль этой линии при небольшом количестве бросков (слева), после значительного количества бросков (справа) они окажутся очень похожи.

В теории вероятностей Закон больши́х чи́сел (ЗБЧ) это принцип, который описывает результат выполнения одного и того же эксперимента много раз. Согласно закону, среднее значение конечной выборки из фиксированного распределения близко к математическому ожиданию этого распределения.

ЗБЧ важен, поскольку он гарантирует устойчивость  для средних значений некоторых случайных событий при  достаточно длинной серии экспериментов.

Важно помнить, что закон применим только тогда, когда рассматривается большое количество испытаний.

Примеры[править | править код]

Например, рассмотрим бросок шестигранной игральной кости, на которой, с равной вероятностью, может выпасть одно из чисел 1, 2, 3, 4, 5 или 6. Следовательно, математическое ожидание одного броска равно

Согласно закону больших чисел, при большом количестве бросков, их среднее значение, вероятно, будет близким к 3,5, при этом точность будет возрастать по мере увеличения числа бросков.

Из закона больших чисел следует, что эмпирическая вероятность успеха в серии испытаний Бернулли сходится к теоретической вероятности. Для случайной величины Бернулли математическое ожидание представляет собой теоретическую вероятность успеха, а среднее значение таких переменных (если они независимы и одинаково распределены) является относительной частотой.

Например, бросок правильной монеты - это испытание Бернулли. При одном броске, теоретическая вероятность выпадения «орла», равна . Поэтому, согласно закону больших чисел, доля «орлов» при большом количестве испытаний «должна быть» примерно . В частности, доля «орлов» после бросков сходится к , при .

Хотя доля орлов (и решек) стремится к , почти наверное модуль разности количества орлов и решек станет большим, когда число бросков будет неограниченно возрастить. То есть при увеличении числа бросков вероятность того, что модуль разницы будет невелик, идет к нулю,  а  отношение модуля разницы к общему числу бросков почти наверное стремится к нулю.

История[править | править код]

Итальянский математик Джероламо Кардано (1501-1576) был страстным любителем азартных игр. "Побочным продуктом" его любви к игре в кости стала книга " Об азартных играх "(De Ludo alea, 1563), содержащая формулировку закона больших чисел. В ней Кардано заявил, что точность эмпирической статистики, как правило, улучшается с количеством испытаний.

В 1713 году Яков Бернулли изложил правила подсчёта вероятности для сложных событий и дал первый вариант «закона больших чисел», разъясняющего, почему частота события в серии испытаний не меняется хаотично, а в некотором смысле стремится к своему предельному теоретическому значению (то есть вероятности).

Следует также отметить работы С. Д. Пуассона (1781 - 1840),  доказавшего более общую, чем у Якова Бернулли, форму закона больших чисел.

П. Л. Чебышёв получил общую формулировку закона больших чисел: если математические ожидания серии случайных величин и квадраты этих математических ожиданий ограничены в совокупности, то среднее арифметическое этих величин с ростом сходится по вероятности к среднему арифметическому для их математических ожиданий.

А. А. Марков доказал вариант закона больших чисел для некоторых распространённых типов зависимых величин.

В XX веке исследования Чебышёва и Маркова продолжили А. Я. Хинчин и А. Н. Колмогоров. Они показали, что если случайные величины не только независимы, но и одинаково распределены, то существование у них математического ожидания является необходимым и достаточным условием для применимости закона больших чисел.

Варианты[править | править код]

Рассмотрим последовательность независисимых в совокупности случайных величин , интегрируемых по Лебегу, которые имеют одинаковые распределения, следовательно, и одинаковые математические ожидания .

Обозначим через среднее арифметическое рассматриваемых случайных величин:

оно сходится к математическому ожиданию

при .

Независисимость в совокупности случайных величин может быть заменена попарной независимостью в обоих вариантах закона[1].

Ниже описаны два различных варианта закона больших чисел. Их называют усиленным законом больших чисел и слабым законом больших чисел. Разница между усиленной и слабой формой связана с выбором способа сходимости.

Слабый закон[править | править код]

Слабый закон больших чисел гласит, что среднее значение выборки сходится по вероятности к математическому ожиданию.[2]

при

То есть :

.

Интерпретируя данный результат получаем, что слабый закон утверждает, что для любых ненулевых указанных границ, независимо от того, насколько они малы, при достаточно большой выборке вероятность того, что среднее значение выборки будет близко к математическому ожиданию, очень высока в пределах этих границ.

Как говорилось ранее, слабый закон применим в случае независимых одинаково распределенных случайных величин, имеющих математическое ожидание. Однако он может применяться и в некоторых других случаях. Например, дисперсия может быть разной для каждой случайной величины в выборке, а математическое ожидание оставаться константой. Если дисперсии ограничены, то закон также применим, как показал Чебышев еще в 1867 году. Доказательство Чебышева работает до тех пор, пока дисперсия среднего числа первых значений не стремится к нулю при [3].

Усиленный закон[править | править код]

Усиленный закон больших чисел утверждает, что при определенных условиях с вероятностью единица происходит неограниченное сближение средних арифметических последовательности случайных величин с некоторыми постоянными величинами.

Пусть - последовательность случайных величин и .

Говорят, что последовательность удовлетворяет усиленному закону больших чисел, если существует такая последовательность , что вероятность соотношения: , при равна .

Другая формулировка, равносильная предыдущей, такова: последовательность удовлетворяет усиленному закону больших чисел, если вероятность одновременного выполнения всех неравенств:

стремится к , при .

Таким образом, здесь рассматривается поведение всей последовательности сумм в целом, в то время как в обычном законе больших чисел речь идет лишь об отдельных суммах.

Если последовательность удовлетворяет усиленному закону больших чисел, то она удовлетворяет и обычному закону больших чисел с теми же самыми , т. е. , при , .

Обратное может быть неверно.

Например, если случайные величины независимы и принимают при  два значения  с вероятностью каждое, то для них выполняется обычный закон больших чисел с , но ни при каких не выполняется усиленный закон больших чисел.

Теорема Колмогорова

В случае независимых слагаемых наиболее известными являются условия приложимости усиленного закона больших чисел, установленные А. Н. Колмогоровым: достаточное - для величин с конечными дисперсиями и необходимое и достаточное - для одинаково распределенных величин (заключающееся в существовании математического ожидания величин ). Теорема Колмогорова для случайных величин с конечными дисперсиями утверждает, что из условия

вытекает приложимость к последовательности усиленного закона больших чисел с . В терминах дисперсий условие оказывается наилучшим в том смысле, что для любой последовательности положительных чисел с расходящимся рядом можно построить последовательность независимых случайных величин с , не удовлетворяющую усиленному закону больших чисел.[4]

Различия между слабым законом и усиленным законом[править | править код]

Слабый закон утверждает, что для заданного большого среднее значение , вероятно, будет близко к . Таким образом, может происходить бесконечно много раз, хотя и сколь угодно редко. (Для всех не обязательно выполняется ).

Усиленный закон показывает, что почти наверное не произойдет. Это означает, что с вероятностью мы имеем, что выполняется неравенство для достаточно больших .[5]

Ниже приведены три примера симметричных распределений, в каждом примере математического ожидания эти распределения не имеют, усиленный закон больших чисел (сходимость почти всюду) не имеет места, но слабый закон выполнен: среднее случайных величин сходится по вероятности к константе, центру симметрии их распределения. [6][7][8]

1. Пусть - экспоненциально распределенная случайная величина с параметром 1. Случайная величина не имеет математического ожидания задаваемого интегралом Лебега, но используя условную сходимость и интерпретацию интеграла как интеграла Дирихле, являющегося несобственным интегралом Римана, можно сказать:

2. Пусть - геометрическое распределение с вероятностью . Случайная величина не имеет математического ожидания в обычном смысле, поскольку бесконечный ряд не является абсолютно сходящимся, но используя условную сходимость можно сказать:

3. Если функция распределения случайной величины равна

,

то она не имеет математического ожидания, но слабый закон выполняется.[9][10]

Равномерный закон больших чисел[править | править код]

Пусть - некоторая функция, которая определена и непрерывна по переменной . Тогда для любого фиксированного последовательность будет последовательностью независимых и одинаково распределенных случайных величин, такой, что выборочное среднее этой последовательности сходится по вероятности к .

Равномерный закон больших чисел описывает условия, при которых сходимость равномерна по .

Если: [11][12]

  1. компактно,
  2. непрерывна при каждом для почти всех и измеримой функции от в каждом .
  3. существует доминирующая функция такая, что и

для всех

Тогда непрерывна в и:

.

Борелевский закон больших чисел[править | править код]

Борелевский закон больших чисел, названный в честь Эмиля Бореля, гласит, что если эксперимент повторяется много раз независимо при одинаковых условиях, то доля раз, когда любое указанное событие происходит, приблизительно равна вероятности появления события в каком-либо конкретном испытании; чем больше число повторений, тем лучше приближение. Точнее, если обозначает событие, о котором идет речь, - вероятность его появления, а - число раз, когда встречается в первых испытаниях, тогда с вероятностью [13]:

Неравенство Чебышева[править | править код]

Пусть - случайная величина с конечным математическим ожиданием и конечной ненулевой дисперсией . Тогда для любого действительного числа

Доказательство слабого закона[править | править код]

Рассмотрим бесконечную последовательность независимых и одинаково распределенных случайных величин с конечным математическим ожиданием , нас интересует сходимость по вероятности

Теорема: , при

Доказательство с использованием неравенства Чебышева, предполагающего конечную дисперсию[править | править код]

Предположение о конечной дисперсии не является обязательным. Большая или бесконечная дисперсия замедляет сходимость, но ЗБЧ выполняется в любом случае.

Это доказательство использует предположение о конечной дисперсии (для всех ). Независимость случайных величин не предполагает корреляции между ними, мы имеем

Математическое ожидание последовательности представляет собой среднее значение выборочного среднего:

Используя неравенство Чебышева для , получаем

Это неравенство используем для получения следующего:

при , выражение стремится к ,

теперь по определению сходимости по вероятности мы получим:

, при .

Доказательство с использованием сходимости характеристических функций[править | править код]

По теореме Тейлора для комплексных функций, характеристическая функция любой случайной величины с конечным средним может быть записана как

Все имеют одну и ту же характеристическую функцию, обозначим её как .

Среди основных свойств характеристических функций выделим два свойства

и , и независимы

Эти правила могут быть использованы для вычисления характеристической функции в терминах

при

Предел является характеристической функцией непрерывной случайной величины и, следовательно, по теореме непрерывности Леви, сходится по распределению к :

, при

Поскольку - константа, то отсюда следует, что сходимость по распределению к и сходимость по вероятности к эквивалентны. Поэтому,

, при

Это показывает, что среднее значение выборки по вероятности сходится к производной характеристической функции в начале координат, если она существует.

См. также[править | править код]

Примечания[править | править код]

  1. Etemadi, N.Z. (1981). "An elementary proof of the strong law of large numbers". Wahrscheinlichkeitstheorie verw Gebiete. 55 (1): 119–122. doi:10.1007/BF01013465.
  2. Loève 1977, Chapter 1.4, p. 14
  3. Yuri Prohorov. "Law of large numbers". Encyclopedia of Mathematics.
  4. Теорема Колмогорова.
  5. Ross (2009)
  6. Lehmann, Erich L; Romano, Joseph P (2006-03-30). Weak law converges to constant. ISBN 9780387276052.
  7. "A NOTE ON THE WEAK LAW OF LARGE NUMBERS FOR EXCHANGEABLE RANDOM VARIABLES" (PDF). Dguvl Hun Hong and Sung Ho Lee.
  8. "weak law of large numbers: proof using characteristic functions vs proof using truncation VARIABLES".
  9. Mukherjee, Sayan. "Law of large numbers" (PDF).
  10. J. Geyer, Charles. "Law of large numbers" (PDF).
  11. Newey & McFadden 1994, Lemma 2.4
  12. Jennrich, Robert I. (1969). "Asymptotic Properties of Non-Linear Least Squares Estimators". The Annals of Mathematical Statistics. 40 (2): 633–643. doi:10.1214/aoms/1177697731.
  13. An Analytic Technique to Prove Borel's Strong Law of Large Numbers Wen, L. Am Math Month 1991

Литература[править | править код]

  • Ширяев А. Н. Вероятность. — М.: Наука, 1989.
  • Чистяков В. П. Курс теории вероятностей. — М.: Наука, 1982.