Среднее арифметическое

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

В математике и статистике сре́днее арифмети́ческое — одна из наиболее распространённых мер центральной тенденции, представляющая собой сумму всех зафиксированных значений, деленную на их количество.

Предложена (наряду со средним геометрическим и средним гармоническим) еще пифагорейцами [1].

Частными случаями среднего арифметического являются генеральное среднее (генеральной совокупности) и выборочное среднее (выборки).

Введение[править | править вики-текст]

Обозначим множество данных X = (x1, x2, …, xn), тогда выборочное среднее обычно обозначается горизонтальной чертой над переменной (\bar{x} \,, произносится «x с чертой»).

Для обозначения среднего арифметического всей совокупности используется греческая буква μ. Для случайной величины, для которой определено среднее значение, μ есть вероятностное среднее или математическое ожидание случайной величины. Если множество X является совокупностью случайных чисел с вероятностным средним μ, тогда для любой выборки xi из этой совокупности μ = E{xi} есть математическое ожидание этой выборки.

На практике разница между μ и \bar{x} \, в том, что μ является типичной ненаблюдаемой переменной, потому что видеть можно скорее выборку, а не всю генеральную совокупность. Поэтому, если выборку представлять случайным образом (в терминах теории вероятностей), тогда \bar{x} \, (но не μ) можно трактовать как случайную переменную, имеющую распределение вероятностей на выборке (вероятностное распределение среднего).

Обе эти величины вычисляются одним и тем же способом:

\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i  =  \frac{1}{n} (x_1+\cdots+x_n).

Если X — случайная переменная, тогда математическое ожидание X можно рассматривать как среднее арифметическое значений в повторяющихся измерениях величины X. Это является проявлением закона больших чисел. Поэтому выборочное среднее используется для оценки неизвестного математического ожидания.

В элементарной алгебре доказано, что среднее n + 1 чисел больше среднего n чисел тогда и только тогда, когда новое число больше чем старое среднее, меньше тогда и только тогда, когда новое число меньше среднего, и не меняется тогда и только тогда, когда новое число равно среднему. Чем больше n, тем меньше различие между новым и старым средними значениями.

Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины.

Примеры[править | править вики-текст]

  • Для трёх чисел сложим их и поделим на 3:
\frac{x_1 + x_2 + x_3}{3}.
  • Для четырёх чисел сложим их и поделим на 4:
\frac{x_1 + x_2 + x_3 + x_4}{4}.

Непрерывная случайная величина[править | править вики-текст]

Для непрерывно распределённой величины f(x) среднее арифметическое на отрезке [a;b] определяется через определённый интеграл:

\overline{f(x)}_{[a;b]} = \frac1{b-a} \int_{a}^b f(x) dx

Некоторые проблемы применения среднего[править | править вики-текст]

Отсутствие робастности[править | править вики-текст]

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, что означает, что среднее арифметическое подвержено сильному влиянию «больших отклонений». Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. «Средний» доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Этот «средний» (в смысле среднего арифметического) доход является выше, чем доходы большинства людей, так как высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического (в отличие от этого, средний доход по медиане «сопротивляется» такому перекосу). Однако, этот «средний» доход ничего не говорит о количестве людей вблизи медианного дохода (и не говорит ничего о количестве людей вблизи модального дохода). Тем не менее, если легкомысленно отнестись к понятиям «среднего» и «большинство народа», то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса. Рассмотрим выборку (1, 2, 2, 2, 3, 9). Среднее арифметическое равно 3.17, но пять значений из шести ниже этого среднего.

Сложный процент[править | править вики-текст]

Если числа перемножать, а не складывать, нужно использовать среднее геометрическое, а не среднее арифметическое. Наиболее часто этот казус случается при расчёте окупаемости инвестиций в финансах.

Например, если акции в первый год упали на 10 %, а во второй год выросли на 30 %, тогда некорректно вычислять «среднее» увеличение за эти два года как среднее арифметическое (−10 % + 30 %) / 2 = 10 %; правильное среднее значение в этом случае дают совокупные ежегодные темпы роста, по которым годовой рост получается только около 8,16653826392 % ≈ 8,2 %.

Причина этого в том, что проценты имеют каждый раз новую стартовую точку: 30 % — это 30 % от меньшего числа. Если акции в начале стоили $30 и упали на 10 %, они теперь стоят $27. Если акции выросли на 30 %, они теперь стоят $35.1. Арифметическое среднее этого роста 10 %, но поскольку акции выросли за 2 года на $5.1, средний рост в 8,2 % даёт конечный результат $35.1 [$30 (1 — 10 %) (1 + 30 %) = $30 (1 + 8,2 %) (1 + 8,2 %) = $35.1]. Если же использовать таким же образом среднее арифметическое значение 10 %, мы не получим фактическое увеличение [$30 (1 + 10 %) (1 + 10 %) = $36.3].

В общем, сложный процент даёт 90 % * 130 % = 117 % общий рост, а годовой прирост \sqrt{117%}\approx 108.2%, то есть 8,2 % в год.

Направления[править | править вики-текст]

Особую осторожность нужно иметь при расчёте циклических данных, таких как фазы или углы. Наивное вычисление среднего арифметического 1° и 359° даёт результат 180°. Это неверно по двум причинам:

  • Во-первых, угловые меры определены только до 360° (или 2π, при измерении в радианах). Таким образом, ту же пару можно записать 1° и −1°, или 1° и 719°, но каждая из которых даёт различные средние значения.
  • Во-вторых, в этой ситуации, 0° (эквивалентно 360°) геометрически лучшее среднее значение: меньше дисперсия (обе точки на 1° от него, и на 179° от 180°, вычисленного среднего).

В целом применение такого рассмотрения средней величины ведёт к искусственному сдвигу его к середине числового диапазона. Решение этой проблемы заключается в использовании оптимальной формализации (а именно, определение среднего в качестве центральной точки, то есть точки, от которой наименьшая дисперсия), а также переопределение вычитания как модульного расстояния (то есть как расстояние от окружности; в частности, модульное расстояние между 1° и 359° — это 2°, а не 358°).

Примечания[править | править вики-текст]

  1. Cantrell, David W., "Pythagorean Means" from MathWorld

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]