В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.
Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (X − m )2 . (τ 2 может также быть выражено как (μ − m )2 + σ 2 , где μ и σ являются средним значением и стандартным отклонением X .)
Pr
(
|
X
−
m
|
>
k
)
≤
{
(
2
τ
3
k
)
2
,
if
k
≥
2
τ
3
;
1
−
k
τ
3
,
if
0
≤
k
≤
2
τ
3
.
{\displaystyle \Pr(|X-m|>k)\leq {\begin{cases}\left({\frac {2\tau }{3k}}\right)^{2},&{\text{if }}k\geq {\frac {2\tau }{\sqrt {3}}};\\[6pt]1-{\frac {k}{\tau {\sqrt {3}}}},&{\text{if }}0\leq k\leq {\frac {2\tau }{\sqrt {3}}}.\end{cases}}}
Эта теорема была впервые доказана Гауссом в 1823 году.
Без ограничения общности можно считать, что мода находится в нуле, то есть
m
=
0
{\displaystyle m=0}
.
Рассмотрим вероятность того, что выполняется неравенство
|
X
|
≤
x
{\displaystyle \left\vert X\right\vert \leq x}
, как функцию от
x
{\displaystyle x}
:
p
(
x
)
=
∫
−
x
x
f
(
z
)
d
z
.
{\displaystyle p\left(x\right)=\int \limits _{-x}^{x}f\left(z\right)dz.}
Так как
f
(
x
)
{\displaystyle f\left(x\right)}
является неотрицательной функцией, то
p
(
x
)
{\displaystyle p(x)}
растёт с ростом
x
{\displaystyle x}
.
Кроме того, по определению определённого интеграла :
p
(
0
)
=
0.
{\displaystyle p\left(0\right)=0.}
В силу формулы Лейбница :
d
p
d
x
=
f
(
x
)
+
f
(
−
x
)
.
{\displaystyle {\frac {dp}{dx}}=f\left(x\right)+f\left(-x\right).}
Рассмотрим обратную функцию (квантиль ) распределения случайной величины
|
X
|
{\displaystyle \left\vert X\right\vert }
:
x
=
q
(
p
)
.
{\displaystyle x=q\left(p\right).}
В силу теоремы о производной обратной функции :
q
′
(
p
)
=
d
x
d
p
=
[
d
p
d
x
]
−
1
=
1
f
(
x
)
+
f
(
−
x
)
.
{\displaystyle q^{\prime }\left(p\right)={\frac {dx}{dp}}=\left[{\frac {dp}{dx}}\right]^{-1}={\frac {1}{f\left(x\right)+f\left(-x\right)}}.}
Заметим, что с ростом
p
{\displaystyle p}
возрастает и
x
{\displaystyle x}
, в силу унимодальности с ростом по модулю
x
{\displaystyle x}
функция
f
(
x
)
{\displaystyle f\left(x\right)}
не возрастает, значит с ростом
x
{\displaystyle x}
функция
q
′
(
p
)
{\displaystyle q^{\prime }\left(p\right)}
не убывает.
Выберем произвольную точку
q
0
=
q
(
p
0
)
{\displaystyle q_{0}=q\left(p_{0}\right)}
и линеаризуем
q
(
p
)
{\displaystyle q\left(p\right)}
точке
p
0
{\displaystyle p_{0}}
, то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:
L
(
p
)
=
q
(
p
0
)
+
q
′
(
p
0
)
(
p
−
p
0
)
=
q
0
+
q
′
(
p
0
)
(
p
−
p
0
)
.
{\displaystyle L\left(p\right)=q\left(p_{0}\right)+q^{\prime }\left(p_{0}\right)\left(p-p_{0}\right)=q_{0}+q^{\prime }\left(p_{0}\right)\left(p-p_{0}\right).}
Данное уравнение можно переписать следующим образом:
L
(
p
)
=
q
′
(
p
0
)
(
p
−
p
1
)
,
{\displaystyle L\left(p\right)=q^{\prime }\left(p_{0}\right)\left(p-p_{1}\right),}
где
p
1
=
p
0
−
q
0
q
′
(
p
0
)
=
p
0
(
1
−
q
0
p
0
⋅
q
′
(
p
0
)
)
=
g
⋅
p
0
.
{\displaystyle p_{1}=p_{0}-{\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}=p_{0}\left(1-{\frac {q_{0}}{p_{0}\cdot q^{\prime }\left(p_{0}\right)}}\right)=g\cdot p_{0}.}
Поскольку величины
p
0
{\displaystyle p_{0}}
,
q
0
{\displaystyle q_{0}}
и
q
′
(
p
0
)
{\displaystyle q^{\prime }\left(p_{0}\right)}
являются неотрицательными, то
0
≤
p
1
≤
p
0
,
{\displaystyle 0\leq p_{1}\leq p_{0},}
а значит
0
≤
g
≤
1.
{\displaystyle 0\leq g\leq 1.}
Так как
q
′
(
p
)
{\displaystyle q^{\prime }\left(p\right)}
не убывает с ростом
p
{\displaystyle p}
, а
L
′
(
p
)
=
q
′
(
p
0
)
=
const
,
{\displaystyle L^{\prime }\left(p\right)=q^{\prime }\left(p_{0}\right)=\operatorname {const} ,}
то разность
q
′
(
p
)
−
L
′
(
p
)
{\displaystyle q^{\prime }\left(p\right)-L^{\prime }\left(p\right)}
имеет тот же знак, что
p
−
p
0
{\displaystyle p-p_{0}}
. Из этого следует, что величина
q
(
p
)
−
L
(
p
)
{\displaystyle q\left(p\right)-L\left(p\right)}
всегда является неотрицательной, а следовательно:
q
(
p
)
≥
L
(
p
)
.
{\displaystyle q\left(p\right)\geq L\left(p\right).}
Поскольку
q
(
p
)
≥
0
{\displaystyle q\left(p\right)\geq 0}
то из
L
(
p
)
≥
0
{\displaystyle L\left(p\right)\geq 0}
(то есть из
p
≥
p
1
{\displaystyle p\geq p_{1}}
) следует
L
2
(
p
)
≤
q
2
(
p
)
{\displaystyle L^{2}\left(p\right)\leq q^{2}\left(p\right)}
.
Проинтегрируем последнее неравенство в пределах от
p
1
{\displaystyle p_{1}}
до
1
{\displaystyle 1}
:
∫
p
1
1
L
2
(
p
)
d
p
≤
∫
p
1
1
q
2
(
p
)
d
p
≤
∫
0
1
q
2
(
p
)
d
p
=
∫
−
∞
+
∞
x
2
⋅
f
(
x
)
d
x
.
{\displaystyle \int _{p_{1}}^{1}L^{2}\left(p\right)dp\leq \int _{p_{1}}^{1}q^{2}\left(p\right)dp\leq \int _{0}^{1}q^{2}\left(p\right)dp=\int _{-\infty }^{+\infty }x^{2}\cdot f\left(x\right)dx.}
Последнее выражение обозначим как
τ
2
{\displaystyle \tau ^{2}}
:
τ
2
=
∫
−
∞
+
∞
x
2
⋅
f
(
x
)
d
x
.
{\displaystyle \tau ^{2}=\int _{-\infty }^{+\infty }x^{2}\cdot f\left(x\right)dx.}
Данная величина есть математическое ожидание квадрата случайной величины
X
{\displaystyle X}
. По свойствам дисперсии :
τ
2
=
μ
2
+
σ
2
,
{\displaystyle \tau ^{2}=\mu ^{2}+\sigma ^{2},}
где
σ
2
{\displaystyle \sigma ^{2}}
— дисперсия случайной величины
X
{\displaystyle X}
,
μ
{\displaystyle \mu }
— её математическое ожидание.
Вычислим теперь интеграл в левой части последнего неравенства:
∫
p
1
1
L
2
(
p
)
d
p
=
∫
p
1
1
[
q
′
(
p
0
)
]
2
(
p
−
p
1
)
2
d
p
=
[
q
′
(
p
0
)
]
2
(
p
−
p
1
)
3
3
|
p
1
1
=
[
q
′
(
p
0
)
]
2
(
1
−
p
1
)
3
3
≤
τ
2
{\displaystyle \int _{p_{1}}^{1}L^{2}\left(p\right)dp=\int _{p_{1}}^{1}\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left(p-p_{1}\right)^{2}dp=\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left.{\frac {\left(p-p_{1}\right)^{3}}{3}}\right|_{p_{1}}^{1}=\left[q^{\prime }\left(p_{0}\right)\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}
p
1
=
p
0
−
q
0
q
′
(
p
0
)
.
{\displaystyle p_{1}=p_{0}-{\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}.}
p
0
−
p
1
=
q
0
q
′
(
p
0
)
{\displaystyle p_{0}-p_{1}={\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}}
q
′
(
p
0
)
=
q
0
p
0
−
p
1
{\displaystyle q^{\prime }\left(p_{0}\right)={\frac {q_{0}}{p_{0}-p_{1}}}}
[
q
0
p
0
−
p
1
]
2
(
1
−
p
1
)
3
3
≤
τ
2
{\displaystyle \left[{\frac {q_{0}}{p_{0}-p_{1}}}\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}
Преобразуем это неравенство к виду
q
0
2
τ
2
≤
3
(
p
0
−
p
1
)
2
(
1
−
p
1
)
3
=
3
(
p
0
−
g
p
0
)
2
(
1
−
g
p
0
)
3
=
3
p
0
2
(
1
−
g
)
2
(
1
−
g
p
0
)
3
.
{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\frac {3\left(p_{0}-p_{1}\right)^{2}}{\left(1-p_{1}\right)^{3}}}={\frac {3\left(p_{0}-gp_{0}\right)^{2}}{\left(1-gp_{0}\right)^{3}}}={\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}.}
Исследуем верхнюю границу на экстремальные значения (в зависимости от значения
g
{\displaystyle g}
). Начнём с нахождения корней производной:
∂
∂
g
[
3
p
0
2
(
1
−
g
)
2
(
1
−
g
p
0
)
3
]
=
=
3
p
0
2
⋅
2
(
1
−
g
)
⋅
(
−
1
)
⋅
(
1
−
g
p
0
)
3
−
(
1
−
g
)
2
⋅
3
(
1
−
g
p
0
)
2
⋅
(
−
p
0
)
(
1
−
g
p
0
)
6
=
=
3
p
0
2
(
1
−
g
)
(
1
−
g
p
0
)
2
[
−
2
(
1
−
g
p
0
)
+
3
(
1
−
g
)
p
0
]
(
1
−
g
p
0
)
6
=
=
3
p
0
2
(
1
−
g
)
(
1
−
g
p
0
)
4
[
−
2
+
2
g
p
0
+
3
p
0
−
3
g
p
0
]
=
=
−
3
p
0
2
(
1
−
g
)
(
1
−
g
p
0
)
4
[
2
−
3
p
0
+
g
p
0
]
{\displaystyle {\begin{aligned}{\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]=\\&=3p_{0}^{2}\cdot {\frac {2\left(1-g\right)\cdot \left(-1\right)\cdot \left(1-gp_{0}\right)^{3}-\left(1-g\right)^{2}\cdot 3\left(1-gp_{0}\right)^{2}\cdot \left(-p_{0}\right)}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)\left(1-gp_{0}\right)^{2}\left[-2\left(1-gp_{0}\right)+3\left(1-g\right)p_{0}\right]}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[-2+2gp_{0}+3p_{0}-3gp_{0}\right]=\\&=-{\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[2-3p_{0}+gp_{0}\right]\\\end{aligned}}}
Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:
2
−
3
p
0
+
g
0
⋅
p
0
=
0.
{\displaystyle 2-3p_{0}+g_{0}\cdot p_{0}=0.}
Решая данное уравнение, получим:
g
0
⋅
p
0
=
3
p
0
−
2.
{\displaystyle g_{0}\cdot p_{0}=3p_{0}-2.}
g
0
=
3
−
2
p
0
.
{\displaystyle g_{0}=3-{\frac {2}{p_{0}}}.}
Величина
g
{\displaystyle g}
также должно удовлетворять условию
0
≤
g
≤
1
{\displaystyle 0\leq g\leq 1}
:
0
≤
3
−
2
p
0
≤
1
{\displaystyle 0\leq 3-{\frac {2}{p_{0}}}\leq 1}
Решая данное неравенство, получим:
−
3
≤
−
2
p
0
≤
−
2
{\displaystyle -3\leq -{\frac {2}{p_{0}}}\leq -2}
2
≤
2
p
0
≤
3
{\displaystyle 2\leq {\frac {2}{p_{0}}}\leq 3}
1
3
≤
p
0
2
≤
1
2
{\displaystyle {\frac {1}{3}}\leq {\frac {p_{0}}{2}}\leq {\frac {1}{2}}}
2
3
≤
p
0
≤
1.
{\displaystyle {\frac {2}{3}}\leq p_{0}\leq 1.}
Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать
[
0
;
1
]
{\displaystyle \left[0;1\right]}
только при
p
0
≥
2
3
.
{\displaystyle p_{0}\geq {\frac {2}{3}}.}
Рассмотрим сначала случай
p
0
≤
2
3
{\displaystyle p_{0}\leq {\frac {2}{3}}}
.
В этом случае всегда
∂
∂
g
[
3
p
0
2
(
1
−
g
)
2
(
1
−
g
p
0
)
3
]
≤
0
,
{\displaystyle {\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]\leq 0,}
а следовательно максимум выражения в квадратных скобках достигается при
g
=
0
{\displaystyle g=0}
:
q
0
2
τ
2
≤
3
p
0
2
{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq 3p_{0}^{2}}
или
p
0
≤
q
0
τ
3
.
{\displaystyle p_{0}\leq {\frac {q_{0}}{\tau {\sqrt {3}}}}.}
Если же
p
0
>
2
3
{\displaystyle p_{0}>{\frac {2}{3}}}
, то максимум будет в точке
g
0
=
3
−
2
p
0
=
3
p
0
−
2
p
0
.
{\displaystyle g_{0}=3-{\frac {2}{p_{0}}}={\frac {3p_{0}-2}{p_{0}}}.}
Вычислим необходимые нам величины:
1
−
g
0
=
1
−
3
+
2
p
0
=
2
p
0
−
2
=
2
(
1
−
p
0
)
p
0
{\displaystyle 1-g_{0}=1-3+{\frac {2}{p_{0}}}={\frac {2}{p_{0}}}-2={\frac {2\left(1-p_{0}\right)}{p_{0}}}}
и
1
−
g
0
p
0
=
1
−
(
3
p
0
−
2
)
=
3
(
1
−
p
0
)
.
{\displaystyle 1-g_{0}p_{0}=1-\left(3p_{0}-2\right)=3\left(1-p_{0}\right).}
Подставляя эти выражения в исследуемое неравенство, получим:
q
0
2
τ
2
≤
3
p
0
2
(
1
−
g
)
2
(
1
−
g
p
0
)
3
=
3
p
0
2
3
3
(
1
−
p
0
)
3
2
2
(
1
−
p
0
)
2
p
0
2
=
(
2
3
)
2
1
1
−
p
0
{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}={\frac {3p_{0}^{2}}{3^{3}\left(1-p_{0}\right)^{3}}}{\frac {2^{2}\left(1-p_{0}\right)^{2}}{p_{0}^{2}}}=\left({\frac {2}{3}}\right)^{2}{\frac {1}{1-p_{0}}}}
или
1
−
p
0
≤
(
2
3
)
2
τ
2
q
0
2
.
{\displaystyle 1-p_{0}\leq \left({\frac {2}{3}}\right)^{2}{\frac {\tau ^{2}}{q_{0}^{2}}}.}
Объединим полученные неравенства:
q
0
2
τ
2
≤
{
3
p
0
2
,
p
0
≤
2
3
4
9
1
(
1
−
p
0
)
,
p
0
>
2
3
{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\begin{cases}3p_{0}^{2},&p_{0}\leq {\frac {2}{3}}\\{\frac {4}{9}}{\frac {1}{\left(1-p_{0}\right)}},&p_{0}>{\frac {2}{3}}\end{cases}}}
Извлекая квадратный корень, окончательно получим:
q
0
τ
≤
{
3
p
0
,
p
0
≤
2
3
2
3
1
1
−
p
0
,
p
0
>
2
3
{\displaystyle {\frac {q_{0}}{\tau }}\leq {\begin{cases}{\sqrt {3}}p_{0},&p_{0}\leq {\frac {2}{3}}\\{\frac {2}{3}}{\frac {1}{\sqrt {1-p_{0}}}},&p_{0}>{\frac {2}{3}}\end{cases}}}
Если
p
0
≤
2
3
{\displaystyle p_{0}\leq {\frac {2}{3}}}
, то
q
0
2
τ
2
≤
3
p
0
2
≤
3
(
2
3
)
2
=
4
3
.
{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq 3p_{0}^{2}\leq 3\left({\frac {2}{3}}\right)^{2}={\frac {4}{3}}.}
Откуда получаем
q
0
≤
2
τ
3
.
{\displaystyle q_{0}\leq {\frac {2\tau }{\sqrt {3}}}.}
Это позволяет получить следующее неравенство:
1
−
p
0
=
{
1
−
q
0
3
τ
,
q
0
≤
2
τ
3
4
9
τ
2
q
0
2
,
q
0
≥
2
τ
3
{\displaystyle 1-p_{0}={\begin{cases}1-{\frac {q_{0}}{{\sqrt {3}}\tau }},&q_{0}\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{q_{0}^{2}}},&q_{0}\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}}
Обозначая
p
0
=
p
{\displaystyle p_{0}=p}
и
q
0
=
x
{\displaystyle q_{0}=x}
, получим:
Pr
{
|
X
|
>
x
}
=
{
1
−
x
3
τ
,
x
≤
2
τ
3
4
9
τ
2
x
2
,
x
≥
2
τ
3
.
{\displaystyle \Pr \left\{\left|X\right|>x\right\}={\begin{cases}1-{\frac {x}{{\sqrt {3}}\tau }},&x\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{x^{2}}},&x\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}.}
Выше мы предполагали, что мода случайной величины
X
{\displaystyle X}
равна нулю. В случае произвольной моды
m
{\displaystyle m}
, нужно приведённые выше рассуждения применить к случайной величине
X
−
m
{\displaystyle X-m}
, мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:
Pr
{
|
X
−
m
|
>
x
}
=
{
1
−
x
3
τ
,
x
≤
2
τ
3
4
9
τ
2
x
2
,
x
≥
2
τ
3
.
{\displaystyle \Pr \left\{\left|X-m\right|>x\right\}={\begin{cases}1-{\frac {x}{{\sqrt {3}}\tau }},&x\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{x^{2}}},&x\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}.}
Величина
τ
2
{\displaystyle \tau ^{2}}
перейдём, по свойствам математического ожидания и дисперсии, в
τ
2
=
(
μ
−
m
)
2
+
σ
2
.
{\displaystyle \tau ^{2}=\left(\mu -m\right)^{2}+\sigma ^{2}.}
Таким образом, теорема полностью доказана.
Gauss, C. F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae, Pars Prior (англ.) // Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores : journal. — 1823. — Vol. 5 .
Gauss C. F. Gauss’s work 1803-1826) on the Theory of Least Squares / English translation by H. F. Trotter . — Princeton, NJ: Princeton University Press, 1957. — С. 10—13. Архивировано 24 декабря 2016 года. Архивная копия от 24 декабря 2016 на Wayback Machine
Upton, Graham; Cook, Ian. Gauss inequality // A Dictionary of Statistics (англ.) . — Oxford University Press , 2008.
Sellke, T.M.; Sellke, S.H. Chebyshev inequalities for unimodal distributions (англ.) // American Statistician [англ.] : journal. — American Statistical Association, 1997. — Vol. 51 , no. 1 . — P. 34—40 . — doi :10.2307/2684690 . — JSTOR 2684690 .
Pukelsheim, F. The Three Sigma Rule (англ.) // American Statistician [англ.] : journal. — American Statistical Association, 1994. — Vol. 48 , no. 2 . — P. 88—91 . — doi :10.2307/2684253 . — JSTOR 2684253 .