P-P график

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

График P-P (график вероятности-вероятности или процент-процентный график или график значений P) — график вероятности для оценки того, насколько близко совпадают два набора данных, или для оценки того, насколько близко данные соответствует выбранной статистической модели. График строится на основе двух кумулятивных функций распределения, нарисованных друг напротив друга. Он позволяет оценить насколько подобны или различны положение, разброс и асимметрия двух распределений. Если функции распределения близки, то данные отобразятся около прямой линии. Такое построение аналогично графику Q-Q, который используется для схожих целей, что часто ведёт к путанице между двумя этими понятиями.

Определение

[править | править код]

График P-P отображает две функции распределения относительно друг друга [1]. Для двух функций распределения F и G, построим , где z задана от до Поскольку функция распределения всегда имеет областью значений интервал , область определения параметрического графа равна , а диапазон[чего?] равен единичному квадрату Таким образом, для входного значения z вывод представляет собой пару чисел, указывающих, какая доля от f и какая доля от g приходится на z или ниже z.

Для сравнения используется прямая линия проведённая под углом 45° от (0,0) до (1,1). Распределения равны тогда и только тогда, когда данные попадает на эту линию. В то же время отклонение позволяет легко определить разницу между распределениями. Однако, из-за ошибки выборки даже данные, взятые из одного и того же распределения, не будут выглядеть полностью идентичными. [2]

  1. Nonparametric statistical inference by Jean Dickinson Gibbons, Subhabrata Chakraborti, 4th Edition, CRC Press, 2003, ISBN 978-0-8247-4052-8, p. 145
  2. Derrick, B; Toher, D; White, P (2016). "Why Welchs test is Type I error robust". The Quantitative Methods for Psychology. 12 (1): 30—38. doi:10.20982/tqmp.12.1.p030.