Коэффициент Симпсона

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Мера Шимкевича-Симпсона — бинарная мера сходства, предложенная независимо Дезидерием Шимкевичем как «показатель родового сходства» в 1934 году[1] и Джорджем Симпсоном в 1947 году[2]. Меру часто путают с несимметричными коэффициентами сходства. Встречается под названием «коэффициент перекрытия» (англ. overlap coefficient).

Для конечных множеств (множественная интерпретация) имеет следующий вид:

,

где  — мощность множества X.

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера использовавшаяся в системах поиска информации[3]:

Если сравниваются объекты по встречаемости видов (вероятностная интерпретация), то есть учитываются вероятности встреч, то аналогом меры Шимкевича-Симпсона будет коэффициент совместимости событий Гудолла[4]:

.

На основе этой меры можно получить ТКД (трансформированный коэффициент Дайса): . Для информационной аналитической интерпретации используется одна из мер взаимозависимости Белла[5]. Мера использовалась в климатологии, систематике растений, информатике:

См. также[править | править код]

Примечания[править | править код]

  1. Szymkiewicz D. Une contribution statistique a la géographie floristique // Acta Soc. Bot. Polon. 1934. T. 34. № 3. P. 249—265.
  2. Simpson G.G. Holarctic mammalian faunas and continental relationship during the Cenozoic // Bull. Geol. Sci. America. 1947. V. 58. P. 613—688.
  3. Сэлтон Г. А. Автоматическая обработка, хранение и поиск информации. — М.: Сов. радио, 1973. — 560 с.
  4. Goodall D.W. Sample similarity and species correlation // Handbook of Vegetation science. Part 5. Ordination and classification of vegetation. The Hague, 1973. P. 107—156.
  5. Bell C.B. Mutual information and maximal correlation as measures of dependence // 10. Ann. Math. Stat. 1962. № 33. P. 587—593.