Коэффициент Сёренсена

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Мера Сёренсена — бинарная мера сходства, предложенная датским учёным Торвальдом Сёренсеном[en] в 1948 году[1]. Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант «Сёренсен» приводится в известной работе X.X.Трасса[2].

Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен индекс Маарела:  K_M = 2 K_S - 1.

 K_{0,-1} = \frac{2n(A \cap B)}{n(A) + n(B)}

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Чекановского[3]:

 K_{0,-1} = {2 \sum_{i=1}^r min(A_i, B_i) \over ( \sum_{i=1}^r (A_i) + \sum_{i=1}^r (B_i) ) }

Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч признаков, то аналогом меры Сёренсена будет симметричная мера Дайса (coincidence index), предложенная Л.Дайсом в 1945 году[4], в дальнейшем использовался Р.Бреем[5]. Поэтому меру часто называют индексом Дайса-Брея. В некоторых работах используется под названием индекса Дайса или индекса Брея-Кёртиса (реже индекса Ланса-Вильямса):

 K_{0,-1} = \frac{2P(A \cap B)}{P(A) + P(B)}

Для информационной аналитической интерпретации мера взаимозависимости была независимо предложена Б. И. Сёмкиным[6] и чешскими авторами[7]. Мера применяется в научных исследованиях для определения степени взаимозависимости двух признаков.

 K_{0,-1} = \frac{2I(A,B)}{H(A) + H(B)}

См. также[править | править исходный текст]

Примечания[править | править исходный текст]

  1. Sörensen T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species content // Kongelige Danske Videnskabernes Selskab. Biol. krifter. Bd V. № 4. 1948. P. 1-34.
  2. Трасс Х. Х. Геоботаника. История и современные тенденции развития. — Л.: Наука, 1976. — 252 с.
  3. Czekanowski J. Zur differential Diagnose der Neandertalgruppe // Korrespbl. Dtsch. Ges. Anthropol. 1909. Bd 40. S. 44-47.
  4. Dice L.R. Measures of the amount of ecological association between species // Ecology. 1945. V. 26. № 3. P. 297—302.
  5. Bray J.R. A study of mutual occurrence of plant species // Ecology. 1956. V. 37. № 1. P. 21-28.
  6. Сёмкин Б. И. Общие принципы введения мер различия, сходства и разнообразия в биоценологии // Принципы и методы экспериментального изучения растительных сообществ. Л.: Наука, 1972. С. 12-16.
  7. Řehak R.P., Řehakova B. Měrěne statisicka závilosti nominálnich znaki // Sociologicky Časopis. 1973. № 4. S. 404—417.