Коэффициент Сёренсена

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Мера Сёренсена - бинарная мера сходства, предложенная Торвальдом Сёренсеном в 1948 году.[1] Фамилия автора коэффициента в литературе переводится самыми различными способами: Съёренсен, Съеренсен, Соренсен, Серенсен. Вариант "Сёренсен" приводится в известной работе X.X.Трасса[2]. Мера Сёренсена эквивалентна (связаны одной монотонно возрастающей зависимостью) мере Жаккара и мере Сокала-Снита для конечных множеств (множественная интерпретация). На основе индекса Сёренсена получен индекс Маарела:  K_M = 2 K_S - 1.

 K_{0,-1} = \frac{2n(A \cap B)}{n(A) + n(B)}

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом указанной меры является мера Чекановского[3]:

 K_{0,-1} = {2 \sum_{i=1}^r min(A_i, B_i) \over ( \sum_{i=1}^r (A_i) + \sum_{i=1}^r (B_i) ) }

Если сравнивается встречаемость видов (вероятностная интерпретация), т.е. учитываются вероятности встреч признаков, то аналогом меры Сёренсена будет симметричная мера Дайса (coincidence index), предложенная Л.Дайсом в 1945 году[4], в дальнейшем использовался Р.Бреем[5]. Поэтому меру часто называют индексом Дайса-Брея. В некоторых работах используется под названием индекса Дайса или индекса Брея-Кёртиса (реже индекса Ланса-Вильямса):

 K_{0,-1} = \frac{2P(A \cap B)}{P(A) + P(B)}

Для информационной аналитической интерпретации мера взаимозависимости была независимо предложена Б.И. Сёмкиным[6] и чешскими авторами[7]. Мера применяется в научных исследованиях для определения степени взаимозависимости двух признаков.

 K_{0,-1} = \frac{2I(A,B)}{H(A) + H(B)}

См. также [править]

Литература [править]

  1. Sörensen T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species content // Kongelige Danske Videnskabernes Selskab. Biol. krifter. Bd V. № 4. 1948. P. 1-34.
  2. Трасс Х.Х. Геоботаника. История и современные тенденции развития. – Л.: Наука, 1976. – 252 с.
  3. Czekanowski J. Zur differential Diagnose der Neandertalgruppe // Korrespbl. Dtsch. Ges. Anthropol. 1909. Bd 40. S. 44-47.
  4. Dice L.R. Measures of the amount of ecological association between species // Ecology. 1945. V. 26. № 3. P. 297-302.
  5. Bray J.R. A study of mutual occurrence of plant species // Ecology. 1956. V. 37. № 1. P. 21-28.
  6. Сёмкин Б.И. Общие принципы введения мер различия, сходства и разнообразия в биоценологии // Принципы и методы экспериментального изучения растительных сообществ. Л.: Наука, 1972. С. 12-16.
  7. Řehak R.P., Řehakova B. Měrěne statisicka závilosti nominálnich znaki // Sociologicky Časopis. 1973. № 4. S. 404-417.