Коэффициент Охаи

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Мера Охаи — бинарная мера сходства, предложенная Акирой Охаи в 1957 году[1]. В дальнейшем была развита Дж. Баркманом[2]. Фамилия автора коэффициента в литературе переводилась как Очиаи, Отиаи и т. п.

Сам автор (Охаи) утверждает, что коэффициент был ранее предложен Отсукой (Otsuka) как отношение общего числа признаков двух объектов к среднему геометрическому двух объектов и поэтому правильным будет называть — коэффициент Отсуки-Охаи[3].

Охаи ничего нового в этот коэффициент не внёс и, по сути, является его популяризатором, но в своей статье он не дал ссылку на статью первоначального автора.

Эта мера сходства встречается также под названием косинусный коэффициент (cosine similarity coefficient, geometric coefficient, en:Fowlkes–Mallows Index):

 K_{0,0} = \frac{n(A \cap B)}{\sqrt {n(A)n(B)}}

Часто используется мера Охаи, возведённая в квадрат:

 K_{0,0} = \frac{(n(A \cap B))^2}{{n(A)n(B)}}

Реже встречается мера на основе меры Охаи (известна под названиями расстояние Хеллингера или Chord-index[4]):  2 \sqrt {1 - K_O} .

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, аналогом является следующая мера :

 K_{0,0} = { \sum^{r}_{i=1} min(A_i, B_i) \over \sqrt {\sum^r_{i=1} (A_i) \sum^r_{i=1} (B_i)} }

Если сравниваются объекты по встречаемости видов (вероятностная интерпретация), то есть учитываются вероятности встреч, то аналогом меры Охаи будет коэффициент совместимости событий:

 K_{0,0} = \frac{P(A \cap B)}{\sqrt {P(A)P(B)}}

Для информационной аналитической интерпретации используется мера взаимозависимости следующего вида:

 K_{0,-1} = \frac {I(A,B)} {\sqrt {H(A)H(B)}}

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Ochiai A. Zoogeographical studies on the soleoid fishes found Japan and its neighboring regions. II // Bull. Jap. Soc. sci. Fish. 1957. V. 22. № 9. P. 526—530. (Аннотация на англ. Основной текст статьи на яп.)
  2. Barkman J.J. Phytosociology and ecology of cryptogamic epiphytes, including a taxonomic survey and description of their vegetation units in Europe. — Assen. Van Gorcum. 1958. 628 p.
  3. Cheetam A.H., Hazel J.E. Binary (presence-absence) similarity coefficients // J. Paleontology, V. 43, № 5. 1969. P. 1130—1136.
  4. Choi S.S., Cha S.H., Tappert C. A survey of binary similarity and distance measures // J. on Systemics, Cybernetics and Informatics. 2010. V.8, № 1. P. 43-48.