Лексическое сходство

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Лексическое сходстволингвистике) — мера того, до какой степени слова двух данных языков лексически сходны. Лексическое сходство, равное единице (или 100 %) означает полное совпадение двух данных языков, тогда как равенство 0 означает полное отсутствие в них общих слов.

Существуют разные способы определения лексического сходства и результаты, полученные разными способами, соответственно, будут различаться. Например, метод, принятый в Этнологии (энциклопедия), состоит в том, чтобы сравнивать стандартизированный список слов в разных языках и находить сходные среди них одновременно как по написанию, так и по смыслу. Используя этот метод, было найдено, что английский язык имеет лексическое сходство с немецким 60 % и с французским 27 %.

Лексическое сходство может быть использовано, чтобы оценить степень генетического родства между двумя данными языками. Лексическое сходство более 85 % означает, что два сравниваемые языка относятся друг к другу, вероятно, как связанные диалекты.

Лексическое сходство — это только один из индикаторов взаимнопонятности двух языков, так как последняя часто зависит от степени морфологического, фонетического и грамматического сходств языков. Стоит заметить, что лексическое сходство сильно зависит от того, какой стандартизованный список слов рассматривается. Например, лексическое сходство между английским и французским значительно в областях связанных с культурой, судебным производством, и гораздо меньше в области основных функциональных слов. В отличие от взаимнопонятности, лексическое сходство может быть только симметричным для двух языков.

В таблице ниже представлены (по данным справочника Ethnologue[1]) значения лексического сходства для пар германских, романских и славянских языков (прочерк означает отсутствие данных).

Код
языка
Язык 1
Коэффициенты лексического сходства
Каталанский Английский Французский Немецкий Итальянский Португальский Румынский Романшский Русский Сардинский Испанский
cat Каталанский 1 - - - 0.87 0.85 0.73 0.76 - 0.75 0.85
eng Английский - 1 0.27 0.60 - - - - 0.24 - -
fra Французский - 0.27 1 0.29 0.89 0.75 0.75 0.78 - 0.80 0.75
deu Немецкий - 0.60 0.29 1 - - - - - - -
ita Итальянский 0.87 - 0.89 - 1 - 0.77 0.78 - 0.85 0.82
por Португальский 0.85 - 0.75 - - 1 0.72 0.74 - - 0.89
ron Румынский 0.73 - 0.75 - 0.77 0.72 1 0.72 - - 0.71
roh Романшский 0.76 - 0.78 - 0.78 0.74 0.72 1 - 0.74 0.74
rus Русский - 0.24 - - - - - - 1 - -
srd Сардинский 0.75 - 0.80 - 0.85 - - 0.74 - 1 0.76
spa Испанский 0.85 - 0.75 - 0.82 0.89 0.71 0.74 - 0.76 1
Каталанский Английский Французский Немецкий Итальянский Португальский Румынский Романшский Русский Сардинский Испанский
Язык 2 → cat eng fra deu ita por ron roh rus srd spa

Использование списка Сводеша при сравнении русского языка с другими славянскими языками даёт следующую картину[2]:

Филогенетическое дерево групп славянских и балтийских языков
Сопоставляемый язык Процент общей лексики с русским языком
Белорусский 86%
Украинский 86%
Польский 77%
Чешский / словацкий 74%
Болгарский 74%
Словенский 74%
Сербский 71%
Македонский 70%

Данные о сходстве могут быть использованы для исследования филогенетических связей с другими языками.


Примечания[править | править код]

  1. См., например, данные по лексическому сходству для французского Архивная копия от 21 октября 2012 на Wayback Machine, немецкого Архивная копия от 24 сентября 2009 на Wayback Machine, английского Архивная копия от 10 октября 2011 на Wayback Machine
  2. Girdenis A., Maziulis V. Baltu kalbu divercencine chronologija // Baltistica. T. XXVII (2). — Vilnius, 1994. — P. 9.