Частотность

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле:

где Freqx — частотность слова «x», Qx — количество словоупотреблений слова «x», Qall — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометами — употребительное, малоупотребительное и т. д.

Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерации. Высокие показатели частотности гласных называются ассонансом. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.

Частотность слов и букв являлась важнейшим инструментов криптоанализа в эпоху до повсеместного распространения блочных шифров.

Не следует путать термины частотность и частота.

Частотность букв русского языка[править | править вики-текст]

Статистика частотности букв русского языка (на материале НКРЯ):[1]

Частотность букв русского языка[1]
ранг буква употреблений частотность
1 о 52295949 0,10983
2 е 40392978 0,08483
3 а 38081816 0,07998
4 и 35075552 0,07367
5 н 31900994 0,067
6 т 30084462 0,06318
7 с 26058590 0,05473
8 р 22595850 0,04746
9 в 21582499 0,04533
10 л 20678280 0,04343
11 к 16599539 0,03486
12 м 15252377 0,03203
13 д 14173134 0,02977
14 п 13349597 0,02804
15 у 12452612 0,02615
16 я 9528713 0,02001
17 ы 9036813 0,01898
18 ь 8263123 0,01735
19 г 8031521 0,01687
20 з 7811723 0,01641
21 б 7579289 0,01592
22 ч 6904749 0,0145
23 й 5753983 0,01208
24 х 4597146 0,00966
25 ж 4476464 0,0094
26 ш 3420179 0,00718
27 ю 3044673 0,00639
28 ц 2314208 0,00486
29 щ 1719607 0,00361
30 э 1573696 0,00331
31 ф 1268926 0,00267
32 ъ 175908 0,00037
33 ё 63623 0,00013

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. 1 2 О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики

Ссылки[править | править вики-текст]

Логотип Викисловаря
В Викисловаре есть статья «частотность»