Национальный корпус русского языка

Материал из Википедии — свободной энциклопедии

Перейти к: навигация, поиск

Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/.

Содержание

[править] Составители

Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Петербурга, Воронежа и других городов.

В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций[1]:

Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.

[править] Состав корпуса

В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед). В корпус также входят подкорпуса поэтических и диалектных текстов, а также русско-английский корпус параллельных текстов. Объём корпуса на январь 2007 года составил 140 млн словоупотреблений.

Тексты снабжены морфологической и семантической разметкой.

[править] См. также

[править] Примечания

[править] Литература

  • Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1

[править] Ссылки

Официальный сайт


На других языках