Национальный корпус русского языка

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/.

Содержание

[править] Составители

Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Санкт-Петербурга, Воронежа и других городов.

В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций[1]:

Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.

[править] Состав корпуса

В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед). В корпус также входят подкорпуса поэтических и диалектных текстов, русско-английский, англо-русский и немецко-русский корпуса параллельных текстов, синтаксический, акцентологический и обучающий подкорпуса. Объём Национального корпуса русского языка в январе 2008 года составил свыше 52 тыс. текстов общим объемом свыше 149 млн словоупотреблений[3].

Тексты снабжены морфологической и семантической разметкой.

[править] См. также

[править] Примечания

[править] Литература

  • Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1
  • Национальный корпус русского языка : 2006—2008. Новые результаты и перспективы. / Отв. ред. В. А. Плунгян. — СПб.: Нестор-История, 2009. — 502 с. ISBN 978-5-98187-327-0
  • Плунгян В.А. Зачем мы делаем Национальный корпус русского языка? // Отечественные записки. 2005. № 2.

[править] Ссылки

Личные инструменты
Пространства имён
Варианты
Действия
Навигация
Участие
Печать/экспорт
Инструменты
На других языках