Компьютерная лингвистика
| Лингвистика |
| Теоретическая лингвистика |
| Дескриптивная лингвистика |
| Прикладная лингвистика |
| Прочее |
| Портал:Лингвистика |
Компью́терная лингви́стика (также: математи́ческая или вычисли́тельная лингви́стика, англ. computational linguistics) — научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Компьютерная лингвистика частично пересекается с обработкой естественных языков. Однако в последней акцент делается не на абстрактные модели, а на прикладные методы описания и обработки языка для компьютерных систем.
Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.
Содержание |
Истоки [править]
Математическая лингвистика является ветвью науки искусственного интеллекта. Всё началось в Соединённых Штатах Америки, в 1950-х годах. С изобретением транзистора и появлением нового поколения компьютеров, а также первых языков программирования, начались эксперименты с машинным переводом, особенно русских научных журналов. В 1960-х годах подобные исследования проводились и в СССР (например, статья о переводе с русского на армянский в сб. «Проблемы кибернетики» за 1964 год). Однако качество машинного перевода до сих пор сильно уступает качеству перевода, произведённого человеком. Были созданы первые системы искусственного интеллекта, такие как SHGSL. Они, правда, устарели, но пользуются популярностью у студентов и научных сотрудников Академий Наук, занимающихся компьютерной лингвистикой.
С 15 по 21 мая 1958 г. в I МГПИИЯ состоялась первая Всесоюзная конференция по машинному переводу. Оргкомитет возглавляли В. Ю. Розенцвейг и ответственный секретарь Оргкомитета Г. В. Чернов. Полностью программа конференции опубликована в сборнике «Машинный перевод и прикладная лингвистика», вып. 1, 1959 г. (он же «Бюллетень Объединения по машинному переводу № 8»). Как вспоминает В. Ю. Розенцвейг, опубликованный сборник тезисов конференции попал в США и произвел там большое впечатление.
В апреле 1959 года в Ленинграде состоялось I Всесоюзное совещание по математической лингвистике, созванное Ленинградским университетом и комитетом прикладной лингвистики. Главным организатором Совещания был Н. Д. Андреев. В Совещании приняли участие ряд видных математиков, в частности, С. Л. Соболев, Л. В. Канторович (впоследствии — Нобелевский лауреат) и А. А. Марков (последние двое выступали в прениях). В. Ю. Розенцвейг выступил в день открытия Совещания с программным докладом «Общая лингвистическая теория перевода и математическая лингвистика».
Направления компьютерной лингвистики [править]
- Обработка естественного языка (англ. natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также:
- Корпусная лингвистика, создание и использование электронных корпусов текстов
- Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии.
- Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate
- Автоматическое извлечение фактов из текста (извлечение информации) (англ. fact extraction, text mining)
- Автореферирование (англ. automatic text summarization). Эта функция включена, например, в Microsoft Word.
- Построение систем управления знаниями. См. Экспертные системы
- Создание вопросно-ответных систем (англ. question answering systems).
- Оптическое распознавание символов (англ. OCR). Например, программа FineReader
- Автоматическое распознавание речи (англ. ASR). Есть платное и бесплатное ПО
- Автоматический синтез речи
Крупные ассоциации и конференции [править]
- Ассоциация по компьютерной лингвистике (ACL): подразделяется на две ветви: Европейскую и Североамериканскую[1].
- Международная русскоязычная конференция по компьютерной лингвистике «Диалог»[2].
- Международная конференция по компьютерной лингвистике и интеллектуальной обработке текста (CICLing).
Учебные программы в России [править]
- Магистерская программа "Компьютерная лингвистика" в Национальном исследовательском университете "Высшая школа экономики"[3]
- Магистерская программа "Компьютерная лингвистика" в Национальном исследовательском университете "Высшая школа экономики" в Нижнем Новгороде [4]
- Магистерская программа "Компьютерная лингвистика" в Российском государственном гуманитарном университете [5]
- Магистерские программы "Компьютерная лингвистика и интеллектуальные технологии" и "Прикладная, экспериментальная и математическая лингвистика" в Санкт-Петербургском государственном университете [6]
См. также [править]
Примечания [править]
Ссылки [править]
- «Компьютерная лингвистика»
- История развития методов компьютерной лингвистики с точки зрения задач машинного перевода и автоматизированного понимания текстов (реферат)
- NLPub - база знаний по лингвистическим ресурсам для русского языка
| Это заготовка статьи по лингвистике. Вы можете помочь проекту, исправив и дополнив её. |
Для улучшения этой статьи желательно?:
|

