Поисковая машина
Эта статья должна быть полностью переписана. |
Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, то есть уместность результата), полнота индекса, учёт морфологии языка.
Классификация[править | править код]
По области поиска (условно)[править | править код]
Локальные[править | править код]
Предназначены для поиска информации по какой-либо части всемирной сети, например по одному или нескольким сайтам, либо по локальной сети. Такие поисковые машины обычно используются внутри частных (корпоративных) сетей или в системах для электронной коммерции (интернет-магазинах). Поэтому их также часто называют «корпоративными». Среди популярных корпоративных поисковых машин известны такие как: Apache Solr, Endeca, Sphinx, Elasticsearch.
Персональные[править | править код]
Служат для поиска среди файлов на персональных компьютерах или в небольших локальных сетях.
Глобальные[править | править код]
Предназначены для поиска информации по всей сети Интернет либо по значительной её части. Владельцами таких поисковых машин являются поисковые системы Google, Яндекс и др. Поисковые машины осуществляют поиск информации различного типа, например текстов, видео, изображений, географических объектов, персональных данных и др. При этом файлы, с которыми может работать поисковая машина, могут быть как текстового формата (например .html, .htm, .txt, .doc, .rtf…), так и графического (.gif, .png, .svg…) или мультимедийного (видео и звук). Пока наиболее распространённым является именно поиск по текстовым документам.
Поисковый запрос[править | править код]
Исходной информацией для поиска является поисковый запрос.
Функции[править | править код]
Поисковые машины выполняют несколько функций:
Поиск ссылок[править | править код]
Поиск ссылок на страницы и другие документы сайтов.
Автоматический[править | править код]
Поисковая машина ищет ссылки со страниц сайтов.
Ручной режим[править | править код]
Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов
Индексация документов сайтов[править | править код]
Извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины
Поиск по базе данных проиндексированных документов[править | править код]
Может состоять из нескольких этапов
Нахождение документов, соответствующих поисковому запросу[править | править код]
Этот раздел статьи ещё не написан. |
Ранжирование документов в соответствии с их релевантностью поисковым запросам[править | править код]
Этот раздел статьи ещё не написан. |
Кластеризация документов[править | править код]
Этот раздел статьи ещё не написан. |
См. также[править | править код]
![]() | В статье не хватает ссылок на источники (см. рекомендации по поиску). |