Поисковая машина
Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота базы, учёт морфологии языка.
Содержание |
[править] Классификация
[править] По области поиска(условно)
[править] Локальные
Предназначены для поиска информации по какой-либо части всемирной сети, например по одному или нескольким сайтам, либо по локальной сети.
[править] Глобальные
Предназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем Google,Yahoo и т. д.
Поисковые машины осуществляют поиск информации различного типа, например текстов, видео, изображений, географических объектов, персональных данных и др.
При этом файлы, с которыми может работать поисковая машина, могут быть как текстового формата (например .html,.htm,.txt,.doc,.rtf, …), так и графического (.gif, .png, .svg, …) или мультимедийного (видео, звука и другой информации).
Пока наиболее распространённым является именно поиск по текстовым документам. Такими документами могут быть web-страницы, документы в формате doc, rtf, txt и др.
В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Поиск по изображениям, видео, звукам более сложен с технологической точки зрения, поэтому массово не реализован. Такие системы, как, например, Яндекс.Картинки, на момент написания статьи искали не по самим изображениям, а по альтернативным текстам, соответствующим этим изображениям.
[править] Поисковый запрос
Исходной информацией для поиска является поисковый запрос.
[править] Функции
Поисковые машины выполняют несколько функций:
[править] Поиск ссылок
На страницы и другие документы сайтов
[править] Автоматически
Поисковая машина ищет ссылки со страниц сайтов.
[править] Ручной режим
Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов
[править] Индексация документов сайтов
Извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины
[править] Поиск по базе данных проиндексированных документов
Может состоять из нескольких этапов