Поисковая машина

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.

Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота базы, учёт морфологии языка.

Содержание

[править] Классификация

[править] По области поиска(условно)

[править] Локальные

Предназначены для поиска информации по какой-либо части всемирной сети, например по одному или нескольким сайтам, либо по локальной сети.

[править] Глобальные

Предназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем Google,Yahoo и т. д.

Поисковые машины осуществляют поиск информации различного типа, например текстов, видео, изображений, географических объектов, персональных данных и др.

При этом файлы, с которыми может работать поисковая машина, могут быть как текстового формата (например .html,.htm,.txt,.doc,.rtf, …), так и графического (.gif, .png, .svg, …) или мультимедийного (видео, звука и другой информации).

Пока наиболее распространённым является именно поиск по текстовым документам. Такими документами могут быть web-страницы, документы в формате doc, rtf, txt и др.

В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.

Поиск по изображениям, видео, звукам более сложен с технологической точки зрения, поэтому массово не реализован. Такие системы, как, например, Яндекс.Картинки, на момент написания статьи искали не по самим изображениям, а по альтернативным текстам, соответствующим этим изображениям.

[править] Поисковый запрос

Исходной информацией для поиска является поисковый запрос.

[править] Функции

Поисковые машины выполняют несколько функций:

[править] Поиск ссылок

На страницы и другие документы сайтов

[править] Автоматически

Поисковая машина ищет ссылки со страниц сайтов.

[править] Ручной режим

Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов

[править] Индексация документов сайтов

Извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины

[править] Поиск по базе данных проиндексированных документов

Может состоять из нескольких этапов

[править] Нахождение документов, соответствующих поисковому запросу

[править] Ранжирование документов в соответствии с их релевантностью поисковым запросам

[править] Кластеризация документов

[править] Примечания

[править] См. также

Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Участие
Печать/экспорт
Инструменты
На других языках