Поисковая система
| Эта статья должна быть полностью переписана.
На странице обсуждения могут быть пояснения.
|
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска — это одна из приоритетных задач современного интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).
По данным компании Net Applications,[1] в ноябре 2011 года использование поисковых систем распределялось следующим образом:
- Google — 83,87 %;
- Yahoo! — 6,20 %;
- Baidu — 4,22 %;
- Bing — 3,69 %;
- Yandex — 1,7 %;
- Ask — 0,57 %;
- AOL — 0,36 %.
Содержание |
История[править]
| Хронология | ||
|---|---|---|
| Год | Система | Событие |
| 1993 | W3Catalog | Запуск |
| Aliweb | Запуск | |
| JumpStation | Запуск | |
| 1994 | WebCrawler | Запуск |
| Infoseek | Запуск | |
| Lycos | Запуск | |
| 1995 | AltaVista | Запуск |
| Daum | Основание | |
| Open Text Web Index | Запуск | |
| Magellan | Запуск | |
| Excite | Запуск | |
| SAPO | Запуск | |
| Yahoo! | Запуск | |
| 1996 | Dogpile | Запуск |
| Inktomi | Основание | |
| Рамблер | Основание | |
| HotBot | Основание | |
| Ask Jeeves | Основание | |
| 1997 | Northern Light | Запуск |
| Яндекс | Запуск | |
| 1998 | Запуск | |
| 1999 | AlltheWeb | Запуск |
| GenieKnows | Основание | |
| Naver | Запуск | |
| Teoma | Основание | |
| Vivisimo | Основание | |
| 2000 | Baidu | Основание |
| Exalead | Основание | |
| 2003 | Info.com | Запуск |
| 2004 | Yahoo! Search | Окончательный запуск |
| A9.com | Запуск | |
| Sogou | Запуск | |
| 2005 | MSN Search | Окончательный запуск |
| Ask.com | Запуск | |
| GoodSearch | Запуск | |
| SearchMe | Основание | |
| 2006 | wikiseek | Основание |
| Quaero | Основание | |
| Ask.com | Запуск | |
| Live Search | Запуск | |
| ChaCha | Запуск (бета) | |
| Guruji.com | Запуск (бета) | |
| 2007 | wikiseek | Запуск |
| Sproose | Запуск | |
| Wikia Search | Запуск | |
| Blackle.com | Запуск | |
| 2008 | DuckDuckGo | Запуск |
| Tooby | Запуск | |
| Picollator | Запуск | |
| Viewzi | Запуск | |
| Cuil | Запуск | |
| Boogami | Запуск | |
| LeapFish | Запуск (бета) | |
| Forestle | Запуск | |
| VADLO | Запуск | |
| Powerset | Запуск | |
| 2009 | Bing | Запуск |
| KAZ.KZ | Запуск | |
| Yebol | Запуск (бета) | |
| Mugurdy | Закрытие | |
| Goby | Запуск | |
| 2010 | Яндекс (англ.) | Запуск |
| Cuil | Закрытие | |
| Blekko | Запуск (бета) | |
| Viewzi | Закрытие | |
| 2012 | WAZZUB | Запуск |
Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[2] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы[править]
Согласно данным LiveInternet в 2012 году об охвате русскоязычных поисковых запросов:
- Всеязычные:
- Англоязычные и международные:
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Узкоспециализированные поисковые системы[править]
Помимо общеизвестных «поисковиков» существует целый ряд узкоспециализированных поисковых систем, которые индексируют только специфическую информацию и выделяют из нее универсальные признаки, которые другие системы воспринимают как текст. Некоторые из них являются подразделением глобальных поисковых систем. Наиболее наглядным примером служит Яндекс.Маркет. Задав определенные параметры в фильтре поиска, пользователь получает список искомых объектов и соответствующую дополнительную информацию. По заложенному функционалу Яндекс.Маркет является узкоспециализированной поисковой системой, но при этом входит в структуру глобальной поисковой системы Яндекс.
В Рунете есть узкоспециализированные поисковые системы, являющиеся ключевым инструментом поиска и анализа государственных и коммерческих контрактов из всех отраслей экономики.
Портал zakupki.gov.ru является официальным сайтом Российской Федерации по размещению госзаказов и обладает собственной системой поиска и идентификации государственных тендеров.
Поисковая система bicotender.ru генерирует информацию не только по государственным, но и по коммерческим закупкам, а «умная» функция поиска учитывает множество параметров, среди которых морфология слова и раскладка клавиатуры.
Преимуществом узкоспециализированных поисковых систем является то, что функция поиска в них разрабатывается для обработки конкретной информации. Поскольку такие системы не тратят время на индексацию "посторонних" данных, релевантные результаты попадают в них гораздо быстрее.
Необычные поисковые системы[править]
- DuckDuckGo — гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.
- Koogle (с его помощью ортодоксальные иудеи могли найти контент, признанный раввинами удовлетворяющим религиозным требованиям).[3]
- Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера).[3]
- TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Google ввел такую функцию в своем поиске по картинкам.
- Генон — поисковая система, собирающая и создающая контент у себя на сайте.
- ImHalal — первый исламский поисковик. Новый поисковик может отличить разрешённые для мусульман (халяльные) результаты поиска от запретных (харамных). Был открыт в 2009 году. Ориентировочно с начала сентября 2011 прекратил функционирование в связи с недостатком финансирования.
См. также[править]
- Список поисковых машин
- Информационный поиск
- Статистика запросов
- Поисковый спам
- Каталог ресурсов в Интернете
- DataparkSearch
- Qwika
- Wikia Search
- Электронная библиотека#Списки библиотек и поисковые системы
Примечания[править]
Литература[править]
- Байков Владимир Дмитриевич. Интернет. Поиск информации. Продвижение сайтов. — СПб.: БХВ-Петербург, 2000. — 288 с. — ISBN 5-8206-0095-9
- Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1
- Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5
- Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0
- Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN 978-5-8459-1623-5
- Ландэ Д. В., Снарский А. А., Безсуднов И. В. Интернетика: Навигация в сложных сетях: модели и алгоритмы. — M.: Либроком (Editorial URSS), 2009. — 264 с. — ISBN 978-5-397-00497-8
Ссылки[править]
- Захаров Н. В. Информационно-поисковые системы в филологических науках
- Компоненты, алгоритмы поисковых систем
- Портал поисковых технологий «Search Tools» (англ.)
- Национальная поисковая система Российской Федерации (статья)
- Поисковые системы (статья)
- Почти все известные Российские и зарубежные поисковые системы(статья)
| Веб и веб-сайты | |
|---|---|
| Глобально | |
| Локально | |
| Виды сайтов и сервисов |
Виртуальный атлас • Баннерная сеть • Блог (платформа) • Видеохостинг • Вики (список движков • список сайтов) • Сайт-визитка • Вопрос-ответ • Закладки • Службы знакомств • Каталог ресурсов • Интернет-магазин • Микроблог • Тамблелог • Новостной сайт • Поисковая система (список) • Порносайт • Социальная сеть • BitTorrent-трекер • Файлообменник • Форум (Сервис • Имиджборд) • Фотохостинг • Чат |
| Создание и обслуживание |
|
| Типы макетов, страниц, сайтов |
|
| Техническое |
Веб-сервер (сравнение) • Браузер (список • сравнение) • CMF (список (англ.)) • CMS (список (англ.)) • HTTP (ответы • заголовки) • SPDY • CGI • HTML • XHTML • CSS • JavaScript • DHTML • DOM • XML • AJAX • JSON • Flash • RSS • Atom • Микроформат • favicon.ico • robots.txt • Sitemaps • Карта сайта • .htaccess |
| Маркетинг | |
| Социум и культура | |
| Интернет | |
|---|---|
| Вещание | |
| Общение | |
| Информация |
Реклама • Рассылка • Спам • Каталог ресурсов • Жёлтые страницы • Поисковая система • RSS-агрегатор • Файлообмен |
| Бизнес | |
| Культура | |
| Прочее |
Доступ • Протоколы • Глобальная сеть • Точка обмена трафиком • Интернет2 • Доменное имя • Онлайн • Сетевой нейтралитет • Цензура • Хостинг • Портал • Всемирная паутина (Браузер • Вики-проекты • Семантическая паутина • Веб-служба • Веб 2.0) • Рунет • Интернет-время • Ботнет • Дотком |

