Полнотекстовый поиск

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Полнотекстовый поиск — поиск документа в базе данных текстов на основании содержимого этих документов.

Согласно ГОСТ 7.73-96 СИБИД «Поиск и распространение информации. Термины и определения»[1]

3.4.9 полнотекстовый поиск: Автоматизированный документальный поиск, при котором в качестве поискового образа документа используется его полный текст или существенные части текста (англ. Full text searching, фр.  Recherche en texte integral)

Полнотекстовый индекс[править | править вики-текст]

Первые версии программ полнотекстового поиска предполагали сканирование всего содержимого всех документов в поиске заданного слова или фразы. При использовании такой технологии поиск занимал очень много времени (в зависимости от размера базы), а в интернете был бы невыполним. Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются.

Примечания[править | править вики-текст]

См. также[править | править вики-текст]