Lucene
| Тип | |
|---|---|
| Разработчик | |
| Написана на | |
| Операционная система | |
| Последняя версия | |
| Лицензия | |
| Сайт | |
The Apache Lucene — это свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java. Может быть использована для поиска в интернете и других областях компьютерной лингвистики (аналитическая философия).
Содержание |
Основные возможности [править]
- Масштабируемая и высокоскоростная индексация
- свыше 95GB в час на современном оборудовании
- требуется малый объем RAM — «heap» всего 1MB
- размер индекса примерно 20-30 % от размера исходного текста
- Мощный, точный и эффективный поисковый алгоритм
- ранжированный поиск — лучшие результаты показываются первыми
- множество мощных типов запросов: запрос фразы, wildcard запросы, поиск интервалов и т. д.
- поиск основанный на «полях» (таких как заголовок, автор, текст)
- возможность сортировать по различным полям
- multiple-index поиск с возможностью объединения результатов
- возможность одновременного поиска и обновления индекса
- кроссплатформное решение
- исходный код полностью написан на Java
- наличие портов на другие языки программирования
Порты на другие языки [править]
Lucene портирована на другие языки программирования:
- Lucene4c — C
- CLucene — C++
- MUTIS — Delphi
- Plucene — Perl
- Kinosearch — Perl
- PyLucene (Wrapper — not port) — Python
- Ferret и RubyLucene — Ruby
- Zend_Lucene — PHP
- Montezuma — Lisp
- Lucene.Net — C#
Ссылки [править]
- The Apache Lucene
- Lucene API
- Lucene FAQ
- Формат файлов
- Как начать
- Синтаксис запросов
- Scoring
- Lucene Wiki
- Краткий курс на русском
- Solr-Lucene FAQ
Литература [править]
- Erik Hatcher and Otis Gospodnetic, «Lucene in Action», Manning, ISBN 1-932394-28-1
| Поисковые машины (список) | |
|---|---|
| Общие | |
| Региональные |
Accoona (Китай/США) • Alleba (Филиппины) • Ansearch (Австралия/США/Великобритания/Новая Зеландия) • Апорт (Россия) • Daum (Юж. Корея) • Guruji.com (Индия) • Поиск@Mail.Ru (Россия) • Maktoob (Бл. Восток) • Meta.ua (Украина) • Miner.hu (Венгрия) • Najdi.si (Словения) • Onkosh (Бл. Восток) • Рамблер (Россия) • Rediff (Индия) • SAPO (Португалия) • Search.ch (Швейцария) • Sesam (Норвегия/Швеция) • Walla! (Израиль) |
| …лидеры |
Baidu (Китай) • Naver (Юж. Корея) • Seznam (Чехия) • Yahoo! Japan (Япония) • Яндекс.Поиск (Россия, СНГ, Турция) |
| Тематические |
TinEye • Lexxe • Topsy • FindBook.ru |
| Метапоиск |
AskNet.ru • Brainboost • Clusty • Dogpile • FarSEER • exactus.ru • Excite • HotBot • Info.com • Ixquick • Krozilo • Mamma • Metacrawler • MetaLib • Нигма • Myriad Search • SideStep • Surfwax • Turbo10 • WebCrawler • GlobalFileSearch |
| Открытые / свободные |
DataparkSearch • Egothor • Gonzui • Grub • Ht://dig • locust • Isearch • Lucene • Lemur Toolkit & Indri Search Engine • mnoGoSearch • Namazu • Nutch • OpenFTS • Sciencenet (научная, на технологии YaCy) • Wikia Search • Sphinx • SWISH-E • Terrier Search Engine • Xapian • YaCy • Zettair |
| Детские |
AGAKIDS (Россия) • Ask Kids (Великобритания) • Frag Finn (Германия) • Kids AOL (США) • Kids Yahoo! (США) • Quintura Дети (Россия) • Семейный Яндекс (Россия) • Гогуль (Россия) |

