Семантическая вики

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Семантическая вики — веб-приложение, использующее машинообрабатываемые данные со строго определённой семантикой для того, чтобы расширить функциональность вики-системы.[1][2]

Обычные вики заполняются структурированным текстом и нетипизированными гиперссылками (такими, как в этой статье). Семантические вики позволяют указывать тип ссылок между статьями, тип данных внутри статей, а также информацию о страницах (метаданные).

Недостатки традиционных вики[править | править вики-текст]

Причиной появления потребности в движках семантических вики стал ряд недостатков, присущих традиционным вики-системам. Эти проблемы особенно ярко проявляются с ростом количества статей. Обычно указываются следующие недостатки:[3][4]

Согласованность содержимого. Из-за частого дублирования данных в вики, одна и та же информация может содержаться на нескольких разных страницах. При изменении этой информации на одной вики-странице, пользователи должны следить за тем, чтобы данные были обновлены также и на всех остальных страницах. Эта проблема хорошо иллюстрируется на следующем примере:[5] пусть имелась вики-статья под названием Плутон. На ней Плутон был обозначен как планета. В 2006 году, когда Международный астрономический союз принял решение о лишении Плутона статуса планеты, один из участников поправил страницу со статьей о Плутоне. Однако, ранее Плутон фигурировал в статусе планеты в ряде других статей: Планета, Планеты солнечной системы, Список планет по размеру. Очевидно, что задача согласованности всех этих данных лежит на вики-сообществе.

Доступ к знаниям, имеющимся в вики. Большие вики-сайты содержат тысячи страниц. Выполнение сложных поисковых запросов и сравнение информации, полученной с разных страниц — это задача, которая на традиционных вики-системах является достаточно трудоемкой. Пример: в вики может быть информация обо всех крупных горах планеты. Однако, для того, чтобы сформировать список гор, упорядоченный по высоте, участник сообщества должен проделать много рутинной работы, рискуя при этом ошибиться или пропустить некоторые горы.

Повторное использование знаний вики. Сегодня некоторые настольные приложения используют информацию из Википедии, например, плеер Amarok отображает статьи об исполнителе во время воспроизведения музыкальной композиции. Однако такое использование носит ограниченный характер. Программа способна только показать текст статьи Википедии в некотором контексте, и не может проделать дополнительных шагов (например: найти все альбомы исполнителя). Семантические вики позволяют в полной мере воспользоваться информацией, хранящейся в вики-системе.

Использование категорий, тэгов и пространств имен. Традиционные вики используют плоские системы классификации (тэги), либо классификаторы, организованные в таксономию. Невозможность использования типизированных свойств порождает огромное количество тэгов или категорий. Это хорошо видно на примере Википедии: к примеру, категорию «Умершие 20 апреля» разумно заменить атрибутом «Дата смерти».

Отличительные особенности семантических вики[править | править вики-текст]

Семантические вики делятся на две больших категории: хранящие структурированные данные прямо в тексте страниц (например, Semantic MediaWiki) и хранящие данные отдельно (например, Ontowiki[6], KiWi). Для первого типа характерна расширенная вики-разметка, в то время как вики-системы второго типа имеют формовый интерфейс ввода данных, отдельный по отношению к содержимому статей. Однако для обоих этих типов принято выделять следующие отличительные особенности[7]:

Семантические аннотации[править | править вики-текст]

Ссылки между статьями в семантических вики служат не только для навигации, а несут в себе информацию о типе связи. Например, в Semantic MediaWiki статья о Лондоне может содержать следующую разметку:

[[capital of::England]]. Это утверждение означает, что Лондон является столицей Англии. В данном случае типом ссылки будет «столица» (capital of), а значением ссылки «Англия» (England).

Для вики, в которых ввод основан на формах, часто существует подобная функциональность. К примеру вики-система KiWi позволяет связывать структурированные данные с помощью средств RDF, а затем соотносить RDF-термины с текстом в статье.[8]

Иногда семантические аннотации не вставляются на вики-страницы явным образом, а добавляются автоматически. Для этого в таких вики как ACEWiki существует поддержка контролируемого естественного языка (обычно английского).

Контекстное представление данных[править | править вики-текст]

Многие семантические вики позволяют изменять способы представления содержимого страниц с помощью семантических аннотаций. Контекстное представление включает в себя отображение статей близких данной, отображение информации, которая может быть выведена из базы знаний (например, изображение иерархии классов, к которым относится объект, описываемый в вики-статье).

Семантическая навигация[править | править вики-текст]

В то время как в традиционных вики-системах все, что возможно сделать со ссылкой — это перейти по ней, многие семантические вики позволяют также возможность получить информацию о связи, которая представляется ссылкой. Данная возможность позволяет реализовывать в семантических вики новые способы навигации: к примеру, увидев в статье Лондон ссылку «является столицей::Англия» пользователь может посмотреть на другие страницы в вики, связанные ссылкой «является столицей».

Семантический поиск[править | править вики-текст]

Семантические вики поддерживают возможность строить многокритериальные запросы на формальном языке. Иногда в качестве языка запросов выбирается SPARQL, входящий в стандарты Semantic Web. Использование семантического поиска делает возможным автоматически строить и поддерживать актуальность списков страниц, отвечающих ряду условий. Кроме этого, использование семантических аннотаций позволяет создавать т. н. фасетный поиск, уточняющий поиск[9]. При этом поиск происходит в две стадии: ввод поискового запроса, а затем фильтрация результатов.

Например, при поиске слова «Клинтон» пользователь сначала вводит запрос в поисковую строку, а затем с помощью поисковых фасетов фильтрует результаты поиска: выбирает категорию «Политики» и время жизни XX—XXI века.

Поддержка логического вывода[править | править вики-текст]

Под логическим выводом понимается извлечение скрытых, неявных знаний из введенных в систему фактов. Логический вывод строится на определенных заранее правилах вывода и может быть основан как на структурных алгоритмах, так и на математически обоснованных алгоритмах вывода на основе логических формализмов.

Поддержка стандартов Семантической паутины[править | править вики-текст]

Многие семантические вики хранят данные в форматах Семантической паутины или предоставляют возможность импорта/экспорта в RDF и OWL. Языком запросов к вики часто служит SPARQL, что позволяет обращаться с вики как со SPARQL-endpoint’ом.

История[править | править вики-текст]

Ранние семантические вики-движки[править | править вики-текст]

Впервые термин Семантическая вики был употреблен Энди Динглеем (Andy Dingley) в телеконференции Usenet comp.infosystems.www.authoring.site-design[10]. В научно-технической литературе первое известное упоминание термина связано со статьёй австрийского учёного Лео Зауэрмана (Leo Sauermann) «Gnowsis — Использование технологий Семантической паутины для создания семантического рабочего стола»[11]. К этому моменту уже существовали структурированные вики, такие как TWiki.

Первым движком семантической вики был Platypus Wiki[12]. В ранних семантических вики (таких как Platypus Wiki и Rhizome Wiki[13]) акцент был смещен на предоставление средств для редактирования RDF-содержимого в вики-подобной среде[4] . RDF-данные представлялись в этих ранних вики-системах как свободно редактируемый текст, никак не связанный с неструктурированным содержимым в вики-разметке. Поэтому, в Platypus и Rhizome был возможен импорт RDF-данных, однако продвинутые возможности вроде проверки непротиворечивости и классификации были недоступны.

Современные семантические вики[править | править вики-текст]

Чуть позже появились новые движки семантических вики. Часть из них пошла по пути четкого разделения структурированной и неструктурированной информации, например Ikewiki[14][15] и OntoWiki[16], но стал применяться и другой подход — включение семантических аннотаций в вики-разметку, например в WikiSAR[17] и Semantic MediaWiki[18][19]

Один из наиболее развитых на сегодня движков семантических вики Semantic MediaWiki изначально предназначался для использования в Википедии. Проект семантической википедии (Semantic Wikipedia) был призван обеспечить машинную обработку Википедии с минимальными усилиями со стороны пользователей. В одноименной статье[18] описывается разработка расширения для движка Mediawiki, позволяющего вводить и обрабатывать в вики структурированную информацию. Проект не был включен в программу развития Википедии, но выжил и преобразовался в расширение Semantic MediaWiki. Новая инициатива Фонда Викимедиа Wikidata является прямым наследником этого проекта.

Список активных проектов семантических вики[править | править вики-текст]

Название Вебсайт Описание Язык Разработчик Лицензия
Semantic MediaWiki http://semantic-mediawiki.org реализована в виде плагина к вики-движку MediaWiki. Добавляет новые элементы вики-разметки, позволющие размечать страницы типизированными свойствами и осуществать запросы к этим данным с помощью структурированных запросов PHP Institute AIFB at Karlsruhe Institute of Technology (KIT) GNU GPL v.2
Data Wiki (в прошлом Enterprise Semantic MediaWiki Plus) http://diqa-pm.com/de/DataWiki корпоративная система, основанная на Semantic MediaWiki и наследующая её возможности. Имеет дополнительный функционал для работы с онтологиями, интеграции с Microsoft Office и разграничения доступа. PHP Ontoprise GmbH, затем DIQA-PM GPL/ коммерческая
OntoWiki http://ontowiki.net коллаборативный RDF-редактор с формовым вводом данных. Используется как инструмент для поддержки жизненного цикла связанных данных. Имеется мобильная версия, предназначенная для сбора данных в отсутствие интернета с последующей синхронизацией с сервером. PHP GPL
AceWiki http://attempto.ifi.uzh.ch/acewiki/ Использует подмножество английского языка (контроллируемый[неизвестный термин] английский) для того, чтобы представлять в вики структурированную информацию Java GNU LGPL
KnowWE http://www.is.informatik.uni-wuerzburg.de/forschung/anwendungen/knowwe/ Java GNU LGPL
TikiWiki CMS/Groupware http://info.tiki.org/ PHP GNU LGPL
Information Workbench http://www.fluidops.com/information-workbench/ Java fluid Operations GNU LGPL /коммерческая
ArtificialMemory http://www.artificialmemory.net/ С# Lars Ludwig
TWiki http://twiki.org/ использует формы для добавления структурированных данных, позволяет делать запросы к данным и фильтровать поисковую выдачу Perl GNU GPL
Knoodl http://knoodl.com
Callimachus http://callimachusproject.org Платформа для построения Linked Data приложений, ориентированная на повторное использование данных Java 3 Round Stones, Talis, Cleveland Clinic Apache 2.0
WikiDSmart для Confluence https://wikidsmart.zagile.org Адд-он для корпоративной вики Confluence. Использует SPARQL как язык запросов и ориентирован на тесную интеграцию с Jira Java zAgile
WikiNEXT http://wikinext.gexsoft.com Российская разработка. Павел Арапов

Ссылки[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Markus Krötzsch, Sebastian Schaffert, Denny Vrandečić. Reasoning in Semantic Wikis (англ.) // G. Antoniou et al Reasoning Web 2007 : Lecture Notes. — Berlin: Springer-Verlag, 2007. — Т. 4636. — С. 310-329. — ISBN 978-3-540-74613-3. — DOI:10.1007/978-3-540-74615-7_6
  2. Страница на semanticweb.org, посвященная семантическим вики.
  3. Михаил Навернюк. Семантические вики (рус.).
  4. 1 2 Markus Krötzsch, Denny Vrandecic. Reusing Ontological Background Knowledge in Semantic Wikis (англ.) // Proceedings of the First Workshop on Semantic Wikis - From Wiki To Semantics. — 2006. — С. 16-30.
  5. Allemang, D. and Hendler, J. A. Semantic web for the working ontologist. — Morgan Kaufmann Publishers/Elsevier, 2008. — 352 с.
  6. Sören Auer, Jens Lehmann, Axel-Cyrille Ngonga Ngomo. Introduction to Linked Data and Its Lifecycle on the Web (англ.) // Reasoning Web. Semantic Technologies for the Web of Data / Axel Polleres, Claudia d’Amato, Marcelo Arenas, Siegfried Handschuh, Paula Kroner, Sascha Ossowski, Peter Patel-Schneider. — Berlin / Heidelberg: Springer, 2011. — С. 1-75. — ISBN 978-3-642-23031-8. — DOI:10.1007/978-3-642-23032-5_1
  7. Schaffert S., Bischof D., Buerger T., Gruber A., Hilzensauer W. Learning with semantic wikis (англ.) // Proceedings of the First Workshop on Semantic Wikis - From Wiki To Semantics (SemWiki2006). — Citeseer, 2006. — С. 11-14.
  8. Sebastian Schaffert, Julia Eder, Szaby Grünwald, Thomas Kurz, Mihai Radulescu, Rolf Sint, Stephanie Stroka. Kiwi--a platform for semantic social software (англ.) // The Semantic Web: Research and Applications. — Springer, 2009. — С. 888-892. — ISBN 978-3-642-02120-6.
  9. English J., Hearst. M., Sinha R., Swearingen K., Yee K. P. Hierarchical faceted metadata in site search interfaces (англ.) // CHI'02 extended abstracts on Human factors in computing systems. — 2002. — ISBN 1581134541.
  10. Andy Dingley (21 January 2001). "Дискуссия Wikiwiki (was Theory: "opportunistic hypertext")". comp.infosystems.www.authoring.site-design. (Google Groups).
  11. Leo Sauermann. The Gnowsis-Using Semantic Web Technologies to build a Semantic Desktop (англ.) // Technical University of Vienna. — 2003.
  12. P Castagna, SE Campanini. Towards a semantic wiki wiki web (англ.) // TecWeb. — 2004. Архивировано из первоисточника 1 ноября 2011.
  13. Adam Souzis. Building a Semantic Wiki // IEEE Intelligent Systems.
  14. Schaffert Sebastian. IkeWiki: A semantic wiki for collaborative knowledge management (англ.) // Enabling Technologies: Infrastructure for Collaborative Enterprises, 2006. WETICE'06 : Сб. — Citeseer, 2007. — С. 388-396.
  15. Schaffert, S., Gruber, A., Westenthaler, R. A semantic wiki for collaborative knowledge formation. — 2005.
  16. Soren Auer, Sebastian Dietzold, Thomas Riechert. OntoWiki – A Tool for Social, Semantic Collaboration // The Semantic Web-ISWC 2006. — Springer-Verlag, 2006. — С. 736–749.
  17. David Aumueller. Semantic authoring and retrieval within a Wiki (англ.) // Demo Session at the Second European Semantic Web Conference (ESWC2005), May. — 2005.
  18. 1 2 Volkel M., Krötzsch M., Vrandecic D., Haller H., Studer R. Semantic Wikipedia (англ.) // Proceedings of the 15th international conference on World Wide Web. — Edinburgh, Scotland: ACM Press, 2006. — С. 585-594. — ISBN 1-59593-323-9. — DOI:http://doi.acm.org/10.1145/1135777.1135863
  19. Markus Krötzsch, Denny Vrandecic, Max Völkel. Semantic MediaWiki (англ.) // The Semantic Web-ISWC 2006. — Springer, 2006. — С. 935-942.

Ссылки[править | править вики-текст]

  • SemWiki.org (англ.) — сообщество «Семантические вики»
  • Semantic wiki projects  (англ.) — список проектов движков семантических вики