Википедия:Вики-конференция 2008/Результаты/Микроформаты в Википедии

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Введение[править код]

Есть два различных подхода к тому, чем является Википедия. Первый подход заключается в том, что Википедия — это вещь в себе, а всё остальное так или иначе используется для её развития и пополнения (так называемый «википедияцентризм»). Данный подход логичен, понятен и в чём-то правилен, но он является достаточно узким. Второй подход заключается в том, что Википедия кроме того, что должна быть целостной самостоятельной вещью, ещё и контактировать с другими проектами: в основном с поисковыми системами, а также с географическими и картографическими проектами, вики-проектами и другими, контакт с которыми может приносить пользу конечному пользователю. Микроформаты являются одним из путей решения задачи контакта с другими проектами.

О микроформатах[править код]

Микроформаты можно описать как некоторые данные и блоки данных, которые «вживляются» непосредственно в код той же страницы, которая создаётся для прочтения человеком, и которые позволяют поисковым роботам, браузерам и прочим автоматизированным системам получать информацию из этих страниц. То есть это текст, который читается «машинами» для пользователей, а не непосредственно самими пользователями. Микроформаты различаются по своей структуре, поэтому рассмотрим отдельно две группы: к первой отнесём те, которые содержат информацию о странице или её части, а ко второй те, которые описывают связи и отношения между страницами.

Информационные блоки[править код]

geo[править код]

Данный микроформат давно и успешно используется в проекте «Географические координаты» в составе шаблона для указания координат объекта. На основе данного проекта в картографических проектах добавляются пометки об объектах. В самом крупном из них — Картах (и Планете Земля) Google — можно даже сразу прочитать вступление и сразу перейти на статью в Википедии. Такое направление сотрудничества очень хорошо как для Википедии, так и для самих проектов, но в данный момент в нём присутствуют проблемы, которые может решить именно микроформат geo. Данные о координатах проекты получают за счёт обработки дампа Википедии специальной программой. Учитывая, что дамп планово делается раз в месяц (а на момент доклада он не делался уже три месяца), это создаёт проблемы с актуальностью. Например, метка для Библиотеки им. Ушинского так и не появилась на Картах Google, хотя статья была создана ещё июле, за три месяца до Вики-конференции (это произошло из-за вышеуказанных проблем с дампом). Если бы Google, индексируя правки при помощи RSS, что он и так делает[источник не указан 558 дней], обновлял пометки на карте на основе микроформата geo, задержки бы составляли секунды, а не месяцы. Для небольших проектов, которым никто не помогает извлекать информацию из базы, такой подход тоже удобен, ибо микроформатов предоставляют информацию в стандартизированнм виде, позволяя не вникать вструктуру шаблонов для того, чтобы извлекать из них данные. Кроме того, можно использовать ботов, которые будут сверять данные о координатах в разных разделах, и так же они не будут привязаны к конкретной структуре того или иного раздела.

Карточки: hCard и hCalendar[править код]

Пример[править код]

Простой пример того пример, как может выглядеть hCard (без привязки к Википедии):

 <div class="vcard">
   <div class="fn">Вася Пупкин</div>
   <div class="org">ООО «Рога и Копыта»</div>
   <div class="tel">604-555-1234</div>
   <a class="url" href="http://example.com/">http://example.com/</a>
 </div>

Классом блока задаётся «vcard» («vevent» для hCalendar), а внутри задаются поля, у которых, классы соответствуют атрибутом, а текст в них (или значение аттрибута title, если он задан).

Текущее положение[править код]

На данный момент микроформат hCard используется примерно в 20—25 тысячях статей. При этом соответствующий код включён почти в 40 шаблонов-карточек, что составляет около трети суммарного количества карточек, в которые его нужно добавить. Микроформат hCalendar на данный момент в статьи не включался, но его потенциальный ввод технологически проще за счёт небольшого количества карточек «событий». Например, шаблоны для фильма и музыкального альбома суммарно покрывают более 15 тысяч статей.

Практическая польза[править код]

Применительно к Википедии, польза от карточек, помимо расширенной выдачи в поисковиках, может выражаться в их выгрузке на свой компьютер. Для hCard это может быть добавление в адресную книгу. Для страниц знаменитостей это практически бесполезно, но может быть полезно для организаций. Для hCalendar это добавление в записную книжку/календарь. Например, можно занести дату мировой премьеры фильма или выхода альбома, концерта или выборов в думу. После занесения можно будет, во-первых, использовать данную информацию напрямую, для того, чтобы помнить о событии, а во-вторых, с этого события всегда можно вернуться на статью в Википедии и узнать новую информацию. Связи между страницами

Связи между страницами[править код]

Ссылки по теме[править код]

Доклад