Википедия:Вики-конференция 2007/Программа/Доклады/Связность статей нашего раздела

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Название доклада[править код]

Связность статей Википедии на русском языке.

Докладчик[править код]

  1. Mashiah Davidson - инициатор проекта «Связность».

План доклада[править код]

  1. Что такое связность и зачем за ней следить в Википедии.
  2. Что такое страницы-сироты, тупиковые статьи и изолированные статьи.
  3. В чём отличие между стандартными отчётами, предоставляемыми движком MediaWiki и новыми инструментами.
  4. Текущее состояние раздела.
  5. Сценарии работы с изолированными статьями.
  6. Открытые вопросы.

Тезисы[править код]

Вступительные[править код]

Википедия является необычной энциклопедией. В отличие от бумажных изданий Википедия использует гипертекст для представления информации. Под гипертекстом в первую очередь понимается возможность быстрого перехода со статьи на статью при помощи гиперссылок. Использование гипертекста не только делает энциклопедию более цельной и удобной для восприятия, но и повышает верифицируемость информации. Переходя по ссылкам со статьи на статью, намного проще заметить различия в изложении фактов.

Важно, чтобы все статьи Википедии были связаны между собой, одно из основных правил Википедии гласит, что любая статья должна быть доступна при переходе по ссылкам с главной страницы.

Анализ связности позволяет также выявлять множество недостатков существующих статей, таких как банальное отсутствие значимости, ошибки в именовании статей, отсутствие необходимых перенаправлений, неточные ссылки, ведущие на страницы разрешения неоднозначностей. Многие изолированные статьи на деле подлежат удалению или серьёзной модификации по тем или иным не связанным со связностью причинам. При анализе связности также порой обнаруживаются странности в поведении движка MediaWiki, такие как существование статей, к которым невозможно получить доступ через Веб-интерфейс, или неполнота списка двойных перенаправлений, подлежащих спрямлению.

Два конца одной палки[править код]

При анализе связности исследуется два класса проблемных статей:

  1. статьи, не содержащие ссылок на другие статьи, так называемые тупиковые статьи
  2. статьи, на которые нельзя попасть из подавляющего большинства других статей Википедия, или Категория:Википедия:Изолированные статьи, среди которых отдельно выделяются страницы-сироты, то есть, страницы, на которые вообще нет ссылок из других статей Википедии.

Предмет анализа — статьи[править код]

Анализ связности напрямую связан с вопросом о том, что считать статьями. Прежде всего, стоит заметить, что речь идёт об основном пространстве имён. Но даже в основном пространстве имеются страницы, находящиеся на особом положении, среди них

  1. страницы перенаправления;
  2. страницы разрешения неоднозначностей;
  3. хронологические статьи;
  4. всевозможные служебные списки для координации работ.

Что считать статьями, ссылки с каких страниц принимать во внимание — эти вопросы первичны при постановке вопроса о связности.

Несовершенство служебных списков[править код]

Встроенные в движок MediaWiki механизмы на поверку оказываются не вполне надёжными. Они не различают ссылки между различными пространствами имён и ссылки между статьями, не принимают в расчёт страницы разрешения неоднозначностей, и уж, тем более, не отличают ссылки из хронологических статей и служебных списков от нормальных тематических ссылок.

Текущее состояние раздела[править код]

При текущих способах учёта ссылок, в нашем разделе около 14,5 тысяч изолированных статей, то есть, около 7% от общего числа статей. Значительная часть из них является страницами-сиротами (около 12 тысяч, или 6%). Тупиковых статей всего около тысячи (0.5% от общего числа статей). Около половины тупиковых статей одновременно являются изолированными.

Больше всего изолированных статей в категориях Персоналии по алфавиту (6.5 тыс.) и Материалы ЭСБЕ (3.7 тыс.).

Более подробно о состоянии раздела можно узнать здесь и здесь.

Сценарии работы с изолированными статьями[править код]

  1. Шаблон {{сирота}}, как средство быстрого поиска
  2. Создание перенаправлений и спрямление ссылок, идущих через страницы разрешения неоднозначностей
  3. Разматывание цепочки ссылок между изолированными статьями
  4. Поиск изолированных статей в отдельных категориях
  5. Установка ссылок из тупиковых статей и статей к викификации

Вопросы для обсуждения на круглом столе[править код]

Как это работает?[править код]

Использование тулсервера и AWB.

Языки: SQL и unix shell

Планы по улучшению.

Открытые и часто задаваемые вопросы[править код]

  1. должен ли шаблон {{сирота}} быть видимым?
  2. где следует устанавливать шаблоны, в начале статьи, или в конце?
  3. почему не используется шаблон {{rq}} с параметром linkless
  4. почему для изолированных статей используется невидимый шаблон
  5. как сделать названия категорий для изолированных статей более удачными
  6. как долго бот должен выжидать, прежде чем устанавливать шаблон на новую статью
  7. почему автоматический учёт изолированных статей не внедрён в больших языковых разделах
  8. как улучшить существующий алгоритм поиска изолированных кластеров
  9. какой отчёт удачнее всего использовать в качестве инструмента для ПРО:С
  10. следует ли учитывать ссылки со служебных списков, и нужны ли они в основном пространстве статей
  11. как сократить число правок, производимых ботом
  12. кто умеет рисовать?

См. также[править код]