Проект:Водные объекты/Статистика/Актуальность дополнения

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
сортированные по регионам статьи о ВО
синий — количество статей
красный — статьи на выверке
рыжий — статьи без АИ

Данная статистика собрана в попытке ответить на давний вопрос — какие статьи следует развивать в первую очередь, а какие оставить на потом? До текущего момента концепция развития статей строилась вокруг тех вопросов и тех регионов, которые интересны редактору, но интересны ли они читателю?

Предлагаемая методология не заявляется как идеальная, у неё есть свои минусы и свои плюсы. В сегодняшних условиях из доступных для анализа данных есть такие характеристики как объём текста, посещаемость статьи и различные метки содержания, они и будут рассмотрены.

Поскольку мы не знаем идеального соотношения между содержимым статьи и читательской удовлетворённостью, оно будет выражено в «попугаях» — коэффициентах насыщенности (далее просто «коэффициент»). Коэффициент — число, полученное в результате деления количества символов в статье на среднее количество посещений в день за период 2016-01-01—2016-12-31 включительно. Коэффициент = размер в символах / посещения за 2016 * дни в году.

При следовании данной методике мы получим градацию от «большой спрос — мало текста» до «малый спрос — много текста». «Мало текста» здесь понятие относительное, при огромной популярности даже большая подробная статья будет подпадать под это определение. Частные примеры:

  • Перл-Харбор — низкий коэффициент 8,89 (10236/421181*366): объём статьи не слишком мал, но посещаемость огромна;
  • Байкал — низкий коэффициент 31,31 (87978/1028527*366): объём статьи огромен, но посещаемость ещё больше;
  • Вруда (приток Луги) — ниже среднего коэффициента 2000,12 (3727/682*366)
  • Абляисова — средний коэффициент 3498,06 (2657/278*366): мало текста, низкая посещаемость;
  • Летас (озеро) — большой коэффициент 7045,98 (3677/191*366): объём статьи довольно мал, но и посещаемость минимальна.

По оценке авторов методики:

  1. чем меньше у статьи коэффициент, тем более она нуждается в расширении либо доработке до идеального состояния (статуса в том числе);
  2. чем меньше разница между минимальным и максимальным значением коэффициента, тем равномернее описана тема в целом.

Проанализированный массив статей (страны: 36335 штук, регионы: 33916 штук) выбран следующим образом:

  1. статья создана до 2017-го года и находится в К:Водные объекты;
  2. для статьи удалось выгрузить статистику посещений;
  3. в карточке статьи заполнен параметр «Регион»/«Страна» (на 2017-04-01) для соответствующих статистик;
  4. были исключены все регионы, содержащие менее 10 статей.

Коэффициенты для стран и регионов вычислены при помощи среднего арифметического от коэффициентов статей в них. То же касается среднего объёма и просмотров в день.

На графиках для наглядности за условный ноль взято среднее арифметическое от коэффициентов регионов/стран.

Погрешности и условности:

  • объём
    • за объём статьи взяты не только символы текста, но и знаки пунктуации с различными шаблонами (допустительно, так как разница важна для конкретных экземпляров, но не массивов статей);
    • объём статьи является лишь косвенным показателем её качества, но с каждым килобайтом шансы удовлетворения спроса читателя растут;
    • некоторые статьи достигли состояния возможности роста лишь в сторону качества, но не в сторону количества текста — наиболее популярные из них будут иметь низкий коэффициент, то есть высокую актуальность к доработке;
  • посещаемость
    • статистика посещаемости читателями не отделена от посещаемости редакторами, поэтому внутренние работы имеют на неё влияние (однако исключены боты и пауки);
    • на посещаемость в теории также должно влиять количество и качество внутренних ссылок на статью (однако анализ графика с выделением изолированных статей не выдал практической корреляции, распределение изолятов по шкале X оказалось равномерным);
  • на полноту выборки повлиял массив статей без указанных регионов (около 2 тысяч штук, необходима помощь в ликвидации).

Идея и воплощение: Advisor, Vort.