Участник:Drbug/Распределение вероятности показа статьи

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Методология исследования:

  • Взята статистика запросов за 01-07 июля 2008 года (спасибо Вячеславу за ссылку на сервер статистики).
  • URL-encoded запросы расшифрованы, не соответствующие UTF-8 переведены из cp1251 в UTF-8.
  • Взят список страниц в основном пространстве статей (спасибо Виктору за предоставление списка).
  • Для всех таких страниц сосчитано количество запросов к ним.
  • За плотность вероятности p принято отношение числа показов соответствующей статьи к общему числу показов всех статей вообще.
  • Функция распределения найдена численным интегрированием (суммирование).

Аналогично было сделано со статистикой в немецкоязычном разделе. (Вместо cp1251 использовалась cp1252,)