Обсуждение проекта:Связность

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Глобальное обсуждение

[править код]

У проекта, по моим представлениям, довольно хорошо разработана справка; дежурные ботоводы время от времени сталкиваются с отдельными вопросами в случаях, если справка не прочитана, но в целом в проекте обсуждение менее активно, чем в большинстве других проектов, при том, что сам проект работает.

Тем не менее, на самом деле есть масса тем для обсуждения. К сожалению, я осознала, что не справляюсь с донесением кучи информации; зачастую потому, что в проекте включается какое-то временное решение, я думаю, что, пока оно временное, не надо его анонсировать, а временное становится постоянным. Переписка нескольких активных участников проекта постоянно идёт в почте, но очень не хватает коллективной мудрости.

Ниже речь как о технических вопросах, так и не о технических. Если вы прочтёте о проблеме, которую сами не умеете решать, может, вы знаете человека, который умеет, и попросите его помочь?

Текущее состояние

Сайт проекта переведён на 7 языков (английский, русский, украинский, белорусский-тарашкевица, эсперанто, литовский, португальский), частично готов немецкий перевод. Проект работает для 271 Википедии. Шаблоны расстанавливаются в русской, украинской и двух белорусских Википедиях, статистика загружается ещё в литовскую Википедию, а поляки используют для расстановки своими ботами отдельные файлы. Полностью настроенными считаются, помимо ru+uk+be+be-x-old+lt ещё осетинская, якутская, греческая и шведская Википедии — они выделены на сайте жирным, это значит, что у них есть хронологические статьи и мы умеем их определять. 65 Википедий считаются ненастроенными, так как мы не знаем, какие страницы у них являются неоднозначностями.

Что мы умеем

Мы умеем определять тупиковые, изолированные и некатегоризованные статьи разных видов, расстанавливаем и снимаем шаблоны при необходимости (в нескольких Википедиях). Информация собирается скриптом по имени Голем (используется разными ботами, в основном — Голем, РобоСтася, U-bot), в последнее время шаблоны в рувики и be-x-oldwiki расстанавливаются автоматически (то есть без использования AWB; боты Голем и РобоСтася). В рувики очень помогает KrBot, который расстанавливает некоторые шаблоны через 4 часа после создания статьи, а не раз в сутки, как боты, использующие Голема. На сайте ведутся списки изолированных статей по категориям, по дате создания, по авторам (некоторые авторы не любят этот список, а некоторым он удобен; в том числе есть список изолированных статей, созданных анонимами); есть списки статей и шаблонов, в которых есть ссылки на неоднозначности, и списки неоднозначностей, на которые есть ссылки. Ещё есть «дерево категорий», в котором показано, где категории непоследовательны, и какие категории не категоризованы. Время от времени появляются разные дополнения к этому — скрипт AWB, решающий неоднозначности, скрипт, выделяющий и решающий неоднозначности, пояснения и ссылки с разных страниц интерфейса Википедии, и так далее. Википедии можно сравнивать между собой — в таблице и в «пирогах», правда, надо учитывать поле cluster size limit, оно означает, что если в какой-то Википедии есть изолированный кластер крупнее заданного размера, проект его не находит.

Особенности и проблемы

Технические задачи перечислены на странице Проект:Связность/Улучшение инструментов; ниже расширенный, но выжатый пересказ. Очень нужны руки и головы для поиска решений.

  • Некогда на сайте были подсказки по связыванию статей — с помощью «интервики-шпиона» (если у изолированной статьи была интервика, бот шёл по ней-ним и смотрел, как в Википедиях на других языках ссылаются на эту статью, и либо давал список, либо подсказывал, какую статью надо написать) и с помощью гугл-подсказки (простым поиском по Википедии — не встречается ли это название в других статьях?). Ссылка на поиск осталась, но сломалось встраивание. Интервики-шпион пришлось отключить, так как на тулсервере, на котором базируется проект, резко ограничили предоставляемые ресурсы. В итоге сейчас подсказок почти что и нет, а их наличие было хорошо и важно.
  • Нетехническое Нужно поискать в ещё совсем ненастроенных Википедиях, нет ли у них аналога шаблона {{disambig}}, и если есть, то сделать перенаправление с местного template:disambig на этот шаблон. Википедии после этого настроятся при ближайшем проходе бота :)
  • Сейчас очень сложно настраивать автоматическую расстановку шаблонов. Очень не хватает её для Википедии на украинском языке. Кроме того, описания правок сейчас делаются на английском языке, что не очень хорошо. Очень надо бы доделать этот момент.
  • Дизайнерское Как можно сделать более читаемой сравнительную таблицу и круговые диаграммы? Куда разместить ссылку на этот дружественный инструмент, который хоть немного может помочь в деле распутываний колец категорий? Что вы думаете об агрессивности раскраски важного скрипта?
  • Переводческое Хотелось бы перевести сайт на большее количество языков, хотя сейчас это процесс относительно нелёгкий (текты здесь, нужно перевести в текстовом файле и прислать мне или Mashiah Davidson)
  • Нетехническое Может быть, есть что-то, чего я не вижу? Непонятные и незаметные правила, нелогичности, идеи? Может, у вас есть знакомые Википедии, которым нужна статистика (в таком формате) или даже расстановка шаблонов?

Мнения правда очень интересны. Спасибо заранее всем, кто выскажется. Львова Анастасия 13:15, 29 января 2012 (UTC)[ответить]

Мнение участника Egor

[править код]
  • Я попробовал гугл-поиск на тулсервере, он работает. Что касается интервики, то инструмент, видимо, полезный, но мне не совсем понятен алгоритм и глубина работы, возможно, это слишком высокая нагрузка. Тут нужно описать (дать ссылку на описание) как оно работает.
    Он сейчас работает как ссылка, а ранее это было встроенное окно. Нагрузка была — 4 гигабайта оперативной памяти, кажется :) Код здесь, насколько я понимаю; можно особо привлечь внимание Машиаха, чтобы он описал былой алгоритм, но понятно, его надо как-то переделывать. Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Ну и самое простое- не обращать внимания на временные трудности. Я много времени провёл, работая с сиротами, чтобы понять, что же делать. Для подавляющего большинства статей и пользователей ни гугл, ни интервики не помогут. Нужны обобщающие статьи разного уровня обобщения. Без них связность остаётся самоцелью, к сожалению. А вот как развить дерево статей обобщения, я пока не осознал. --Egor 22:41, 30 января 2012 (UTC)[ответить]
    Вкратце, интервики-шпион работал так: для каждого языка после сбора данных об изолированных он анализировал интервики ссылки из них, а потом запускал несколько потоков (по одному на каждом из серверов s1, s2, ...), разыскивающих ссылки на эти интервики-партнёры, а из них обратные ссылки в язык-источник. Таким образом, схема работы была "каждый язык с каждым языком", или N^2 операций поиска. Код в файле iwikispy.sql. Идея в том, чтобы при анализе каждого языка складывать изолированные с интервиками в некую общую базу данных, и не отходя от кассы, анализировать, что можно сделать для других языков. Экономия в основном на постороении таблицы ссылок и выявлении дизамбигов. Я пока не рассматриваю эту задачу как сверхприоритетную и хочу сконцентрировать усилия на повышении стабильности работы (уменьшении времени работы запросов, часто убиваемых при высоком реплаге). Mashiah 13:04, 31 января 2012 (UTC)[ответить]
  • Нетехническое. Тут наверное надо осознать, насколько это нужно делать "сверху". Есть ли краткое и понятное описание проекта связности и его инструментов на базовых языках и максимально доступные ссылки на эти описания для пользователей. Вероятно, для некоторых разделов проще обращаться к пользователям этих разделов через форумы, пусть даже на английском?.
    Некогда я прошлась по всем ненастроенным Википедиям с просьбами. Как правило, это маленькие проекты, в которых не нашлись достаточно живые души. Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Ну так о чём сожалеть? Википедия развивающийся проект, и именно русская культура может обеспечить безграничное его развитие. Время всё расставит на свои места. Даже если мы заговорим на другом языке (хотя вряд ли). Умирающие умрут, или станут песочницами с ограниченными целями. --Egor 22:41, 30 января 2012 (UTC)[ответить]
    Мы не жалеем, дело в том, чтобы порядок был и всё везде совсем работало ;) Львова Анастасия 11:58, 31 января 2012 (UTC)[ответить]
  • А в чём сложность настройки простановки шаблонов? Отсутствие нужных параметров в шаблонах укрвики? или разночтения алгоритмов применения параметров?
    У разных проектов бывает своя специфика. Например, в ukwiki уважают шаблоны «nobot», и более трепетно, кажется, относятся к тому, чтобы описания правок были на родном языке. Описания правок сейчас "Мелогом" (скриптом-расстановщиком шаблонов) делаются только на английском языке, и не реализовано ничего типа Википедия:ConnectivityProjectInternationalization. Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Ну так это только должно нас подвигать не только разрабатывать инструменты, но и грамотно и увлекательно объяснять, в том числе и нулевым новичкам, для чего это нужно. Я правильно понимаю, что это обсуждение вызвано некоторым "кризисом жанра" в проекте? Так наши основные цели пока не достигнуты, дела навалом. Лишь бы эти дела были в радость. Хорошо, когда работает "Большая Зелёная Кнопка", но, боюсь завалы она не уберёт, только замаскирует. --Egor 22:41, 30 января 2012 (UTC)[ответить]
    Не совсем поняла, что имеется в виду под «кризисом жанра» и БЗК. Не хватает рук для ряда идей, и лично мне не вполне сейчас понятно текущее состояние, хочется выслушать новые идеи, чтобы понять, надо ли что-то менять и можно ли что-то менять в сторону большего развития. Львова Анастасия 11:42, 31 января 2012 (UTC)[ответить]
    Наверное, здесь две проблемы для обсуждения. Первая - как сделать чтобы сообщество постоянно видело проблему сирот и сегментации (простота и понятность описания проблемы и понятность работы с инструментарием). Возможно, на портале Вики сделать почётче часть "Нужно сделать", выделить постоянные наиболее важные проблемы, есть ведь и кроме сирот проблемы? Может, вообще на портале сократить эти маловразумительные списки до читаемого состояния, а конкретные проблемы вынести в подстраницы? Вторая - как работать в проекте Связности. Ещё раз попытаюсь - основная проблема в острой нехватке обобщающих статей, к которым можно было бы привязывать сирот, достойных остаться в википедии. Как описать алгоритм определения таких статей, пока не знаю. Возможно, через категорию сироты и заглавную статью в этой категории (если есть, а если нет - то включать в список "К созданию"? --Egor 21:55, 31 января 2012 (UTC)[ответить]
  • Сравнительную таблицу не нужно делать удобнее, она вполне читаема и понятна, если уж до неё дошёл любопытный нос :-) Красивые персональные диаграммы же на основе таблицы можно делать и самому. У меня претензий к дизайну техинструментов нет. Ссылки на инструменты надо ставить везде, где только можно, и в википедии, и на тулсервере. Циклы категорий одна из трудно определяемых на местности задач (помнится, как развязывали цикл с морями Израиля :-)). К показанному инструменту хотелось бы увидеть пояснение, я с первого раза не понял как это работает и как применять.
    Вопрос «где» имелся в виду вида «на такой-то страничке сайта вот в этом-то углу мы ставим ссылку на дружественный инструмент с таким-то пояснением». Красивые персональные диаграммы же на основе таблицы можно делать и самому — то есть страница pie charts не нужна?.. Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Ну что я буду девушку учить, где бантик навесить :-). А диаграмм указанных, я, честно, не нашёл... :-(. Только графики. Можно прямую ссылку, о чём речь? --Egor 22:41, 30 января 2012 (UTC)[ответить]
    Насколько я понял, речь идет об этих «пирогах». Как по мне, работать с графиками можно только для top-10 вики, остальные становятся настолько маленькими, что понять в них что-то трудно. Наличие на одной странице всех "пирогов" тоже сомнительно. Да и сами графики как-то мало информативны. Ну всего-то 3 показателя... Таблица намного полезнее. Если графики оставлять, то лучше их строить динамически, по кнопке, добавив в таблицу чекбоксы "сравнить" (или как-то так...) Сколько пользователь отметил строк, столько графиков и получил. Будет сравнивать то, что захочет сравнить. А в самой таблице я предлагаю, во-первых, локализовать "шапку", во-вторых, каждый заголовок колонки сделать ссылкой на описание соответствующего показателя. Хотя бы в виде тултипа. Рост/уменьшение соответствующего показателя можно подкрашивать красным/зеленым (текст или фон) - будет сразу наглядно видна тенденция улучшения/ухудшения. Dimich 10:20, 31 января 2012 (UTC)[ответить]
    Что такое тултип?.. Львова Анастасия 11:42, 31 января 2012 (UTC)[ответить]
    Желтенькое всплывающее окошечко с подсказкой, появляющееся при наведении курсора мыши на элементы html-разметки с атрибутами alt (например у изображений) или title. Dimich 12:01, 31 января 2012 (UTC)[ответить]
  • Нужны, насколько понимаю, переводы текстов на другие языки, которых пока нет в таблице? Тут помочь не могу.
    Даже знакомствами? :) Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Ну алтайские языки даже вики своей не имеют :-). --Egor 22:41, 30 января 2012 (UTC)[ответить]
  • Статистикой я пользуюсь, когда были завалы, это был один из самых полезных инструментов. Что касается автоформирования категорий и тем более текстов-пояснений, то это кажется излишеством. Количество и качество категорий вроде выбрали исходя из глубины кластеров и сиротства, они же временно опустевшие не удаляются по мере работы с ними? А текст надо написать один с толкованием цифровых обозначений сирот и кластеров. Или оставить в каждой категории свой. При решении каких-то расширений (наверное, о них и речь, о кластерах в несколько десятков статей?) нужны не категории и описания (зачем плодить сущности?), а структурированные рабочие списки для желающих по запросу. Заставлять же тулсервер лопатить википедию необходимости пока не вижу.
  • В целом - проект очень важный и полезный, я всеми силами и возможностями всегда его поддерживал, поддерживаю и надеюсь продолжать. Вероятно, нужно обсуждать и финансово-организационное участие Фонда и НП ВМ-РУ в такой важной работе. --Egor 18:30, 30 января 2012 (UTC)[ответить]
    Признаться, это обсуждение во многом на это ориентировано. Надо понять, сможем ли мы изыскать своих новых программистов, и есть ли задачи, касающиеся не исключительно наличия команды программистов. Львова Анастасия 19:16, 30 января 2012 (UTC)[ответить]
    Тут очень важно сформулировать сначала "мечту", что же мы хотим от технической реализации, и кто это "мы". Для кого будут инструменты и цели их работы. Если это действительно главное, то и нужно собрать в удобной форме "что хотелось", "что было", "что есть" и "чего хочется". Я так полагаю, что глубина на первый десяток анализа сирот и кластеров мала, по-хорошему, нужно изредка шерстить всю вики на предмет сегментации. Также по-прежнему полагаю, что проект выявил излишнюю высоту дерева категорий, его нужно подсекать, а для этого нужен внятный анализ длинных цепочек. Видимо, нужно начинать писать вариант проекта создания инструментария. --Egor 22:41, 30 января 2012 (UTC)[ответить]
    Сейчас по умолчанию проверяется кластер 20, считается, что обычно бо́льшие кластеры находятся редко. Есть возможность шерстить всю Википедию, Голем это умеет, но это требует сейчас таких ресурсов, которые тулсервер искуственно не даёт. А можно услышать идеи — кому и что хочется, о каком инструментарии речь? Я могу составить схему вопросов, на которые нужны ответы, но мне интересны именно мнения, как можно ответить на эти вопросы :) Львова Анастасия 11:42, 31 января 2012 (UTC)[ответить]
    Предлагаю помощь в качестве программиста. Могу предложить большой практический опыт разработки веб-приложений (C#, php, javascript, sql, html). Готов общаться по e-mail, через страницу обсуждения. "Список добрых дел" проекта сейчас выглядит как меморандум намерений, поэтому нужна детализация заданий, обсуждение и общение. Dimich 10:20, 31 января 2012 (UTC)[ответить]
    Ура! :) Сейчас обращу внимание Машиаха. Львова Анастасия 11:42, 31 января 2012 (UTC)[ответить]
    Ну, раз пошла такая пьянка, предстоит углубление в то, как и что работает. Я бы предложил делать это медленно и постепенно, получая удовольствие от решённых небольших задач на этом пути. Наиболее актуальной задачей мне представляется локализация описаний правок и (затем) локализация всех правок в мелоге, т.е. замещение скриптов на perl. Локализация описаний правок даёт нам возможность, наконец, заняться автоматизацией правок в uk и pl. В контексте описаний правок главная задача - дать участникам википедии возможность задавать текст описания правок через википедию, а не через svn. К сожалению, подстановка шаблона в поле описания изменений не работает, а так бы хотелось... Таким образом, главная задача - продумать, где и как должны задаваться описания правок, на какой странице вики. При этом нужно думать о том, чтобы это было удобно как пользователям, так и скриптам (имя страницы должно быть легко вычислимым, например, подстраница Википедия:ConnectivityProjectInternationalization). В будущем можно было бы также локализовывать и сам сайт связности. Что касается общения, мой email в меню "письмо участнику". Mashiah 12:48, 31 января 2012 (UTC)[ответить]
    Нужно учитывать, что дерево категорий строится не по кратчайшим путям. Не факт, что категория с самого низа ёлки не связана с категорией "Всё" прямым включением. Всилу особенностей алгоритма анализа графа, мы на каждом слое находим те кластеры, до которых других более коротких путей не существует. Mashiah 12:53, 31 января 2012 (UTC)[ответить]

Мнение участницы Хомелка

[править код]

Попробую высказать своё мнение, по пунктам. Во-первых, про то, что уже хорошо. Таблица сравнения разделов, на мой взгляд, прекрасна, в ней есть всё, что необходимо. Разные статистики по авторам, категориям, etc. это тоже всё достаточно удобно и мною активно используется.

Теперь про то, что требует допила. Сравнение «в пирогах» — это может, и симпатично, но для маленьких разделов в нынешнем виде абсолютно не удобно, особенно для бевики, потому что доля изолированных у нас очень мала и в существующем масштабе увидеть там ничего не получится при всём желании.

И, наконец, про помощь. Что касается шаблона {{disambig}} в разных разделах. Я прошла по всем интервикам в рувичном шаблоне и сделала штук 25 перенаправлений по ощущением, засада у меня вышла только с арабским и немецким разделами (что-то там технически у меня не выходит, увы). Если бы увидеть где-то список Википедий, где нужно создать перенаправление, то я готова ещё помочь. По поводу скрипта подсветки неоднозначностей, скажу только за бевики. Мои попытки установить его хотя бы гаджетом не удались, поэтому буду очень благодарна, если кто-то подскажет мне, в чём ошибка. Вот эта страница выглядит симпатично, но очевидно, что при увеличении количества переводов, она слишком расползётся. Будет разумно, если столбцы и строки прямо сейчас поменяют местами. Ну и как бонус, сделала перевод на белорусский язык, выслала только что почтой.--Хомелка  :) / обс 10:57, 31 января 2012 (UTC)[ответить]

Виновата. Вот список Википедий, в которых нужна помощь: new:, bug:, glk:, se:, bo:, ps:, csb:, ug:, koi:, pi:, lad:, cbk-zam:, hak:, so:, ky:, rw:, ace:, lbe:, gag:, ty:, srn:, xmf:, lo:, na:, tet:, sm:, bm:, bi:, ik:, iu:, pih:, ks:, pnt:, za:, chr:, got:, ee:, ha:, ti:, bxr:, om:, zu:, ve:, ts:, rn:, sg:, cr:, dz:, tum:, lg:, fj:, ch:, ny:, ff:, tn:, st:, xh:, chy:, ki:, tw: (подвал на сайте Связности).
За перевод спасибо! Сейчас займусь подключением :)
Надеюсь, про подключение скрипта кто-нибудь подскажет :( Сейчас привлеку внимание. Львова Анастасия 11:48, 31 января 2012 (UTC) upd. Обсуждение Википедии:Гаджеты/Выделение неоднозначностей#bewiki[ответить]
koi ушёл из списка недавно. Mashiah 13:25, 31 января 2012 (UTC)[ответить]
Кстати, теперь, если в вики нет шаблона вроде {{disambig}}, но есть категория для дизамбигов, можно просто проставить у этой категории интервику в en:Category:All disambiguation pages. Mashiah 13:26, 31 января 2012 (UTC)[ответить]
Нашёл кое-что для lbe: [1] Шаблона нет, но его употребляют. Mashiah 14:05, 31 января 2012 (UTC)[ответить]
+ ky: [2]. Mashiah 14:42, 31 января 2012 (UTC)[ответить]
+ rw: rw:Special:WhatLinksHere/Template:Disambig Mashiah 14:50, 31 января 2012 (UTC)[ответить]
+ na: na:Special:WhatLinksHere/Template:Disambig Mashiah 15:07, 31 января 2012 (UTC)[ответить]
+ ha ha:Special:WhatLinksHere/Template:Disambig Mashiah 15:31, 31 января 2012 (UTC)[ответить]
hak, new, ps, za; в остальных такого нет. Львова Анастасия 15:55, 31 января 2012 (UTC)[ответить]
Почему-то в списке не было az и nv, создала и там, на всякий случай :)--Хомелка  :) / обс 21:44, 31 января 2012 (UTC)[ответить]
Попробовала поменять столбцы и строки местами в таблице — она расползлась уже сейчас. Увы. Львова Анастасия 13:46, 31 января 2012 (UTC)[ответить]

Предложение

[править код]

Может ли бот выставлять на отдельную страничку списки новых сирот, т.е. статей, определённых им как сирота при каждом новом прохождении. Желательно, чтобы эти статьи находились бы в отдельном списке хотя бы неделю. На тулсеревере есть категория по дате создания, но она начинается с самых старых статей и добраться до свежих сирот практически невозможно. Учитывая, что значительная часть новых сирот появляется при переименовании статей и создании на старом месте неоднозначностей, данная мера позволит хотя бы остановить (или сильно замедлить) появление новых страниц сирот. Т.е., можно было бы заходить на эту страничку время от времени и разгребать новых сирот, созданных из-за лени участников, переименовавших статьи, но не переставивших на них ссылки. И можно будет спокойно разбираться с древними завалами--Фидель22 16:14, 22 февраля 2012 (UTC)[ответить]

Поскольку бот сам нуждается в этих данных для простановки и снятия шаблонов, он их собирает, и они доступны по ссылке. В архиве много всего интересного. Mashiah 21:02, 24 февраля 2012 (UTC)[ответить]
у меня по ссылки какая-то абракадабра...--Фидель22 22:06, 24 февраля 2012 (UTC)[ответить]
В настоящий момент система не работает из-за поломки тулсервера. --Rave 22:15, 24 февраля 2012 (UTC)[ответить]
Рейв, не путай неработающую базу с работающим хостингом, когда отвечаешь :) Львова Анастасия 09:13, 25 февраля 2012 (UTC)[ответить]
Там архив в формате 7z, если его распаковать, то можно найти все данные по изменениям на текущий день (точнее, на тот день, в который работал тулсервер в последний раз). Если открывается как текст, то сохраните его к себе на компьютер как файл с расширением 7z.
Правда, это не совсем то, о чём Вы просите. Машиах, может, сделаешь ссылку на «последнюю страницу» при сортировке по дате на сайте? Львова Анастасия 09:13, 25 февраля 2012 (UTC)[ответить]
Спасибо. Я открыл. В архиве 14 файлов - непонятно который из них содержит свежих сирот. Ссылка на последнюю страницу при сортировке по дате действительно была бы удобнее.--Фидель22 16:53, 26 февраля 2012 (UTC)[ответить]
Да, это можно. Сделаю, как только решу проблему с ноутом. Mashiah 17:17, 26 февраля 2012 (UTC)[ответить]
Нужно только учитывать, что эти два списка не есть одно и то же. Один упорядочивает по дате создания, другой даётся в момент превращения в изолированные. Mashiah 20:09, 26 февраля 2012 (UTC)[ответить]
deset — список новых тупиковых, derem — «больше не тупиковые», orem — больше не изолированные, ncaset и ncarem — (не)категоризованные, а все _1, _1_1 и так далее — как раз новые изолированные. Но в общем да, сложно. Львова Анастасия 17:44, 26 февраля 2012 (UTC)[ответить]
  • хотел после прохождения бота почистить новых сирот, но архив не обновился. Что делать?--Фидель22 22:42, 2 марта 2012 (UTC)[ответить]
  • Коллеги, мне кажется очень неудобным: сперва качать архив, после его открыть и обнаружить 13 текстовых файлов. Нужно иметь решимость, чтобы копировать руками все эти названия. Быть может, возможно сделать одну wiki-страницу? --Gruznov 20:48, 15 мая 2012 (UTC)[ответить]
    Идея хороша, но позвольте поинтересоваться: а в чём сакральный смысл работы именно с новыми статьями-сиротами? По опыту работы проекта они-то как раз сами более-менее рассасываются, и двадцатитысячный корпус статей-сирот имеет более-менее постоянное ядро тысяч так на 15-18. Вот его-то по-хорошему и надо разгребать-разгрызать, но там каждый случай зачерствел и твёрд как научный гранит. --Rave 21:16, 15 мая 2012 (UTC)[ответить]
    По состоянию на 7 февраля 2013 года, больше 1000 статей было создано за последние 38 дней. За некоторые года меньше. Страница со «свежими» сиротами будет полезна и тем, что в нее будет попадать много статей с вопросами по значимости, на которые никто не ссылается--FireWire 19:46, 7 февраля 2013 (UTC)[ответить]

Что случилось с мускулом?

[править код]

Работаю над своими статьями в сторону улучшения по инструменту создатели изолированных статей, однако что-то он в последние дни завис. Что за баг с базой данных? 102RB 19:58, 24 февраля 2012 (UTC)[ответить]

Тулсервер крайне нестабилен в последнее время. Mashiah 20:59, 24 февраля 2012 (UTC)[ответить]

Вопрос про "транзитивность"

[править код]

Коллеги,

подскажите, пожалуйста: вот у меня категория Фармация находится в кат. Медицина. А Фармакология — и в Медицине, и в Фармации. Это допустимо, или надо убрать? Хотелось бы оставить именно так, но я не учил теорию множеств и нахожусь в некоторой растерянности. Akim Dubrow 23:08, 3 марта 2012 (UTC)[ответить]

Мне не очень нравится, когда включают в категорию и в её подкатегорию - это лишь личное мнение. Что касается теории множеств, она здесь не применима. Это теория категорий. В качестве примера, если некая статья относится к категории "Изолированные статьи", а эта категория относится к категории "Специальные категории", то эта статья, конечно же, специальной категорией не является. Mashiah 20:39, 5 марта 2012 (UTC)[ответить]
Честно говоря, в кат. Фармация (да и в Психиатрия) сейчас такой бардак, что это незначительное сознательное отступления от иерархичности — сущий пустяк. =) Спасибо разъяснение, а то я недавно недоглядел, и устроил закольцовку категорий, с тех пор отношусь с большой опаской к их категоризации. Со статьями-то несколько проще. Akim Dubrow 21:28, 5 марта 2012 (UTC)[ответить]

Саботаж инструментов проекта?

[править код]

Обращаю внимание участников проекта на появление массовых правок такого типа: [3], [4], [5]. То есть выведение статей из категории тупиковых путём викификации единственного слова. — Ivan A. Krestinin 21:32, 21 мая 2012 (UTC)[ответить]

Ничего криминального тут нет. Шаблоны {{тупиковая статья}} и {{rq|wikify}} несут всё-таки разные функции. От таких правок статьи действительно перестают быть тупиковыми, и это хорошо. --Rave 21:57, 21 мая 2012 (UTC)[ответить]

Как правильно связывать статьи?

[править код]

Добрый день! На моей странице обсуждения возник спор о том, как (не) следует связывать статьи. Не могли бы вы разъяснить, как в данной ситуации будет лучше для проекта. Спасибо--Alexandronikos 05:54, 16 октября 2012 (UTC)[ответить]

Отвечу у Вас. Львова Анастасия 07:38, 16 октября 2012 (UTC)[ответить]

Проект:Связность и Google

[править код]

Выдержка из почтовой рассылки "wiki-research-l":

On Thursday, October 25, 2012, Piotr Konieczny wrote:

So it is no surprise when Wikipedia article comes up high in google ranking (моё выделение А.К.). But occasionally a Wikipedia article will NOT be highly ranked, and will appear only in google 20-30+ or even further down the line . Any idea what makes Google dislike certain Wikipedia articles?

There are a bunch of factors. Two that would presumably play a role: Better linking for other topics than the Wikipedia article, the amount of people clicking on the Wikipedia article when it appears in search results, and the content found on the page. Example: Stubs have less content, are less likely to be clicked on and are not likely to be linked to. All bad conditions for optimal SEO. Sincerely, Laura Hale

Вероятно, действительно так: улучшение связности отдельно взятой статьи повышает её позицию в результатах поисковых систем, основанных на PageRank или аналогичных алгоритмах. Экспериментально это не проверялось, но похоже на правду. :) -- Andrew Krizhanovsky 06:52, 25 октября 2012 (UTC)[ответить]

Если я правильно помню, это было в моём докладе полякам в 2010 году ;) Это всё в рамках подготовки к рассказу студентам найдено? Львова Анастасия 07:57, 25 октября 2012 (UTC)[ответить]
Скорее, это тема в голове после рассказа крутится и сам собой дополнительный материал подбирается... :) -- Andrew Krizhanovsky 08:11, 25 октября 2012 (UTC)[ответить]
Ой, очень интересны подробности — что это были за студенты, что это было за занятие да как восприняли. Львова Анастасия 08:23, 25 октября 2012 (UTC)[ответить]
Студенты 5-го курса ПетрГУ, предмет называется "Интернет-математика", а рассказываю я там про то, что мне интересно, в основном темы из вычислительной лингвистики. Вопросов, к сожалению не было... :( Cтуденты мои ещё начинающие википедисты. Вот темы (на выбор) для написания статьи в течение семестра: Участник:AKA MBG/Todo2012. Пока что особо хвастаться нечем, по-видимому, большая активность будет к зачётной неделе. :) -- Andrew Krizhanovsky 11:47, 25 октября 2012 (UTC)[ответить]
Здорово! На всякий случай, если это не попадалось на глаза ранее: http://outreach.wikimedia.org/wiki/Education_Portal Львова Анастасия 11:53, 25 октября 2012 (UTC)[ответить]
Спасибо! Когда что-то напишем, то отмечусь там. -- Andrew Krizhanovsky 12:04, 25 октября 2012 (UTC)[ответить]

Застрял почему-то в сиротах, хотя уже год как ссылка на него имеется. Что-то заржавело в боте? WBR, BattlePeasant 13:24, 21 февраля 2013 (UTC)[ответить]

Если изволите искать ржавчину, то по всем признакам заржавели тулсервер и его админы. Львова Анастасия 04:07, 31 мая 2013 (UTC)[ответить]
Спасибо, примерно понял ситуацию. Странно конечно, как такие перманентные рассинхронизации с основной БД возможны. WBR, BattlePeasant 14:56, 31 мая 2013 (UTC)[ответить]

См. ЛС и сегодня на ВП:ВУ. Что/кто это? Retired electrician (talk) 17:34, 17 июля 2013 (UTC)[ответить]

Очевидно, чей-то виртуал для разделения вклада. --Rave 20:22, 17 июля 2013 (UTC)[ответить]

Тулсервер

[править код]

Инструмент на тулсервере, позволяющий участникам найти их изолированные статьи, не работает, не перенаправляет и ссылки не даёт.--Arbnos 23:46, 28 января 2014 (UTC)[ответить]

Да, проблема известна. Она связана с общим вымиранием тулсервера и переездом на Wikimedia Labs. --Rave 10:51, 29 января 2014 (UTC)[ответить]
А кто хозяин? --Akim Dubrow 11:08, 29 января 2014 (UTC)[ответить]

Чей-то робот работает?

[править код]

Здравствуйте. В укВП работала РобоСтася, но она с нового года не ходит. Если возможность у кого-то запускать туда своего робота, который в руВП работает по связности? Yakiv Glück 02:04, 10 марта 2014 (UTC)[ответить]

Вики-Данные

[править код]

Обсуждение:Золото (значения): Все ссылки на других языках ведут на статьи о дизъюнкции. Nikitadanilov 14:14, 15 октября 2014 (UTC)

подтверждаю Золото (значения) имеет интервики en:Or (Idot 05:46, 18 октября 2014 (UTC))[ответить]

Обсуждение проекта:Адмиралтейство#Проблема с интервиками

На данный момент Корабль определяется в статье в трёх вариантах (в т.ч. невооружённые суда), при этом имеет интервики на en:Warship.

Судно определяется как любое плавсредство от водного велосипеда до танкера, но имеет интервики на en:Ship, который строго ограничен крупными судами (никаких en:boats!). en:Boat, в свою очередь, совсем не Лодка, и в английской терминологии определяется простым способом: судно, способное находиться на другом судне - boat, неспособное - ship.

За бортом остались en:Watercraft (нет русской интервики) и плавсредство (нет интервик).

Надо что-то делать, ВП:СЛОМАНО. --Igel B TyMaHe (обс) 19:58, 18 сентября 2014 (UTC

то есть проблема с inter-wiki на wiki-data повесместна (Idot 05:46, 18 октября 2014 (UTC))[ответить]

Не пашет connectivity на labs

[править код]

По ссылке в верхнем углу статьи Сангтуда_—_Пули-Хумри_(ЛЭП) вижу ошибку "No webservice". Ignatus 21:29, 3 января 2015 (UTC)[ответить]

Малоактивный?

[править код]

@Ping08: приветствую, а почему малоактивный? Я например, не прекращал работу в рамках данного проекта по улучшению связности Википедии. — Ivan A. Krestinin 16:24, 29 августа 2015 (UTC)[ответить]

@Ivan A. Krestinin: Очень мало кто над ним работает, обсуждение неактивное, Задача недели, последний раз обновлялась 9 января 2014‎, Автору изолированных статей Изолированная подсказка, Связность дерева категорий и т.д. Не работают инструменты. Что-то я не увидел никаких признаков активности проекта --Ping08 обс 16:33, 29 августа 2015 (UTC)[ответить]
Голем и связанные с ним странички (например, Задача недели) к сожалению умер вместе с тулсервером, я к сожалению в этой части проекта разбираюсь мало, хотя надо будет попробовать всё-таки разобраться. Однако даже и без этой части мой бот исправно выполняет задачи связанные с этим проектом и активность у него немаленькая. Потому по-моему рановато объявлять проект малоактивным. — Ivan A. Krestinin 17:04, 29 августа 2015 (UTC)[ответить]
@Ivan A. Krestinin: Снимать шаблон об неактивности проекта? А кто-нибудь еще коме вас сейчас работает в рамках данного проекта? --Ping08 обс 17:40, 29 августа 2015 (UTC)[ответить]
Снимите лучше. Работает ли ещё кто-нибудь прямо сейчас — не знаю. Сейчас вообще лето, в ВП в принципе затишье, если не считать инициатив некоторых госструктур. — Ivan A. Krestinin 18:25, 29 августа 2015 (UTC)[ответить]
@Ivan A. Krestinin: Похоже, что только вы работаете в рамках данного проекта, потому что никто не написал кроме вас в обсуждение проекта, по поводу установки шаблона «Этот проект неактивен». Возможно что сюда никто кроме вас не заходит. Лето уже заканчивается, послезавтра уже осень. --Ping08 обс 21:33, 29 августа 2015 (UTC)[ответить]

Автоматическая девикификация удалённых статей

[править код]

Начала работать. См. шаблон:Девикифицировать вхождения. В текущем виде — весьма вредная с точки зрения связности штука. Начал Обсуждение шаблона:Девикифицировать вхождения#Нужность девикификации, прошу высказаться заинтересованных. --be-nt-all (обс) 06:29, 10 сентября 2016 (UTC)[ответить]

Древо категорий по канцелярским товарам

[править код]

Я создал категорию «Производители письменных принадлежностей», но не совсем понимаю, как правильно присвоить категории производителям канцелярских товаров. Если компания, кроме перьевых ручек, производит другие письменные принадлежности, нужно ли её включать также и в категорию «Производители письменных принадлежностей» (материнская категория для категории «Производители перьевых ручек»)? Нужно ли компанию из категории «Производители письменных принадлежностей» включать также и в категорию «Производители канцелярских товаров» (материнская категория для категории «Производители письменных принадлежностей»)? --Pavlovskteam (обс.) 04:28, 5 апреля 2019 (UTC)[ответить]

Циклы в дереве категорий на август 2020

[править код]

Здравствуйте. Участник Adamant.pwn проанализировал дерево категорий рувики и обнаружил следующие циклы категорий:

Приглашаю к работе. Для визуализации удобно использовать этот инструмент. Просто допишите в адресной строке браузера нужную категорию. — Rave (обс.) 08:07, 10 августа 2020 (UTC)[ответить]

Интервики-конфликт

[править код]

Эта русскоязычная для интервики-ссылок использует элемент https://www.wikidata.org/wiki/Q3434372#sitelinks-wikipedia из Wikidata, а вот англоязычная статья использует совсем другой: https://www.wikidata.org/wiki/Q17468049 В результате сделать в этой статье полный список ссылок на другие языки не представляется возможным. Полагаю, логичнее оставить тот, который в английской статье, а Q3434372 удалить. Не знаю, как это сделать. Кто знает, рассмотрите возможность исправить.

Внешние ссылки ведут не туда, куда должны

[править код]

Похоже, тот сервер, на который ведут почти все внешние ссылки этой статьи, был перемещён. А редирект поставили без напряжения сил — просто на одну и ту же новую страницу. Кто в теме этих ссылок, прошу перепроверить и по возможности поправить. Nikolay Komarov (обс.) 18:10, 28 августа 2020 (UTC)[ответить]

В основном это касается инструментария проекта. К сожалению, описанная вами проблема — следствие смерти Тулсервера и основных инструментов проекта вместе с ним. Сейчас ведутся работы по созданию новых инструментов, Ссылки пока оставлены в надежде на мизерный шанс починки предыдущего арсенала. Если есть конкретные вопросы по работе проекта — можете задавать, например, здесь. — Rave (обс.) 09:57, 29 августа 2020 (UTC)[ответить]
@Rave: у инструментов был закрытый исходный код? — Vort (обс.) 10:03, 29 августа 2020 (UTC)[ответить]
У инструментов открытый исходный код. Но количество владеющих соответствующими языками программистов, готовых заняться запуском существующего кода на новом хостинге, в данный момент равно нулю. — Rave (обс.) 10:41, 29 августа 2020 (UTC)[ответить]
Языки обычно похожи. Ну кроме ассемблера, руби, раста, лиспа. Остальное более-менее одно и то же. Хостинг же стоит брать всё тот же — Toolforge. Проблема разве что может быть в том, что за время неактивности разработчиков (или мейнтейнеров) мог сильно поменяться API Mediawiki и инструмент придётся дописывать. Там один большой кусок кода или разбитый на части по функциям? Можно ли попробовать завести часть? Я могу глянуть на состояние кода и написать сюда свою оценку его состояния. Но сроков никаких дать не могу. Можете дать ссылку на код, который надо бы запустить? Чтобы у меня была отправная точка. — Vort (обс.) 11:17, 29 августа 2020 (UTC)[ответить]
Исходники здесь. Диалог разработчиков есть тут. Если вкратце, то одна часть кода (Голем) анализирует дамп Википедии, отыскивая изолированные и прочие целевые статьи, а другая часть кода (Мелог) — это бот, который берёт те первичные результаты работы и согласно им идёт по списку статей Википедии, устанавливая/снимая шаблоны. — Rave (обс.) 14:44, 29 августа 2020 (UTC)[ответить]
Ухх, мешанина из sh, php, sql, c#, perl. Может, ещё что-то пропустил. Теперь понятно, почему было мало желающих в это вникать. Ну я попробую завести. Начну с Голема. Трогать шаблоны кодом десятилетней давности пока что не стоит. — Vort (обс.) 15:19, 29 августа 2020 (UTC)[ответить]
Как я понял, работа Голема основана на трёх базах данных: собственной, википедийной и тулсерверной. Собственную он сам создаёт, сам пользуется, вроде тут проблем быть не должно. Википедийную, теоретически, можно собрать из дампов. Но формат базы с момента последних запусков Голема мог поменяться. Самая большая проблема с третьей, тулсерверной, базой. Её нет. Вполне может быть, что у Тулфорджа есть аналогичная база и после адаптации её может будет подключить к Голему. Если же нет, то базу надо формировать вручную. Вроде бы, там никаких особо уникальных данных не было, так что можно даже попробовать забить её произвольными данными. Но главный вывод таков: без модификаций Голема не запустить. Я буду ещё смотреть, что с ним можно сделать. Попробую наполнить основную базу из дампа, поставить заглушки на тулсерверную, но что из этого получится — не знаю. — Vort (обс.) 21:15, 29 августа 2020 (UTC)[ответить]
@Rave: удалось запустить основную часть функций Голема на примере базы be_x_old: [6] [7] [8]. Для этого пришлось создавать с нуля таблицы language, namespacename и wiki базы toolserver, а также исправлять и адаптировать SQL код для поддержки MySQL 8й версии. Я хотел бы выложить на GitHub те модификации, которые я сделал в коде, но у меня не получается скачать репозиторий по той ссылке, которую рекомендует Gerrit. Может ли кто-нибудь скачать и переслать мне архив с git репозиторием connectivity? — Vort (обс.) 15:04, 31 августа 2020 (UTC)[ответить]

Тупиковые статьи

[править код]

Здравствуйте. А кто сможет реанимировать актуализацию информации в категории тупиковые статьи и статистику связности? Oleg3280 (обс.) 14:58, 29 августа 2020 (UTC)[ответить]

Здравствуйте. Если восстановится работа инструментов, упомянутых в предыдущей теме, то все эти вопросы решатся автоматически. — Rave (обс.) 15:56, 29 августа 2020 (UTC)[ответить]
Спасибо. Oleg3280 (обс.) 15:59, 29 августа 2020 (UTC)[ответить]

Фактически изолированные статьи

[править код]

Обнаружил, что ряд плохо связанных статей не отслеживается:

  1. Статья-сирота Чары гипотезы Пуанкаре ни в одной из версий не содержит пометки об изолированности. Единственная ссылка на неё шла из несвободного изображения, которое в ней же используется. Это касается вообще изображений из Википедии, которые "связывают" статьи, или проcто здесь бот не сработал? всё в порядке, не увидел
  2. Статьи, которые связаны ссылками через навигационные и прочие шаблоны, в том числе примечания, подписи на картах, схемах, под изображениями и т.д. Те же навигационные шаблоны и шаблоны вроде {{Wikidata/Ancestors}} в мобильной версии не видны (и в десктопе часто свёрнуты) и по факту статья может быть изолирована у львиной доли читателей.

Proeksad (обс.) 16:44, 29 августа 2022 (UTC)[ответить]

С другой стороны навигационный шаблон — это ведь как ссылки из какого-нибудь раздела вроде «см. также» или чего-нибудь подобного. То есть такие статьи действительно не такие уж изолированные) Maryanna Nesina (mar) (обс.) 17:12, 29 августа 2022 (UTC)[ответить]
  • При этом раздел См.также виден в мобильной версии, которой пользуются более половины читателей. То есть на ru.wikipedia.org статья связана шаблоном, а на ru.m.wikipedia.org может ещё нет. Proeksad (обс.) 17:23, 29 августа 2022 (UTC)[ответить]
  • К тому же, если шаблон свёрнутый или не свёрнутый, но очень громоздкий, то (с точки зрения перехода из статьи в статью) его ценность ниже даже в десктопе. Proeksad (обс.) 17:33, 29 августа 2022 (UTC)[ответить]

Статистика

[править код]

сверх 26.000 - было к 16.06.2022

около 25.000 - около 16.08.2022

менее 25.000 - 02.09.2022 Лиманцев (обс.) 15:52, 2 сентября 2022 (UTC)[ответить]

пересечения

[править код]

https://petscan.wmflabs.org/?psid=23514609 Участники Великой Отечественной войны — 765 на 20.12.2022, 741 на 21.02.2023, 733 на 03.04.2023, 723 на 28.07.2023, 719 на 19.11.2023, 714 на 17.02.2024, 699 на 31.03.2024, 661 на 03.04.2024, 584 на 22.04.2024, 565 на 03.05.2024 на 03.05.2024

https://petscan.wmflabs.org/?psid=22585275 Участники Олимпийских игр‎ — 240 на 20.12.2022, 271 на 21.02.2023, 281 на 03.04.2023, 347 на 28.07.2023, 385 на 19.11.2023, 431 на 17.02.2024, 461 на 31.03.2024, 458 на 22.04.2024, 460 на 03.05.2024

https://petscan.wmflabs.org/?psid=23087542 Русские писатели 1800—1917, очищена 28.07.2023. Ранее 13 на 21.02.2023 и на 03.04.2023

https://petscan.wmflabs.org/?psid=23446773 Лауреаты (есть и нобелиаты, например Саагян, Дорк) — 546 на 20.12.2022, 570 на 21.02.2023, 565 на 03.04.2023, 544 на 28.07.2023, 536 на 19.11.2023, 560 на 17.02.2024, 562 на 31.03.2024, 557 на 31.03.2024, 557 на 22.04.2024, 555 на 03.05.2024

https://petscan.wmflabs.org/?psid=23514606 Химические вещества 477 на 20.12.2022, 396 на 21.02.2023, 359 на 03.04.2023, 327 на 28.07.2023, 322 на 19.11.2023, 305 на 17.02.2024, 303 на 31.03.2024, 300 на 22.04.2024, 303 на 03.05.2024

https://petscan.wmflabs.org/?psid=23514590 Футболисты 743 на 20.12.2022, 801 на 21.02.2023, 843 на 03.04.2023, 846 на 28.07.2023, 907 на 19.11.2023, 982 на 17.02.2024, 978 на 31.03.2024, 974 на 31.03.2024, 979 на 22.04.2024, 985 на 03.05.2024 Лиманцев (обс.) 18:47, 20 декабря 2022 (UTC)[ответить]

статистика

[править код]

Старейшие изоляты - 2010 года https://petscan.wmflabs.org/?psid=23531385&interface_language=ru Лиманцев (обс.) 14:23, 23 декабря 2022 (UTC)[ответить]

Почему не пришёл бот

[править код]

In Light-Years There's No Hurry, есть ссылки только из редиректа и файла Proeksad (обс.) 13:30, 15 августа 2023 (UTC)[ответить]