Википедия:Форум/Викиданные

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Актуально
Обсуждения правил
Опросы
Выборы, присвоение и снятие флагов
Заявки на флаг ПИ
Заявки на флаг бота
  • DimaBot(+) флаг присвоен
Снятие флагов
Список изменений в правилах
Работа для участников: Викиданные
Обновить

Кисида, Фумио[править код]

Перенесено со страницы ВП:СО#Кисида, Фумио. Гдеёж?-здесь 18:13, 29 ноября 2021 (UTC)

В карточке в графе "мать" (да и в "отец" тоже) что-то непонятное.

Автор сообщения: 188.170.77.137 16:10, 29 ноября 2021 (UTC)

    • Да, что-то глаз замылился. Чисто механически решил, что всё тянется оттуда. — Гдеёж?-здесь 20:18, 29 ноября 2021 (UTC)

Итог[править код]

  • Ошибочный запрос. Сейчас наведу порядок. — Гдеёж?-здесь 20:18, 29 ноября 2021 (UTC)

Рабочая Марсельеза[править код]

Почему в карточке название задвоено? — Ghirla -трёп- 11:16, 28 ноября 2021 (UTC)

  • Это не Викиданные. Проблему можно решить очисткой параметра «название», но, мне кажется, при переводе шаблона на карточку что-то было напутано — это особенно заметно, когда название статьи нерусское (пример; или это нормально?). --188.65.244.97 11:56, 28 ноября 2021 (UTC)
  • Я так понимаю, что подтягивающееся с викиданных значение параметра |русское название= совпадает с прописанным в статье значением параметра |название=, а отображаются значения обоих параметров, поэтому название в карточке и выглядит задвоенным. — Jim_Hokins (обс.) 12:04, 28 ноября 2021 (UTC)
    • Нет-нет, не с Викиданных, а через PAGENAME. --188.65.244.97 12:09, 28 ноября 2021 (UTC)
      • Ок. Через PAGENAME. Спасибо, что уточнили. Всё равно задваивание происходит из-за наличия двух совпавших (по значению) параметров. — Jim_Hokins (обс.) 12:35, 28 ноября 2021 (UTC)
  • На мой взгляд, тут основная проблема с тем, что параметры названы не так, как это обычно делается. То есть название отвечает не за основной заголовок, а за оригинальное название. По-хорошему, надо бы переименовать и заменить во всех статьях ботом, если кто-нибудь возьмётся. — putnik 12:15, 28 ноября 2021 (UTC)
    • Это было бы полезно. — Ghirla -трёп- 13:09, 28 ноября 2021 (UTC)

Три писателя-фантаста[править код]

В викиданных есть три очень схожих элемента писатель-фантаст (Q108710753), писатель-фантаст (Q28225718) и писатель научной фантастики (Q18844224) (являющийся подклассами первых двух!). При этом по-английски разница в них более осязаемая (speculative fiction writer (Q108710753), science fiction author (Q28225718) и science fiction writer (Q18844224). Нашёл это я когда пытался понять, откуда отвязалось перенаправление писатель-фантаст и куда бы его надо вернуть. Категория ссылается на Q108710753, но при этом такая профессия указана всего у двух человек. Я, если честно, немного запутался, и думаю, что категория и перенаправление должны относиться к Q18844224, но какие должны быть у всех этих элементов понятные описания, не очень соображу. windewrix (обс.) 14:14, 23 ноября 2021 (UTC)

  • Никто не соображает. Fiction - это в смысле не публицистика, не документалистика, не исторически достоверные произведения. Обычно — "художественные произведения", но мне не очень понятен момент с исторически достоверной литературой, так как она вполне художественная в смысле искусства слова. Далее, автор — вроде бы проще: это не только писатель, но и музыкант, художник, фотограф и др. Соответственно на стыке fiction и author получаются "музыканты, художники, фотографы, создающие произведения о вымышленном" (если они это могут, что, например, не так просто для музыканта... или вообще единственное, что может создавать музыкант ;) ). С writer проще всего - это так и будет "писатель". Science fiction - научная фантастика (если не углубляться в национальные особенности жанра).
    Поэтому:
    d:Q108710753 — "писатель спекулятивной фантастики" либо "писатель спекулятивной литературы". И в России таких, по идее быть не может, в силу отсутствия теории.
    d:Q28225718 — "автор художественных произведений" (включает не только литературу, но и другие искусства)
    d:Q18844224 — "писатель-фантаст", Категория:Писатели-фантасты должна ссылаться сюда. Igel B TyMaHe (обс.) 15:40, 23 ноября 2021 (UTC)

Шаблон:FootballFacts[править код]

На викиданных есть возможность разместить ссылку для отображения в статье только на персоналию и на клуб (ниспадающее меню-окошко на «FootballFacts.ru player ID» и «FootballFacts.ru team ID»). На стадион — никак, или можно без выбора ниспадающего списка как-то сделать? https://footballfacts.ru/stadium/900-stadiongazovik в Газовик (стадион). - 5.250.170.7 12:51, 22 ноября 2021 (UTC)

  • Нужно подать заявку на создание нового свойства в Викиданных (раздел Библиотечные указатели/Authority control). — putnik 13:31, 22 ноября 2021 (UTC)

Сверлильные станки[править код]

d:Q2211295 vs. d:Q20820500 - ? Правильно ли я понимаю, что русское Сверлильно-расточная группа станков следует, как понятие собирательное, вынести в свой особый уголок, а всё прочее (просто сверлильные станки) смёржить вместе? Русская группа включает, в том числе, станки с горизонтальным шпинделем, которые исключаются, например, в de:Ständerbohrmaschine. Retired electrician (обс.) 04:55, 22 ноября 2021 (UTC)

Певческий голос[править код]

В процессе беседы про другое выяснилось, что у нас довольно много статей, куда с ВД подтягивается, даже при отсутствии соответствующей строчки в карточке, свойство "Певческий голос", помещающее статью в одну из подкатегории внутри категории Категория:Певцы и певицы по голосам. Проблема в том, что на Викиданных это свойство ставят кому ни попадя, а должно оно стоять только у академических вокалистов: поп-, рок- и т. д. певцам категория голоса не определяется. Отследить, кому из многих тысяч певцов сегодня притащат эту строчку в ВД, нет никакой возможности. Я убрал на ВД возможность выставлять тип голоса кому-либо, кроме певцов, но оставить возможность выставлять его только оперным певцам не могу, потому что бывают академические вокалисты, которые не поют в опере (а поют, скажем, только романсы), и для них на ВД нет отдельного класса. Что делать? По идее все исполнители академической музыки должны попадать в одну из подкатегорий Категория:Академические музыканты. Можно ли подавить вывод свойства "Певческий голос" (и в карточку, и в категории) для статей, не входящих в эту ветку дерева категорий? Или, вернее, сперва собрать список статей, в которые это свойство выводится и которые не входят в эту ветку, чтобы проверить, не надо ли какие-то из них в эту ветку включить? Андрей Романенко (обс.) 00:57, 22 ноября 2021 (UTC)

  • Правка на ВД довольно решительная, можно договориться в одном проекте признавать обладателями типов голосов только академистов (включая народников?), но по многим эстрадникам тип голоса проставляется на основе публикаций того же уровня, как источники всех остальных сведений в статьях. На основе каких более авторитетных источников Тони Брэкстон можно раз и навсегда запретить быть контральто и означить повсеместно распространённое расширительное толкование «маргинальным»?
Для технического решения раньше обсуждали создание отдельного шаблона: Обсуждение проекта:Музыка/Архив/2018#Шаблон:Музыкант-2188.123.231.25 aka .2 08:42, 22 ноября 2021 (UTC)
  • Запретить Брэкстон быть контральто, а Эминему - тенором можно по элементарным культурным различиям: если русскоязычные авторитетные в голосах источники не употребляют к их голосам данные термины, то иноязычные источники идут лесом. Igel B TyMaHe (обс.) 10:35, 23 ноября 2021 (UTC)
    • Всё то же ОРИСС, пока не показано по АИ, что tenore переводится на русский не (только) как «тенор I: тип голоса оперного певца, определяемый в зависимости от тесситуры», а (ещё и) как «перен. тенор II: тип голоса певца или актёра, пользующегося эстрадной манерой пения (постановкой голоса) либо не поющего, определяемый в зависимости либо от тесситуры, либо от особенностей тембровой окраски». — 188.123.231.25 14:34, 23 ноября 2021 (UTC)
  • Если в ру-вики под певческим голосом понимают исключительно de:Stimmfach, то использовать надо свойство d:Property:P1731, а не пытаться вводить искусственные ограничения на d:Property:P412 Ghuron (обс.) 16:11, 24 ноября 2021 (UTC)
    • Эстрадным певцам начнут заполнять именно Fach (причём неподходящими значениями), если шаблон-карточка останется универсальной. — 188.123.231.25 17:42, 24 ноября 2021 (UTC)
      • Я не понимаю вторую часть вашей фразы Ghuron (обс.) 19:24, 24 ноября 2021 (UTC)
        • Раньше обсуждали создание отдельной карточки для академических музыкантов (или только певцов), в ней было бы уместно и предложение с соседнего форума (возможно, в «многоэтажной» реализации, как с должностями у государственных деятелей), и послабление условий для отображения типа голоса. В свою очередь, для певцов с не-академической карточкой можно было бы, например, разрешить отображение «сопрано» с источником, но запретить неуместные значения «Fach». — 188.123.231.25 19:57, 24 ноября 2021 (UTC)
          • Неплохая идея, но это, очевидно, надо обсуждать не здесь Ghuron (обс.) 03:32, 25 ноября 2021 (UTC)

Ипполита Мария Сфорца[править код]

Ошибочная дата смерти 20 августа 1484 года импортирована из ен-вики. Можно её убрать оттуда или это слишком трудно? — Юлия 70 (обс.) 10:33, 19 ноября 2021 (UTC)

  • 1488-й год сделал рекомендуемым, а 1484-й - нерекомендуемым, а потом удалил. Если правку и отменят, то в статьях 1484 год не должен больше появляться. — redboston 11:40, 19 ноября 2021 (UTC)

Итог[править код]

В архив. Michgrig (talk to me) 14:22, 19 ноября 2021 (UTC)

Гродно (станция)[править код]

Только что исправил координаты в статье. Вижу в карточке трудночитаемые значения параметров в поле "Соседние о.п." Полез разбираться. Догадываюсь, что эти наименования идут с Викиданных. Но не пойму главного. В шаблоне-карточке {{Железнодорожная станция}} вообще отсутствует такой параметр! Как он появляется тогда в карточке? И как это исправить на нормально читаемые названия "Полесский Парк" и "Пригородный"? — 193.233.70.48 12:21, 15 ноября 2021 (UTC)

Для исправления надо было добавить русские метки: вот так. — Vort (обс.) 12:26, 15 ноября 2021 (UTC)
Хорошо, это понял. А что по поводу механизма отображения этой информации? В документации шаблона не указан параметр "Соседние о.п." И упс - одно наименование показано в виде красной ссылки, другое вообще без ссылки. — 193.233.70.48 12:37, 15 ноября 2021 (UTC)
Есть параметр Предыдущая, но я нигде не вижу его заполненным. Наверно, функции заполнения из Викиданных хватает. — Vort (обс.) 12:41, 15 ноября 2021 (UTC)
К элементам Викиданных не привязаны статьи рувики, поэтому нет нормальных ссылок. — Vort (обс.) 12:42, 15 ноября 2021 (UTC)
  • Я, честно говоря, тоже задавался вопросом, почему, если нет связанной статьи в рувики, в одном случае показывается красная ссылка, а в другом вообще нет ссылки. Michgrig (talk to me) 22:11, 15 ноября 2021 (UTC)
    • Как и для текста ссылки, для названия несуществующей статьи, на которую она будет вести, используется метка элемента Викиданных. Но так как она не уникальна, то уже может существовать другая статья с такой же меткой. Чтобы не делать некорректную ссылку, в таком случае показывается просто текст. Если кто-то предложит вариант, как в таком случае генерировать уникальное название статьи, то можно попробовать добавить другую логику. — putnik 00:21, 16 ноября 2021 (UTC)
      • Ясно. Про такую логику я не подумал. Michgrig (talk to me) 07:01, 16 ноября 2021 (UTC)

Багси Мэлоун[править код]

Поправьте плз, чтобы ссылка из этой статьи вела не на Пол Уильямс, а на Уильямс, Пол (артист). — Igor Borisenko (обс.) 19:20, 12 ноября 2021 (UTC)

  • @Igor Borisenko, я сейчас в статье не вижу такой ссылки. Где именно она должна находиться? Michgrig (talk to me) 21:55, 12 ноября 2021 (UTC)
  • Страницу «ссылки сюда» стоит воспринимать исключительно как служебный инструмент. Проблема в том, что при проверки названия статьи через функцию {{#ifexist:…}}, проверяемая статья попадает в список ссылок. Ну а коду, который генерирует красные ссылки на статьи, приходится так делать, чтобы не сослаться случайно на какую-нибудь другую статью с таким же названием. — putnik 05:15, 15 ноября 2021 (UTC)

Устранение дублей элементов населённых пунктов Курганской области[править код]

В результате анализа списка Участник:Vort/PpCodes обнаружил кластер статей с дублированными элементами. Предлагаю заняться их слиянием. Для этого достаточно открыть Шаблон:Населённые пункты Далматовского района и прокликивать ссылки в поисках статей без интервик. Затем в uk:Шаблон:Далматовський район искать соответствующие статьи, открывать элементы и вызывать скрипт объединения. Чтобы не ошибиться, стоит сравнивать население (обычно стоит за 2010 год). Пример: Бабинова -> стоят интервики, идём дальше: Белое (Далматовский район) (67, 2010) -> d:Q108786525, uk:Біле (Далматовський район) (67, 2010) -> d:Q27578041, можно объединять (заодно в объединённом элементе можно убрать это : населённый пункт, так как там, скорее всего, будет стоять более точный тип). В других районах то же самое: Шаблон:Населённые пункты Звериноголовского района + uk:Шаблон:Звіриноголовський район, Шаблон:Населённые пункты Катайского района + uk:Шаблон:Катайський район, Шаблон:Населённые пункты Кетовского района + uk:Шаблон:Кетовський район. Некоторые из районов я уже пообъединял, с некоторыми до меня кто-то справился. Так что если во многих статьях района есть интервики, стоит переходить к следующему. — Vort (обс.) 11:19, 7 ноября 2021 (UTC)

  • Зачем щёлкать, когда есть petscan? Далматовский район без ukwiki. 194.50.15.16 15:20, 7 ноября 2021 (UTC)
    • Сортировку только лучше поставить по названию. — Vort (обс.) 15:45, 7 ноября 2021 (UTC)
      • Можете поменять, не возражаю. Вообще удивляюсь автору, что оно не сортирует по-умолчанию. И что никто ему, видимо, об этом не скажет. Ещё русский язык интерфейса постоянно сбрасывается. 194.50.15.16 15:49, 7 ноября 2021 (UTC)
        • Поменял. Возможно, для больших запросов становится важной трата дополнительных ресурсов на сортировку. — Vort (обс.) 16:14, 7 ноября 2021 (UTC)
    • Что тут можно автоматизировать, а что — нет — вопрос интересный. Если кому-то удобнее petscan — хорошо. — Vort (обс.) 15:47, 7 ноября 2021 (UTC)
      • Дать два списка просто: один ru без uk, а второй uk без ru. И ссылки на локаль и на ВД сразу. 194.50.15.16 15:49, 7 ноября 2021 (UTC)
      • Проблемы дубликатности не только в Курганской области, например, полно озёр в Карелии без связи с себуанцами. Так что отчёты можно делать на постоянной основе. Хотя их ведёт KrBot, правда пока не разобрался как с ними работать: d:User:Ivan A. Krestinin/To merge/ruwiki. 194.50.15.16 17:34, 7 ноября 2021 (UTC)
    • А, вообще, для этих целей есть Лакмус. 217.117.125.83 10:42, 8 ноября 2021 (UTC)
  • А ещё в ukwiki полно статей об островах со всего света, где нет интервик, а должны быть. 217.117.125.83 10:43, 8 ноября 2021 (UTC)
    • Конкретно этот кластер мне показался очень удобным для обработки — думать надо мало, а шанс ошибки минимален. Более сложные (или не проанализированные) случаи можно обрабатывать следом. — Vort (обс.) 11:03, 8 ноября 2021 (UTC)

Категория ставится шаблоном из Викиданных[править код]

Конкретно, карточка "Организация" проставляет категорию Категория:Лауреаты Нобелевской премии мира, беря информацию из Викиданных. На параметр nocat не реагирует. Что делать, если требуется поставить не эту категорию, а Категория:Организации, удостоенные Нобелевской премии мира? Данный вариант не предусмотрен. Разберитесь. -- Badger M. (обс.) 09:21, 7 ноября 2021 (UTC)

  • В коде шаблона {{организация}} это делает строчка |викиданные51 = p166, однако просто убирать её оттуда не надо (этот код не только ставит категорию, но и заполняет графу «Награды» в карточке). Можете вместо шаблона {{организация}} использовать шаблон {{некоммерческая организация}}, а категорию добавлять руками (но в этом случае и наград в карточке не будет). Гамлиэль Фишкин 02:21, 8 ноября 2021 (UTC)
  • Чтобы меньше пришлось разгадывать, статья, в которой это наблюдается: Американский комитет Друзей на службе обществу
    nocat пробросить дело нехитрое, но нужно ли именно оно тут? ·Carn 05:06, 8 ноября 2021 (UTC)
  • Я вчера пытался на викиданных разграничить категории, присваиваемые лауреатам премии, в зависимости от их принадлежности к людям или организациям, но, к сожалению, так и не сумел подобрать верный вариант настройки такого разграничения. — Jim_Hokins (обс.) 05:48, 8 ноября 2021 (UTC)
    • Тут два важных момента. Во-первых, свойство категорий сейчас исключительно для людей. Добавление для него новых сущностей вполне можно обсудить в Викиданных, там же можно обсудить подходящую для этого структуру. Во-вторых, есть локальный код модуля, который должен поддерживать эту структуру. Сейчас в нём нет ничего подобного. Так что, к сожалению, ваша идея попробовать подобрать ограничения изначально была обречена на провал. — putnik 07:50, 8 ноября 2021 (UTC)
      • Понятно. Спасибо за разъяснение! Буду знать. Жаль, что не знал этого раньше, не тратил бы время. :-)Jim_Hokins (обс.) 09:33, 8 ноября 2021 (UTC)
      • Если дело обстоит так, как Вы говорите, тогда ещё проще -- это банально ваш косяк. Ну так исправляйте. -- Badger M. (обс.) 14:12, 8 ноября 2021 (UTC)
        • Я отвечаю на этом форуме и поддерживаю довольно большое количество кода в Википедии, чтобы людям становилось лучше. В первую очередь тем людям, которые мне приятны. Так что запросы от хамов я выполняю в последнюю очередь. — putnik 02:47, 9 ноября 2021 (UTC)
          • Кто бы говорил? Консенсус на реализацию подкачки из Викиданных предъявите. Иначе по умолчанию вынужден считать Вас пушером. -- Badger M. (обс.) 08:36, 9 ноября 2021 (UTC)
            • Вы меня можете считать кем хотите, это полностью ваше право. Особенно, если вы сможете это выражать корректно без нарушения ВП:ЭП. Но если же вы хотите от меня хотите добиться какой-то помощи, то я уже вам выше написал, что это худшая стратегия из всех возможных. Хотя, возможно, я всё неправильно понял, и ваша цель состоит совсем не в исправлении проблемы. В таком случае не буду вам мешать. — putnik 17:39, 9 ноября 2021 (UTC)
              • Нарушение ВП:ЭП (явное) я вижу разве что в Вашей реплике. От Вас мне ничего не требуется (о проблеме поставлены в известность, и ладно). Вас же я просил дать ссылку на упомянутый консенсус о реализации подкачки в карточки из Викиданных, не более. -- Badger M. (обс.) 18:22, 9 ноября 2021 (UTC)
    • Извиняюсь, про первое я ошибся. Категории не только для людей (я увидел в тот раз ограничение свойства, но не перепроверил, что именно оно запрещает), но конкретного формата, как должны указываться несколько категорий (и должны ли, потому что сейчас стоит ограничение на одно значение) всё же нет. — putnik 07:25, 9 ноября 2021 (UTC)
  1. Скорректировать getRecipientCategoryFromEntity в Модуль:Wikidata/Medals примерно как тут: Модуль:Wikidata#L-1336 (т.е. брать из прилетевшего селектора, а если он не указан, то из P2517)
  2. Навставлять в викиданных аналогичных утверждений для подкатегорий Категория:Награждённые организации
Ghuron (обс.) 08:04, 10 ноября 2021 (UTC)

Устаревшие названия рек[править код]

На ВД тысячи рек всё ещё носят устаревшие названия, как они были залиты из первой версии ГВР. Кто может всё исправить? К:Реки по алфавиту. 185.16.139.144 17:39, 2 ноября 2021 (UTC)

  • Примеры можно? Ghuron (обс.) 05:45, 3 ноября 2021 (UTC)
    • Ай-Ватьсортъягун, Арматолито-Тяха, Вадыръяха. — Vort (обс.) 05:53, 3 ноября 2021 (UTC)
    • Только старые же удалять не надо, их надо в синонимы переносить. — Vort (обс.) 05:53, 3 ноября 2021 (UTC)
      • То есть топикстартер предлагает обновить лейблы у рек, взяв за основу названия ру-вики статей? Ghuron (обс.) 06:02, 3 ноября 2021 (UTC)
        • Судя по всему, да. Но раз речь про ГВР, то мне кажется, что стоит не всё-всё менять, а сузить область до России или даже до кластеров статей с проблемными названиями (наверно, какие-то из областей больше всего затронуты). [Однако, это только моё мнение, традиционно осторожное :)] — Vort (обс.) 06:07, 3 ноября 2021 (UTC)
          • Я лейблами обычно не занимаюсь, но если кто-то решится, то вот запрос по рекам, выдающий лейблы, алиасы и названия ру-вики статей. Это дело можно причесать в экселе (уточнение в скобочках там из названий выкусить и т.п.), а потом запузырить в quickstatements, который позволяет все что надо поправить. Ghuron (обс.) 09:06, 3 ноября 2021 (UTC)
          • Vort, разве существуют причины, по которым название на ВД должно отличаться от названия Рувики? Кроме уточнений в скобках, понятно. 194.50.14.83 19:36, 3 ноября 2021 (UTC)
            • Не должно, а может. Из-за ошибок. Понимаю, что участники проекта стараются, чтобы такого не было. Но поменять правильное название на неправильное всё равно не хочется. Хоть такая ситуация глубоко теоретическая. — Vort (обс.) 05:45, 4 ноября 2021 (UTC)
              • Скорее невероятная. ВД даже не содержит поля для указания источника названия. Там априори инфа хуже чем в разделе. 185.16.139.69 17:29, 4 ноября 2021 (UTC)
            • Ну, например, насколько мне известно, почти все активные русскоязычные пользователи викиданных придерживаются естественного именования И(О)Ф, вместо принятого тут Ф,ИО Ghuron (обс.) 05:49, 4 ноября 2021 (UTC)
              • А причём тут речки? 185.16.139.69 17:29, 4 ноября 2021 (UTC)
                • Ну вы задали вопрос без ограничения по темам, я ответил Ghuron (обс.) 05:38, 5 ноября 2021 (UTC)
            • Вспомнился класс случаев, о которых стоит подумать. В Википедии все статьи начинаются с большой буквы, для меток в Викиданных такого ограничения нету. И есть практика писать с большой буквы только названия. Так вот вопрос. Есть статья Залив Святого Лаврентия. Не «залив Святого Лаврентия» ли метка в ВД должна быть? — Vort (обс.) 06:23, 4 ноября 2021 (UTC)
              • Должна быть так, как бы вы написали в середине предложения. И судя по тому, что в статье написано «От Атлантического океана залив Святого Лаврентия отделяют острова…», то да, должно быть со строчной. — putnik 08:42, 4 ноября 2021 (UTC)
                • Проверить капитализацию первой буквы на ВД дело одной минуты. И залив многие годы на ВД с большой, никто не переживает. 185.16.139.69 17:29, 4 ноября 2021 (UTC)
                  • Ну, в данном случае получаются тысячи минут. Да, это не критично, если в ВД будет заглавная, но если это можно быстро поправить при импорте и не тратить время на исправление потом в каждом элементе отдельно, то лучше всё же поправить. — putnik 08:36, 5 ноября 2021 (UTC)
  • Кстати из-за этой проблемы вы не смогли автоматически перевязать почти 18 тысяч рек с ГКГН. Таковы объёмы вопроса: не менее 15 тысяч устаревших названий. 185.16.139.69 17:33, 4 ноября 2021 (UTC)
  • Проблема решена или остались ещё примеры некорректного именования? Ghuron (обс.) 20:18, 5 ноября 2021 (UTC)
    • Ghuron, а кто его знает, все 18 тысяч рек проверять некогда. Но мусорные технические редиректы вносили на ВД зря… Теперь можно заново перевязать ГКГН по рекам. 194.50.15.16 18:35, 7 ноября 2021 (UTC)

Бот-создатель элементов[править код]

Сейчас тысячи статей не имеют элементов ВД. Предлагаю сделать бота, который бы ждал неделю от момента создания статьи, а затем делал новый элемент со страной и типом. Тип можно брать из алфавитных категорий, страну из параметров карточки. Недельная задержка нужна, чтобы желающие успевали связывать интервики и выставлять на удаление. С шаблоном КУ/КБУ/КОБ понятно игнорировать. 185.16.137.60 08:59, 22 октября 2021 (UTC)

Не всегда элемент надо создавать. Часто надо просто найти. — Vort (обс.) 09:02, 22 октября 2021 (UTC)
Инструментами ВД дубликаты обнаружить проще. Кроме того, никто этим не занимается: полагаю, объектов без элемента с каждым днём больше. 185.16.137.60 09:04, 22 октября 2021 (UTC)
Проблема ещё и в том, что объекты создаёт d:user:GZWDer (flood) вот в таком виде: Q97315412. Уж лучше нормальный дубликат, чем вот это рукожопие, которое также может быть дубликатом, но уже сложным для выявления. 185.16.137.60 09:40, 22 октября 2021 (UTC)
Уже не создаёт. Кстати, не одному мне не нравится такая деятельность. — Vort (обс.) 09:54, 22 октября 2021 (UTC)
Ну так он годами это делает, ещё с 2015 если не ошибаюсь. И дальше будет. Создавать нормальные элементы с опознавательными характеристиками наперёд этого бота — меньшее из зол, да ещё с положительным эффектом в большинстве случаев. Интервик реально нет для очень многого из создаваемых здесь статей. И если интервику, скажем, целый год никто не искал, чего ждать-то? 185.16.137.60 10:17, 22 октября 2021 (UTC)
Сейчас он в бане. — Vort (обс.) 10:19, 22 октября 2021 (UTC)
А, не так прочёл. Появятся другие… 185.16.137.60 10:20, 22 октября 2021 (UTC)
По сути вопроса: подождём ещё мнений. — Vort (обс.) 10:20, 22 октября 2021 (UTC)
  • Справа в разделе «Работа для участников» в третьей строчке ссылка на duplicity. В статистике видна пила, т.е. раньше кто-то (GZWDer) создавал элементы пачками. Ghuron (обс.) 11:52, 22 октября 2021 (UTC)
    • То есть без бота получаем непрерывный рост прямо в космос. Никто статьи не перевязывает. Так и не понял что там за ерунда в подписях дат. 185.16.137.60 12:19, 22 октября 2021 (UTC)
      • Я не уверен что тут поможет бот — много хитрых случаев, например, у людей страну писать нельзя (можно гражданство, но я бы его импортировать из наших категорий не стал бы).
        Я сейчас зарядил литься дизамбиги по следующему сценарию:
  1. Копи-пастим из дуплисити в эксель, вырезаем все лишнее, оставляя только названия статей
  2. Создаем табличку с 5 колонками:
    1. qid оставляем пустой
    2. Sruwiki название статьи (я делаю в кавычках, но, возможно, и не надо)
    3. Lru название статьи без уточнения в скобках
    4. Dru "страница значений"
    5. P31 Q4167410
  3. копипастим в текстовый редактор и заменяем табуляцию на запятые
  4. скармливаем в QuickStatements под видом CSV commands
подробная справка по формату: d:Help:QuickStatements#CSV file syntax
По аналогии можно попробовать лить другие Ghuron (обс.) 13:09, 22 октября 2021 (UTC)
    • А вот немецкий и английский разделы кто-то обслуживает, там плато, в отличие от французов. 185.16.137.60 12:27, 22 октября 2021 (UTC)

Есть хороший инструмент для поиска существущих и быстрого создания новых элементов Duplicity (как раз с минимальным наполнением). Ещё один Match new articles to items, увы, отключен. Рекомендую дать линк на первый в раздел «Работа для участников». — Kareyac (обс.) 13:09, 22 октября 2021 (UTC)

  • Паттерны, которые прослеживаются при прокликивании элементов в Duplicity:
    1) много страниц неоднозначностей, возможно их действительно стоит создавать ботом с нужным значением P31;
    2) страницы, у которых после переименования элемент остался привязанным к перенаправлению — очень странный случай, вроде бы раньше был бот, который это исправлял;
    3) темы, лучше всего описанные в русскоязычных источниках, с большой вероятностью без существующих элементов.
    Возможно, если расчистить две первые категории ботами, то ситуация значительно улучшится, и будет проще привлекать участников к работе с тем, что не поддаётся автоматизации. — putnik 09:43, 1 ноября 2021 (UTC)

Манхэттенский проект[править код]

Есть карточка. В карточке есть графа "Участники". В ней указаны Лесли Гровс и Роберт Оппенгеймер, руководители проекта, что верно. Но почему-то перед ними указаны Lilli Hornig (по которому даже нет русскоязычной статьи) и Ву Цзяньсюн. Непонятно, почему из десятков ученых-участников проекта указаны эти двое (и отнюдь не самые известные). Правильно было бы указать как руководителей Гровса и Оппенгеймера, а дальше указать "и многие другие" со ссылкой на ru:Категория:Участники Манхэттенского проекта. Но как это сделать я не знаю. Сделайте! 109.252.201.66 12:32, 19 октября 2021 (UTC)

  • Я передвинул Оппенгеймера с Гровсом на первые места и указал им приоритетный ранг, так что теперь в карточке выводятся только они. Не вижу проблемы, что другие значимые персоны тоже будут перечислены с нормальным рангом, если их, конечно, будет не 130 тысяч. Ну и вы всегда можете указать в карточке локально что-то другое. — putnik 21:25, 19 октября 2021 (UTC)

Спасибо! Ещё там есть графа "Место проведения", где почему-то указано "Реактор В". В качестве "места проведения" стоило бы указать просто "США", так как объектов было несколько (Лос-Аламос, Оак-Ридж, Хенфорд, Чикагский университет). 109.252.201.66 11:47, 20 октября 2021 (UTC)

Предки, шаблон[править код]

Тут, оказывается, опять придумали какое-то эзотерическое знание, с которым я обычно не сталкиваюсь, поскольку не правлю про королей и т.п. Вот смотрите: Вильгельм_Франц_Габсбург-Лотарингский#Предки. Из того, что мы видим в правом верхнем углу этого родословного древа, ясно, что император Леопольд был, внезапно, женат на герцоге Тешенском, а императрица Мария Луиза - замужем за герцогиней. И я вообще не могу понять, где это исправить. Андрей Романенко (обс.) 21:20, 17 октября 2021 (UTC)

  • Насколько я смог понять это генеалогическое дерево, и император Леопольд и герцог Тешенский указаны в качестве отцов Карла Австрийского (а не в качестве супругов друг друга), а Мария Луиза и герцогиня Тешенская — в качестве матерей (аналогично). Нужно ли указывать приёмных родителей в генеалогическом дереве — другой вопрос. — Jim_Hokins (обс.) 04:40, 18 октября 2021 (UTC)
    • Верю, что вы правы, но 1) выглядит это совершенно дико, и 2) вообще нет ни малейшей возможности разобраться, где внести изменения, если в такой схеме что-то вызывает вопросы. Андрей Романенко (обс.) 14:54, 18 октября 2021 (UTC)
      • 1) Выглядит не очень понятно, согласен. 2) Судя по документации шаблона, информация полностью берётся из викиданных. Я так понимаю, что если нужно изменить какого-нибудь предка, надо изменить родителя на странице ребёнка этого самого предка в викиданных. То есть, например, если нужно убрать из обсуждаемого генеалогического дерева вышеупомянутого герцога Тешенского, нужно удалить его из параметра «отец» на странице Карла Австрийского в Викиданных. Возможно (возможно), достаточно будет присвоить ему нерекомендуемый ранг, но в этом я точно не уверен, а тестировать не хочу. — Jim_Hokins (обс.) 16:27, 18 октября 2021 (UTC)
        • Всё, до меня дошло. Там у герцога и герцогини Тешенских стоит же квалификатор "приёмные родители". Значит, задача сводится к тому, чтобы разграничить способы выведения родителей в карточках и шаблонах в зависимости от того, родные они или приёмные. Я только не понимаю, где это должно обсуждаться - у нас или на Викиданных. Андрей Романенко (обс.) 17:18, 18 октября 2021 (UTC)
          • У нас. Наверное, здесь. Надо, чтобы при наличии "приёмные родители" информация из Викиданных не подгружалась. Правда автор шаблона сейчас неактивен, но может кто-то ещё возьмётся исправить. Vladimir Solovjev обс 19:50, 18 октября 2021 (UTC)
            • Запрос-то этот, может, технически и несложный, но его ещё как-то додумать надо до конца. Я бы осторожно предположил, что приёмные родители не должны подгружаться только в том случае, если наряду с ними указаны и родные, а если родных нет, то пусть подгружаются приёмные. Но тут бы хорошо бы какого-то специалиста именно по королевским династиям спросить, как правильно. Кто бы это у нас мог быть? Андрей Романенко (обс.) 22:49, 18 октября 2021 (UTC)

Викимапия[править код]

Может у кого есть мысли как автоматизировать перевязку? См. ВП:Ф-ГЕО#Викимапия. 194.50.15.241 05:55, 14 октября 2021 (UTC)

Тирасполь[править код]

В карточку статьи из ВД импортируется некорректная информация («рум. Tiraspol» — румынский язык вместо молдавского). Соответствующий элемент в ВД защищён до уровня автоподов, подавить импорт непосредственно черед код статьи не получается. Просьба оказать содействие с исправлением некорректной информации; также прошу указать, как в подобных ситуациях корректно и результативно подавлять некорректные данные, импортируемые из ВД. С уважением, — Полиционер (обс.) 18:08, 12 октября 2021 (UTC)

Похоже на ошибку где-то в шаблонах. — Vort (обс.) 18:19, 12 октября 2021 (UTC)
  • Коллега @Полиционер, поправил, это в код забрался неразрывный пробел, получилось «| оригинальное название наразрывный-пробел =» и движок воспринимал параметр как «оригинальное название наразрывный-пробел». Это стандартная поломка, по которой параметры неожиданно не работают, её наличие можно проверить, стерев пробелы между «оригинальное название» и «=», поставив новые в том же количестве и нажав «внесённые изменения» — если изменилось что-то, был неразрывный пробел, или же скопировав кусок кода страницы (не из диффа, там неразрывные пробелы и пробелы могут меняться вроде) в [1]. Викизавр (обс.) 18:21, 12 октября 2021 (UTC)
    • Так и не сделали подсветку. — Vort (обс.) 18:24, 12 октября 2021 (UTC)
    • Благодарю за помощь, коллега! С уважением, — Полиционер (обс.) 18:29, 12 октября 2021 (UTC)
    • По идее, если выделить строчку и нажать викификатор, он сам зачистит неразрывные пробелы. И это опять проблема, отчасти порождённая тем вносильщиком замены мнемоники nbsp; в викификатор. Годами жалуются, ноль реакции. 194.50.15.241 03:53, 13 октября 2021 (UTC)
    • Т.е. все-таки заменили локальным значением информацию из Викиданных. Может, лучше было бы поправить в Викиданных (что я, собственно, и сделал). Michgrig (talk to me) 06:50, 13 октября 2021 (UTC)
      • Локальную ошибку (вредящие неразрывные пробелы) всё равно надо было исправлять. — Vort (обс.) 06:51, 13 октября 2021 (UTC)
        • Ее можно было исправить и полным удалением параметра из кода карточки :))) Michgrig (talk to me) 07:02, 13 октября 2021 (UTC)
          • К сожалению, с консенсусностью таких удалений есть проблемы. — Vort (обс.) 07:05, 13 октября 2021 (UTC)
      • Не заменяли, она всегда там была, только в какой-то момент сломали. --217.118.92.78 07:13, 13 октября 2021 (UTC)
        • Коллега @Лобачев Владимир, к сожалению, у вас редактор ломает параметры шаблонов, см. [2]. Скажите, вы можете попробовать воспроизвести баг из phab:T233809? Викизавр (обс.) 08:25, 13 октября 2021 (UTC)
          • Может я случайно «на автомате» нажал неразрывный пробел? Мне по работе нередко приходится его вставлять в текст с помощью нажатия клавиш Sift+Spase. — Лобачев Владимир (обс.) 20:17, 13 октября 2021 (UTC)
      • Коллега @Michgrig, на всякий случай: с точки зрения лингвистики и конституции Молдавии никакого молдавского языка нет, есть только молдавская разновидность румынского языка. В рувики с принятием этого проблемы и потому тут везде проставляют молдавский язык, но вряд ли корректно добавлять молдавский язык и на Викиданные, не страдающие от наших системных отклонений. В статье Тирасполь особый случай, потому что он находится под контролем ПМР, которая признаёт существование молдавского языка (и потому, возможно, корректно проставить оба языка, румынский с точки зрения Молдавии и молдавский с точки зрения ПМР), но вот в городах вне контроля ПМР никакой молдавский язык не ставьте, пожалуйста. Викизавр (обс.) 08:14, 13 октября 2021 (UTC)

День учителя[править код]

Викиданные лучше знают, когда отмечать праздник? 194.50.15.241 19:02, 5 октября 2021 (UTC)

  • И каков правильный ответ? Ghuron (обс.) 03:38, 6 октября 2021 (UTC)
    • Откуда ж мне знать, я не сторонник полупустых карточек и уж тем более фактов из ВД без АИ. 194.50.15.241 07:51, 6 октября 2021 (UTC)

Воинская служба по призыву[править код]

какой элемент можно использовать для обозначения службы в армии ("ключевое событие")? (время, когда служил в армии). Что именно считается началом, а что концом, каким свойством или элементом эту информацию лучше добавить? d:Q209572? как ключевое событие? или род занятий?
или d:Q580750? или d:Q4378283 как род занятий или должность? infovarius (обс.) 16:24, 26 сентября 2021 (UTC)

Заливка ГКГН в Викиданные[править код]

Кто-то мог бы осуществить заливку d:Property:P1397 при помощи шаблона шаблон:ГКГН? Свойство почти не заполнено (608 на ВД против 7706 здесь), но позволяет осуществлять быструю валидацию названий и координат. Первично достаточно проверить, чтобы шаблон использовался в статье один раз (по таким случаям сделать список к ручному разбору), остальные мелкие ошибки всплывут в отчётах по дубликатам на ВД. 185.16.136.13 13:46, 14 сентября 2021 (UTC)

Заливка из шаблонов и списка[править код]

  • harvest templates? Ghuron (обс.) 02:55, 15 сентября 2021 (UTC)
    • нет, увы, почему-то не может найти в тексте шаблон.
      @Pasleim could you please advise why [3] doesn't work? Ghuron (обс.) 04:04, 15 сентября 2021 (UTC)
      • Если это был пинг, то неудачный. — Vort (обс.) 04:07, 15 сентября 2021 (UTC)
      • он в рефах не обрабатывает. И мне кажется, что по делу. Потому что подтверждается ими что угодно, а не только объект статьи.
        На территории заповедника расположены хребет [[Маньпупунёр]]<ref>{{Реестры зарегистрированных наименований географических объектов|Республика Коми||0169098|Мань-Пупунёр}}</ref> ShinePhantom (обс) 09:24, 15 сентября 2021 (UTC)
    • я пустил вчера и сегодня продолжил. Речки все мимо, а вот нп в основном переносятся. Но результативность не более 10 % ShinePhantom (обс) 13:08, 15 сентября 2021 (UTC)
      • 1926 стало на ВД. На этом все. ShinePhantom (обс) 18:03, 15 сентября 2021 (UTC)
  • Вопрос (наивный, но от сторонника интеграции с ВД): а что мешает просто залить полностью ГКГН в ВД? То есть названия статей не всегда понятны, но в шаблоне по населению (например) они ведь уже готовые? — Vulpo (обс.) 19:01, 15 сентября 2021 (UTC)
    • Полагаю, что могут существовать недалеко друг от друга объекты с одним и тем же названием и алгоритм заливки их попутает. Если же координат в элементе ВД нет, так вообще не будет понятно, куда привязывать, так как в таком случае идентичных наименований будет совсем много. — Vort (обс.) 05:46, 16 сентября 2021 (UTC)
    • Ещё могут быть различающиеся (при этом равноправные) написания названий одного и того же объекта. — Vort (обс.) 05:48, 16 сентября 2021 (UTC)
    • Технически залить можно табличку из двух колонок: идентификатора викиданных (вида QXXXX) и, собственно, семизначного регистрационного номера. Вот тут есть 170 pdfок, которые можно превратить в одну большую табличку (если гугль-док нам не окончательно заблочили), и потом попытаться по названию и «типу объекта» получить корректный идентификатор викиданных. Я готов помочь в том, что касается собственно викиданных, но тут много ручной работы, а времени у меня почти нет Ghuron (обс.) 06:19, 16 сентября 2021 (UTC)
      • Неужели технологии уже дошли до корректного импорта pdf`ок? Не пользовался гугл-доками, но про то, что pdf привести в приемлемый вид алгоритмически непросто, в курсе. — Vort (обс.) 06:28, 16 сентября 2021 (UTC)
        • Ну pdfка pdfке рознь, я попробовал скопипастить текст из алтайского края, он в целом вставляется нормально. Разбиение на столбцы пропадает, но это поправимо, хотя, конечно, и потребует значительной ручной (а не алгоритмической) работы. Ghuron (обс.) 06:58, 16 сентября 2021 (UTC)
          • Дарю. Но протяжённые объекты всё равно так не получится залить, для тех же рек логично взять из ref. 194.50.12.142 08:10, 16 сентября 2021 (UTC)
            • На случай если кто-то решит делать заливку по этой таблице, хотелось бы знать методику её получения. — Vort (обс.) 08:19, 16 сентября 2021 (UTC)
              • Взято с сайта Росреестра в открытых данных. Свежесть около двух-трёх месяцев. Далее всё отсортировано по кодам средствами LibbreOffice Calc. Искать оригинал не буду, там вечные переезды, да и капчу тут опять вводить… 194.50.12.142 08:23, 16 сентября 2021 (UTC)
                • Ок, спасибо. Главное, что это не парсинг pdf`ки. — Vort (обс.) 08:24, 16 сентября 2021 (UTC)
            • А он спецом по 812530 обрезан или это у меня эксель не справился? Ghuron (обс.) 08:55, 16 сентября 2021 (UTC)
              • Похоже, что 7й разряд — задел на будущее. Копаю сейчас выгрузку из WD — из 602 элементов ни в одном нет ненулевого 7го разряда. — Vort (обс.) 09:08, 16 сентября 2021 (UTC)
              • В файле-оригинале 812530 — максимальный номер объекта. 194.50.12.142 09:59, 16 сентября 2021 (UTC)
              • Ghuron, Vort, я нашёл где 7-й разряд. Это коды для наименований в Антарктике и открытом море. В моём файле их нет, к сожалению. Но на сайте Росреестра есть pdf с перечнем (ОБЪЕКТЫ КОНТИНЕНТАЛЬНОГО ШЕЛЬФА И ИСКЛЮЧИТЕЛЬНОЙ ЭКОНОМИЧЕСКОЙ ЗОНЫ РОССИЙСКОЙ ФЕДЕРАЦИИ). 194.50.12.142 16:36, 16 сентября 2021 (UTC)
            • Попробовал сделать примитивный матчинг по сёлам. Расстояние < 0.1 градуса, полное совпадение по уникальному имени. Из 637441 записи ГКГН и 21745 записи ВД удалось сопоставить всего 39 записей. Но этот результат явно можно улучшать. Может, даже на 1-2 порядка. Если кому-то интересно посмотреть на результаты, то они в скрытом блоке:
Vort (обс.) 09:44, 16 сентября 2021 (UTC)
Vort, судя по выхлопу куда эффективнее обработать ref в Рувике и просто сопоставить названия — 5500+ новых привязок гарантировано. 194.50.12.142 10:34, 16 сентября 2021 (UTC)
Да полезно и то, и другое. Попробую разобраться, почему такой слабый результат. Наверно в ВД полно названий со скобками. — Vort (обс.) 10:36, 16 сентября 2021 (UTC)
Загадка какая-то. В выгрузке из ВД оказались попутаны широта и долгота. Разбираюсь. — Vort (обс.) 10:49, 16 сентября 2021 (UTC)
Ага, выше — список ошибок с перевёрнутыми координатами. Вот так случайно создал валидатор. Скоро нормальный список подготовлю. — Vort (обс.) 10:57, 16 сентября 2021 (UTC)
  • Это больше разведка. До качественного списка ещё далеко. К примеру, в версии №2 очень много расхождений по кодам. Может, устаревшие. Может, надо 0.1 градус в 0.01 превращать. Может, без добавления обработки АТЕ ничего толкового не выйдет. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)
Теперь другое дело: список. 12173 записи. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)
Проверил типы в этой (второй) версии. Получилось вот так:
Для версии номер три оставил только село, деревня, посёлок: Special:Permalink/116681436, всего 10763 + 196 + 63 = 11022 записи. — Vort (обс.) 11:45, 16 сентября 2021 (UTC)
Оценка количества ошибок в 3й версии: ~0.3%. Неплохо, думал будет хуже. Только в одной записи (с заполненным кодом) вышло расхождение — Q4319356. Случай близкого расположения, кстати: https://imgur.com/a/UOM4wLb. Такое только по типам можно отфильтровать (при условии их корректного задания в Викиданных). — Vort (обс.) 12:01, 16 сентября 2021 (UTC)
Построил гистограмму распределения расстояний между одноимёнными объектами. Видно, что наугад выбранная граница в 0.1 градус почти идеальна: https://imgur.com/a/JpuvsJ7. — Vort (обс.) 12:47, 16 сентября 2021 (UTC)
Более полная версия (убрал требование уникальности имени для выгрузки из ВД, толку от него было мало) №4: Special:Permalink/116682460. Получилось 18033 записи. Примерно 83% из выгрузки ВД удалось сопоставить. По дублям (ошибкам сопоставления) отдельно буду таблицу делать. — Vort (обс.) 12:56, 16 сентября 2021 (UTC)
Случаи, когда для одного элемента ВД находится несколько элементов ГКГН:
Случаи, когда для одного элемента ГКГН находится несколько элементов ВД:
Vort (обс.) 13:15, 16 сентября 2021 (UTC)
Vort, их нет нужды мониторить, все дубликаты всплывают в отчёте на ВД: d:Wikidata:Database reports/Constraint violations/P1397. 194.50.12.142 14:55, 16 сентября 2021 (UTC)
Идея в том, чтобы их не создавать. То есть, вручную обработать то, что для алгоритма слишком сложное. Я смогу исключить уже заполненные элементы из формируемого списка. — Vort (обс.) 15:08, 16 сентября 2021 (UTC)
Да, чуть позже догадался. Тем не менее в таком формате, как представлен выше, разбирать список явно никто не будет. Я бы предпочёл разбирать отчёты Викиданных, где список имеет понятную структуру. Или в любом другом месте, но с позициями и со ссылкой на валидатор (есть в местном шаблоне). В любом случае вручную разобранное быстрее сразу заносить на ВД, чем формировать список и потом отдавать боту. Так что всё что уже однозначно идентифицировано надо заливать. 194.50.12.142 15:16, 16 сентября 2021 (UTC)
Разобрать список так, чтобы в следующий раз при проходе алгоритма он оказался пустой — это я и имею в виду. Докидать ссылок — не проблема. Обновил списки выше. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)
  • @Ghuron: как я понимаю, u:ShinePhantom решил, что заливка с дублями — это нормально. Такой вариант тоже годится. Если кто-то потом расчистит дубли. Мне было важно, чтобы кто-то заливкой подтвердил, что мой список пригоден. Что и произошло. На всякий случай выкладываю упрощённый список с недозалитыми остатками (v5): Special:Permalink/116694490. Код для формирования (на всякий случай):
Vort (обс.) 06:51, 17 сентября 2021 (UTC)
  • да нормально все, разгребется по месту, если что не так. ShinePhantom (обс) 07:02, 17 сентября 2021 (UTC)
  • Ок. Если будут какие-то вопросы или пожелания — постараюсь ответить. — Vort (обс.) 07:03, 17 сентября 2021 (UTC)
    • ну через пару часиков обновите список недозалитого. А потом подождем отчет об ошибках по уже залитому. Плюс там Гурон параллельно речки льет. ShinePhantom (обс) 07:15, 17 сентября 2021 (UTC)
      • Этот отчёт автоматически создаётся или надо боту команду давать? По истории там промежутки времени по полгода. — Vort (обс.) 07:35, 17 сентября 2021 (UTC)
        • там бот не пишет новый отчет, если число ошибок не изменилось, а только количество элементов, использующих свойство. Но если ошибки есть - придет и расскажет. ShinePhantom (обс) 08:36, 17 сентября 2021 (UTC)
      • @ShinePhantom: из-за особенностей процесса заливки в отчёт на ВД попали не все проблемы. Так что если кто будет исправлять, то проходить с проверкой надо по выложенным мною двум спискам выше. — Vort (обс.) 08:10, 18 сентября 2021 (UTC)
    • вот, прошлый ваши выкладки вроде залил, проверьте ShinePhantom (обс) 09:34, 17 сентября 2021 (UTC)
      • @ShinePhantom: вот остатки. Что-то недозалилось, что-то, видимо, в кеше Викиданных застряло.
Vort (обс.) 10:22, 17 сентября 2021 (UTC)
С lat <-> lon уже сам разобрался, тот список можно не смотреть. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)

Заливка из сносок[править код]

  • Если что, для вноса всё ещё остались тысячи объектов с ГКГН в примечаниях. Пример на 4034 статьи. 194.50.13.235 18:35, 18 сентября 2021 (UTC)
    • Повынимал. С минимальной валидацией. Special:Permalink/116794109. Список по какой-то причине необработанных статей:
templ_fail — то ли не нашёлся шаблон, то ли нашлось несколько. val_fail — нетрадиционный формат у идентификатора. no_gkgn_id_in_db — нет кода в базе. name_mismatch — не совпадает название в базе и заголовок статьи (с минимальной нормализацией). Хотелось, чтобы кто-нибудь проверил результат и залил, если результат годный. Процент ошибок на этот раз не оценивал. — Vort (обс.) 12:18, 21 сентября 2021 (UTC) (Списки ошибок и заливки обновлены 13:07, 22 сентября 2021 (UTC))
Код не очень качественный, но всё равно выкладываю, для желающих проверить методику: https://github.com/Vort/WikiTasks/tree/wp_gkgn_exportVort (обс.) 12:21, 21 сентября 2021 (UTC)
По templ_fail — не знаю насколько распространено, но только что был случай одного объекта просто на разные даты. Это надо заливать. 194.50.13.235 17:30, 21 сентября 2021 (UTC)
Ещё бывает, что объект в нескольких АТЕ и из-за этого два шаблона. Но вот что проще — прописывать все эти хитрости в код или обработать вручную — не знаю. Ну, как минимум, можно начать с name_mismatch. Там большая часть — реальные проблемы. Особенно «Суровручей». — Vort (обс.) 17:37, 21 сентября 2021 (UTC)
val_fail исправил. Среди no_gkgn_id_in_db надо отсечь всё что свыше 812530 — этого в файле просто нет. 194.50.13.235 17:49, 21 сентября 2021 (UTC)
Я ж их провалидировать не могу. 3 штуки можно перенести вручную. Насчёт повторного запуска — не знаю. Может, всё из списка выше стоит вручную обработать. Ну либо как-то договориться. — Vort (обс.) 17:53, 21 сентября 2021 (UTC)
Vort, name_mismatch слишком много, их надо бы в отдельный список и на форум к разбору. Заливать не надо, понятно. То есть хотелось бы выше увидеть список с обновлением val_fail, без no_gkgn_id_in_db свыше 812530 и без name_mismatch. 194.50.13.235 17:55, 21 сентября 2021 (UTC)
Я сейчас пытаюсь НП скачать, не хочу, чтобы сервер меня послал. Большие no_gkgn_id_in_db исключить из списка могу, но на заливку их не помещу, так как не провалидированы :) Чуть позже обновлю, в общем. — Vort (обс.) 17:58, 21 сентября 2021 (UTC)
По no_gkgn_id_in_db всё оказалось не так просто. Эти объекты или утеряны в файле или были удалены из реестра. Надо изучать досконально все случаи. Хочу спросить, это анализ вообще всех статей или только без кодов ГКГН на ВД? Список всего что пропало был бы полезен. 194.50.13.235 18:28, 21 сентября 2021 (UTC)
Без Викиданные: указано свойство: код ГКГН. Поэтому писал, что процент ошибок не оценивал. Полная валидация — это отдельная задача, сейчас бы залить. — Vort (обс.) 19:14, 21 сентября 2021 (UTC)
По-моему все препятствия к заливке устранены: исключаем name_mismatch, no_gkgn_id_in_db и в путь. По templ_fail взять самый первый код и сравнить название, вручную 125 записей проверять некому. 194.50.13.235 19:19, 21 сентября 2021 (UTC)
Первая попавшаяся статья: Островня (приток Москвы). Тут вообще, похоже, оба кода имеют право быть залитыми. Так что с заливкой первого попавшегося — это не ко мне. — Vort (обс.) 19:25, 21 сентября 2021 (UTC)
Да, оба заливать. Ниже сделал список по templ_fail, его можно заливать, каждую позицию проверил. 194.50.13.235 20:27, 21 сентября 2021 (UTC)
Кеш поиска тупит, я уже 5xxxxxx прописал вручную, purge сделал, а всё равно в списке всплыли. Так что обновилось только частично. — Vort (обс.) 19:21, 21 сентября 2021 (UTC)
Уже прочистился. — Vort (обс.) 19:32, 21 сентября 2021 (UTC)
Вот name_mismatch отдельно:
Vort (обс.) 19:32, 21 сентября 2021 (UTC) (обновлено 04:04, 22 сентября 2021 (UTC))
Vort, в этом списке больше половины можно заливать, из 160 записей 99 соответствуют:
194.50.13.235 20:24, 21 сентября 2021 (UTC)
Ок. — Vort (обс.) 04:04, 22 сентября 2021 (UTC)
Начал разбирать name_mismatch. А с не упомянутыми тремя тысячами какие-то проблемы? 194.50.13.235 10:53, 22 сентября 2021 (UTC)
Предполагаю, что можно заливать. Но это ж только моя оценка. Надо, чтобы кто-нибудь по аналогии с секцией выше проверил и залил. Защита от «замыленного глаза». — Vort (обс.) 13:11, 22 сентября 2021 (UTC)
Не особо понятно, что предлагается проверить. Статьи в petscan? name_mismatch к слову, ещё остался, я просто удалил из списка не ошибки, а сноски-АИ к тексту. 13:46, 22 сентября 2021 (UTC)
1. Случайную выборку из списка для грубой оценки процента ошибок. 2. Код на предмет наличия глупых ошибок. Ну или ничего не проверять — под ответственность загружающего. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)
И val_fail пустые вижу. Ну это уже детали, список этот для людей, а не для ботов, можно менять как угодно. Всё равно в заливку без валидации не пойдёт. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)
Пустые val_fail заливать не надо, прочие исправлены. 1. Смотреть здесь? Пять случайных штук проверил, всё совпадает (название, регион, тип). 2. Там блин 360 строк, и не все жалуют C#. Если совпало название статьи, а код с файлом, то и заливать, никаких специфических сносок типа подтверждения омонимов в текстах статей нет. 194.50.13.235 14:17, 22 сентября 2021 (UTC)
Ghuron, похоже ждём вашего мнения. 194.50.13.235 16:10, 22 сентября 2021 (UTC)
  • Я в вашей дискуссии потерялся, если всё ок — лейте Ghuron (обс.) 17:35, 22 сентября 2021 (UTC)
    • Ghuron, насколько я понимаю, Vort не хочет заливать сам, а ожидает сторонней оценки списка (моя не устроила) или чтобы кто-то ещё залил. 194.50.13.235 17:44, 22 сентября 2021 (UTC)
Vort, готово. 194.50.13.235 12:47, 22 сентября 2021 (UTC)
  • Vort, после заливки осталось 195 ВО, я так понимаю в основе это templ_fail на 121 штуку? Возможно по ним сделать такой же перебор, как и с другими? Просто взять самый первый шаблон в статье. 194.50.13.235 21:46, 22 сентября 2021 (UTC)
    • Вот эта штучка отключается и в алгоритм идут первые попавшиеся шаблоны. 108 + 43 = 151. Куда ещё 44 делись — без понятия. Алгоритм кривой (как у меня, так, судя по всему, и у Фонда), может быть всё, что угодно. Если очень надо будет, поищу. Результат прогона:
В случае ручной перепроверки, может, и залью. Хотя тут качество ещё хуже, чем в большом списке. — Vort (обс.) 04:36, 23 сентября 2021 (UTC)
Vort, первые 10 совпали, сразу и закинул на ВД. По-моему можно заливать. А список с названиями даже перебирать смысла нет, это посторонние сноски. 194.50.13.235 15:54, 23 сентября 2021 (UTC)
Ну это оценка < 10% ошибок. Лучше бы ещё проверить. Но уже залил, так что проверять уже в ВД можно. — Vort (обс.) 16:19, 23 сентября 2021 (UTC)
Значит остался список ниже на 350 статей. Чистка ВД уже последний этап. 194.50.13.235 16:48, 23 сентября 2021 (UTC)
Кажется, я понял, из чего состоят остатки. Я не сделал кода ошибки для маленького количества параметров. Наподобие insource:/\{\{ГКГН\}\}/. — Vort (обс.) 17:31, 23 сентября 2021 (UTC)

Заливка из сносок 2[править код]

С тематическим списком выше похоже разобрались (осталось залить), но их ещё под тысячу в других статьях. Запрос. 194.50.13.235 16:10, 22 сентября 2021 (UTC)

  • ткните еще раз дифф, чего залить? ShinePhantom (обс) 19:47, 22 сентября 2021 (UTC)
    • Это уже четвёртая. 194.50.13.235 20:01, 22 сентября 2021 (UTC)
    • u:ShinePhantom, спасибо. Только эта заливка относится к секции выше, а будет ли по этой секции что-то заливаться — посмотрим. — Vort (обс.) 04:38, 23 сентября 2021 (UTC)
  • Что я думаю про качество, полагаю, понятно.
Vort (обс.) 17:40, 23 сентября 2021 (UTC)
Vort, как и в прошлый раз, первые 10 совпали, все записал. По-моему надо заливать. По списку с названиями посмотрел только name_mismatch, остальное лучше на геофорум. К заливке:
194.50.13.235 18:26, 23 сентября 2021 (UTC)
Ghuron, ShinePhantom, Vort, заливаем? 194.50.13.235 13:09, 24 сентября 2021 (UTC)
  • Коллега, я за любую движуху кроме голодовки. Косяки можно выправлять прямо в ВД Ghuron (обс.) 13:25, 24 сентября 2021 (UTC)
  • Ну кому-то надо залить же… 194.50.13.235 14:05, 24 сентября 2021 (UTC)
  • Ghuron, ShinePhantom, Vort, движухи два дня нет, поэтому напомню: список в скрытом блоке выше не залит. 185.16.139.228 02:31, 27 сентября 2021 (UTC)
  • Пока что не хочется над этим думать. Если справитесь без меня, то хорошо. — Vort (обс.) 14:08, 24 сентября 2021 (UTC)
Проверенные name_mismatch закинул. — Vort (обс.) 08:00, 25 сентября 2021 (UTC)
  • Ghuron, ShinePhantom, Vort, ау. Список под катом на 257 позиций не залит. Потом разбирать ошибки на ВД будет некому. 185.16.139.123 03:21, 29 сентября 2021 (UTC)
    • Вот так вот один раз что-то сделаешь и по гроб жизни будешь обязан :)
      Это влил Ghuron (обс.) 04:32, 29 сентября 2021 (UTC)
      • Спасибо. Всего лишь до конца работ по конкретному вопросу :) 185.16.139.123 17:23, 29 сентября 2021 (UTC)

Разбор ошибок[править код]

Бот отчитался о ряде ошибок, большинство из них появилось после заливки из НП шаблонов вне сносок и/или привязки по названиям: #Заливка из шаблонов и списка. 194.50.13.235 14:20, 24 сентября 2021 (UTC)

  • За 10 дней интереса никто не проявил, так что тем НП, куда залили сразу два кода, я возвращаю исходную версию, чтобы ошибки не расползались дальше. 185.16.139.228 16:30, 27 сентября 2021 (UTC)
    • Неужели надо ещё раз уточнять, что потенциальные проблемы надо смотреть в списке этой темы, а не на ВД? — Vort (обс.) 05:03, 29 сентября 2021 (UTC)
      • Vort, ? Эти ошибки были залиты без моего участия в самом начале. А те списки, где я принимал участие и вышли косяки, я на ВД скрупулёзно исправил вообще-то. 185.16.139.123 16:20, 29 сентября 2021 (UTC)
        • Для достижения цели «чтобы ошибки не расползались дальше» надо работать над элементами из списков result_wdd.txt и result_gkd.txt. Отмены по валидатору в ВД самые коварные ошибки «заметают под ковёр», это недопустимо — если делать отмену проблемной части заливки, то полностью. Разве что за исключением вручную проверенных элементов (смотреть по истории правок, видимо). — Vort (обс.) 17:00, 29 сентября 2021 (UTC)
          • Желающие всё также могут открыть историю валидатора ВД и проверять сколько угодно. Не было там ничего коварного, всё что я отменил это проблема двух одноимённых НП в одном субъекте. То есть двум таким сёлам выдали по два кода. В статьях Рувики этих кодов нет. Исправлять эти ошибки даже дольше, чем поставить коды заново вручную. 185.16.139.123 17:20, 29 сентября 2021 (UTC)
            • Окей, ещё раз попробую пояснить. В списке есть недозалитые дубли. То есть, алгоритм не смог сделать точную привязку, но залит был только первый код. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
              • Vort, не вижу связи между этими двумя проблемами. Зачистка вылезших дубликатов никак не повлияла на варианты выявления недозалитых дублей. И зачем вообще заливали случаи «алгоритм не смог сделать точную привязку, но залит был только первый код»? Это очень и очень плохо, ошибки разбежались по принципу 50/50. 185.16.139.123 17:34, 30 сентября 2021 (UTC)
                • 1. Создаётся иллюзия, что проблема решена. Иначе в ВД валидаторе видны последствия, напоминающие о необходимости решения проблемы. 2. Потому, что заливка была в два этапа. 3. Все эти случаи есть в списке, про который я уже не первый раз говорю. Разобрать список — разберутся и недо-дубли. — Vort (обс.) 04:37, 1 октября 2021 (UTC)
                  • 1. Это не аргумент — проблемы есть везде и всегда, это самый простой тезис к приятию. Никому кроме тебя или меня абсолют не нужен. 2. И что, что два этапа? На втором этапе надо было исправлять первый, а не усугублять ошибку. 3. А кто бы спорил? Есть желающие — пусть разбирают. У меня на это времени нет, работая с ВП я верю в пункт 1. 185.16.139.123 18:24, 2 октября 2021 (UTC)
        • Кстати, ручную работу по спискам я предлагал изначально. Но нет, вначале «как-нибудь рассосётся», а теперь отмены. Ещё и не до конца. — Vort (обс.) 17:02, 29 сентября 2021 (UTC)
          • Ну не я работал над алгоритмом сравнения «название-тип-регион». Я исходно только из шаблонов предлагал заливать, и там всё хорошо получилось. Почему претензия мне-то? Прошло 10 дней, объявление было здесь и на геофоруме — интереса нуль. 185.16.139.123 17:20, 29 сентября 2021 (UTC)
          • Vort, к слову, подход «как-нибудь рассосётся» хоть мне и не по нраву, но в данном случае легко нивелируется сверкой координат в ГКГН и в статье. Но для этого надо было коды залить по-максимуму, чтобы сделать всё и сразу. 185.16.139.123 17:29, 29 сентября 2021 (UTC)
            • Координаты в статье разве чем-то лучше координат в ВД? Ведь именно по координатам я и привязывал. Но в некоторых случаях в радиусе ~10км было по несколько НП с одним и тем же названием. Кстати, забавно, но даже при перепутанных lat<->lon бывали совпадения. То есть, в реальности существуют НП с одинаковыми названиями и с координатами XX, YY и YY, XX. При большом количестве данных удивительные совпадения попадаются. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
              • по факту они обычно отличаются типом, село/деревня. Но и это не везде работает ShinePhantom (обс) 06:03, 30 сентября 2021 (UTC)
                • Согласен. Но «легко» бывает не всегда. — Vort (обс.) 06:04, 30 сентября 2021 (UTC)
              • Vort, в тех случаях, что я разобрал, были ошибки координат на ВД. То есть в Рувике верные, а на ВД координаты одноимённого объекта. Могу предположить, что это последствия чей-то заливки или неверных merge с себуанцами. 185.16.139.123 17:34, 30 сентября 2021 (UTC)
                • Ну, значит, надо делать ещё и валидацию ВД<->ВП по координатам. Но мне больше интересен вопрос из темы ниже. Если там надёжный источник, то во многих случаях можно будет не гадать по координатам, а достаточно точно установить соответствие. — Vort (обс.) 04:40, 1 октября 2021 (UTC)
                  • К сожалению я не помню про ОКТМО. Если реально важно, дай знать, спросим у Димы. 185.16.139.123 18:24, 2 октября 2021 (UTC)
                    • Зависит от желающих разгребать списки валидатора. Нет желающих — нет смысла их делать. Есть желающие — могу подумать над алгоритмом. — Vort (обс.) 18:28, 2 октября 2021 (UTC)
              • Или линии пересечения одинаковых параллелей/меридианов [4]. -- dima_st_bk 12:12, 29 октября 2021 (UTC)
                • Да, не сразу заметил, но при обработке списка эту особенность учёл.Vort (обс.) 15:27, 29 октября 2021 (UTC)

Источники для валидации[править код]

Случайно заметил, что вывод инструмента содержит колонку ОКТМО. По ней привязывать было бы надёжнее, чем по координатам. Но раз по координатам привязали, то по этой колонке можно провалидировать. Только вот во вкладке «Исходные коды» находится что угодно, но не источник для этих данных. Кто-нибудь знает, откуда они берутся? — Vort (обс.) 05:10, 29 сентября 2021 (UTC)

  • @Vort: ГКГН в PDF [5] + привязка по регион/район/название/тип [6]. Актуальность базы на конец 2019 года. Если руки дойдут, то обновлю (если оно нужно). -- dima_st_bk 11:28, 29 октября 2021 (UTC)
    • Понял, спасибо. Тут выше была ссылка на ODS, это получше, чем PDF. Но всё равно для такого типа привязки надо делать анализ качества сопоставления. Жаль, что не код <-> код. — Vort (обс.) 11:45, 29 октября 2021 (UTC)
  • d:Q4410451 — живой пример почему после всех заливок нужна будет валидация по координатам. Тут совпало название, регион и единичность объекта (вторая Светлушка не внесена в ГКГН). 185.16.139.251 15:01, 10 ноября 2021 (UTC)

Повторная перевязка по названиям и координатам[править код]

Ghuron исправил на ВД тысячи названий рек. Как я понимаю, первой проходкой сверялись именно они, а не названия статей в Рувике. Предлагаю сделать вторую перевязку по совпадению название/регион/координаты/тип=река/страна=Россия. 194.50.15.16 18:42, 7 ноября 2021 (UTC)

В случае с шаблонами сверял по названию статей, из ВД только коды брал. Я ж даже исходники выложил. Связь по координатам же делал для сёл. Что там по координатам свяжется, если алгоритм на реки направить — без понятия, но в качестве результата большие сомнения, так что пока что этим заниматься не буду. — Vort (обс.) 19:30, 7 ноября 2021 (UTC)
    • До перевязки из шаблонов была перевязка по названиям и типам. 194.50.15.16 19:39, 7 ноября 2021 (UTC)
  • Я делал довольно примитивную привязку примерно по следующим правилам:
  1. Найти список рек в РФ, вытащить из него те, у которых метка уникальна (то есть идентифицирует элемент в списке)
  2. Отфильтровать список ГКГН по рекам и оставить в нем те, у которых метка уникальна
  3. Сравнить списки, и если название совпадает — залить ГКГН
Насколько я помню, в таком подходе было некоторое количество ошибок (вы вроде бы меня отменяли в ВД). Вы уверены что это стоит прогнать ещё раз? В смысле мне несложно, но ненакосячить бы :) Ghuron (обс.) 06:50, 8 ноября 2021 (UTC)
  • Уникальность имеет смысл учитывать только при полноте. Чего ни в ВП, ни в ГКГН нет и не будет. По-моему важнее сопоставить координаты, они уникальнее названий, а на регион можно вообще не смотреть, он неявно присутствует в координатах. — Vort (обс.) 06:57, 8 ноября 2021 (UTC)
    • Нет, уникальность имеет смысл проверять чтобы не заливать ГКГН в «однофамильцев»
      Координаты — это не то, что я могу на коленке сделать в экселе Ghuron (обс.) 07:16, 8 ноября 2021 (UTC)
      • Теоретическая ситуация: существуют всего две реки с одинаковым названием: маленькая, есть в ГКГН, нет в ВП и очень маленькая, есть в ВП, но нет в ГКГН. Алгоритм их свяжет. Можно предположить, что такая ситуация маловероятна и ей стоит пренебречь. Возможно. — Vort (обс.) 07:35, 8 ноября 2021 (UTC)
      • Может, сравнивать все координаты со всеми в Екселе и неудобно. Но провалидировать уже готовые сопоставления уж точно можно. Вынуть географические координаты / указано для части: устье с ВД, теоремой Пифагора посчитать расстояние и сравнить с пороговым значением. — Vort (обс.) 07:57, 8 ноября 2021 (UTC)
  • Ghuron, методика проседает в моменте регионов, их лучше сравнивать. Также сразу надо убрать объекты ВД, где уже указан код ГКГН. Отменял я и Фантома, но заливку из сносок только исправлял — потому что за неё была моя часть ответственности. Я считаю, что надо заливать дальше, потому что хуже уже не будет: проще потом провалидировать всё залитое, чем вечность валидировать старое и ту же вечность вручную добавлять новое. 194.50.15.16 15:39, 8 ноября 2021 (UTC)
    • Результаты весьма скромные Ghuron (обс.) 07:19, 12 ноября 2021 (UTC)
      • Первый результат валидации по моему списку: два расхождения среди сопоставленных элементов:
Q36360274 - 512065
512065|Вурдъёль|река|Республика Коми| |65,8656608|57,8560015
169058|Вурдъёль|река|Республика Коми| |63,8515482|53,3274538
Q36360146 - 548736
548736|Веръёль|река|Республика Коми| |61,45831215|55,9601413
169152|Веръёль|река|Республика Коми| |63,9341306|53,7017933
Ещё есть куча отсутствующих сопоставлений. Надеюсь их проанализировать следом. — Vort (обс.) 08:09, 12 ноября 2021 (UTC)
  • @Ghuron: вот гистограмма расстояний по залитому: [7]. Вот список элементов, попавших в «хвост» (> 0.1): Special:Permalink/117827028. Стоит проверить эти элементы. — Vort (обс.) 08:38, 12 ноября 2021 (UTC)
      • И ещё немного комбинацией метка+субъектРФ. Дофига рек не имеют русской метки и много где не проставлен d:Property:P131 Ghuron (обс.) 13:06, 12 ноября 2021 (UTC)
        • Если кто-нибудь проверит «хвост» выше, сделаю новый по второй части заливки. — Vort (обс.) 14:49, 12 ноября 2021 (UTC)
  • Решил всё-таки прогнать своим алгоритмом реки. Результаты ещё не смотрел. Вот они: Special:Permalink/117767535, Special:Permalink/117767541, Special:Permalink/117767547. Может, буду обновлять после анализа, пока ещё не знаю. — Vort (обс.) 16:02, 8 ноября 2021 (UTC)
    • Сделал гистограмму расстояний и для рек. Чтобы лучше было видно, поменял масштаб: реки, сёла. Видно, что, во-первых, порог в 0.1 градус подходит и для рек, и, во-вторых, граница между правильной и ошибочной классификацией в случае рек более размыта (именно это я предполагал, когда говорил о качестве результата). Также обновил списки в сообщении выше. — Vort (обс.) 07:07, 9 ноября 2021 (UTC)