Ссылка-сокращение ВП:Ф-ИВ · ВП:Ф-ВД

Википедия:Форум/Викиданные: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Содержимое удалено Содержимое добавлено
Строка 11: Строка 11:
** Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 18:03, 6 декабря 2021 (UTC)
** Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 18:03, 6 декабря 2021 (UTC)
*** Это нам рассказывает [[У:Schekinov Alexey Victorovich|зарег]], расставивший [[Бюдель-Адами, Аделаида|в этой статье]] сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило [[ВП:ПРОВ]] написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — [[Special:Contributions/188.123.231.48|188.123.231.48]] aka [[Special:Contributions/188.123.231.25|.25]] 18:11, 7 декабря 2021 (UTC)
*** Это нам рассказывает [[У:Schekinov Alexey Victorovich|зарег]], расставивший [[Бюдель-Адами, Аделаида|в этой статье]] сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило [[ВП:ПРОВ]] написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — [[Special:Contributions/188.123.231.48|188.123.231.48]] aka [[Special:Contributions/188.123.231.25|.25]] 18:11, 7 декабря 2021 (UTC)
**** Л - Логика анонимная: «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 20:07, 7 декабря 2021 (UTC)
**** Л - Логика анонимная: 1) «Это нам...» - вот точно не вам. 2) «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» - список литературы он для чего? Думаем, осмысливаем самостоятельно. 3) «так-то нет в них ничего красивого» - вижно потому сабж их и поставил в СЛ. 4) разговор окончен. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 20:07, 7 декабря 2021 (UTC)


=== Итог ===
=== Итог ===

Версия от 20:13, 7 декабря 2021

Актуально
Выборы, присвоение и снятие флагов
Заявки на флаг ПИ
Список изменений в правилах
Работа для участников: Викиданные
Обновить

Связать

Эрдеи и английскую Erdélyi. Рефлексист (обс.) 17:35, 7 декабря 2021 (UTC)[ответить]

В ВД говорится, что она родилась в Варшаве, а в тексте польской статьи, что в Люблине. — @ → SAV © 16:09, 6 декабря 2021 (UTC)[ответить]

  • Коллега Schekinov Alexey Victorovich, насколько я могу видеть, ни на Викиданных, ни в польском разделе википедии не указан источник на место рождения. Вот Вам ссылка на первый встреченный на гуглобуксах биографический источник. — Jim_Hokins (обс.) 17:02, 6 декабря 2021 (UTC)[ответить]
  • Я вижу, что первым был создан элемент Викиданных (с Варшавой), а позднее — польская статья (тоже с Варшавой). А потом в польскую статью пришёл аноним с такой правкой. Ссылка, между прочим, работает, по ней рукописный документ на польском, который моя не понимай, однако вверху его стоит число 1853, совпадающее с годом, названным в описании правки. Считаю, пока не доказано иное, что аноним, утверждающий, что в середине XIX века в европейской стране то ли 7-, то ли 5-летняя девочка могла быть выдана замуж, позорит высокое звание анонима.:)) --83.220.227.242 17:33, 6 декабря 2021 (UTC).[ответить]
    • Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — @ → SAV © 18:03, 6 декабря 2021 (UTC)[ответить]
      • Это нам рассказывает зарег, расставивший в этой статье сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило ВП:ПРОВ написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — 188.123.231.48 aka .25 18:11, 7 декабря 2021 (UTC)[ответить]
        • Л - Логика анонимная: 1) «Это нам...» - вот точно не вам. 2) «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» - список литературы он для чего? Думаем, осмысливаем самостоятельно. 3) «так-то нет в них ничего красивого» - вижно потому сабж их и поставил в СЛ. 4) разговор окончен. — @ → SAV © 20:07, 7 декабря 2021 (UTC)[ответить]

Итог

Пусть МР будет Варшава. — @ → SAV © 17:59, 6 декабря 2021 (UTC)[ответить]

Перенос в Викиданные свойства "Код в «Экспресс-3»"

Привет!
Наткнулся на то, что гаждет переноса свойств из карточки в Викиданные не срабатывает для свойства "Код в «Экспресс-3»", если оно сопровождается источником. Пример статьи: Воденяпинский (станция). @Putnik, в чем тут может быть дело? Michgrig (talk to me) 15:07, 5 декабря 2021 (UTC)[ответить]

МС

Это нормально, когда из карточки выходит такое, через ВД:

Место смерти - Алжир, Франция[6] или Q98046137?[5]

,

где «Q98046137» - просто "населенный пункт, ьез единого названия, хоть на каком-либо языке?

Такое сразу сносить, или когданибудддить до победного? — @ → SAV © 03:30, 4 декабря 2021 (UTC)[ответить]

Там кнопочка есть - Все введённые языки. — Kareyac (обс.) 04:14, 4 декабря 2021 (UTC)[ответить]
Где хоть один введённый?@ → SAV © 07:17, 4 декабря 2021 (UTC)[ответить]
у меня показывает итальянский, норвежский букмол и нидерландский, кнопочку надо нажать и будет счастье или несчастье, придётся копать глубже. — Kareyac (обс.) 07:38, 4 декабря 2021 (UTC)[ответить]
Нашел. Ввёл пока по басурмански, но хоть понятно, где это. — @ → SAV © 09:45, 4 декабря 2021 (UTC)[ответить]

Обсуждение новых свойств в Викиданных

MasterRus21thCentury последнее время подаёт много заявок на создание идентификаторов в русскоязычных базах, за что ему большое спасибо. Но их обсуждает не так много участников, как хотелось бы. Поэтому я хотел бы пригласить всех интересующихся записаться в участники вики-проекта Россия в Викиданных, чтобы получать уведомления о новых заявках. — putnik 08:21, 3 декабря 2021 (UTC)[ответить]

Почему в карточке название задвоено? — Ghirla -трёп- 11:16, 28 ноября 2021 (UTC)[ответить]

  • Это не Викиданные. Проблему можно решить очисткой параметра «название», но, мне кажется, при переводе шаблона на карточку что-то было напутано — это особенно заметно, когда название статьи нерусское (пример; или это нормально?). --188.65.244.97 11:56, 28 ноября 2021 (UTC)[ответить]
  • Я так понимаю, что подтягивающееся с викиданных значение параметра |русское название = совпадает с прописанным в статье значением параметра |название =, а отображаются значения обоих параметров, поэтому название в карточке и выглядит задвоенным. — Jim_Hokins (обс.) 12:04, 28 ноября 2021 (UTC)[ответить]
  • На мой взгляд, тут основная проблема с тем, что параметры названы не так, как это обычно делается. То есть название отвечает не за основной заголовок, а за оригинальное название. По-хорошему, надо бы переименовать и заменить во всех статьях ботом, если кто-нибудь возьмётся. — putnik 12:15, 28 ноября 2021 (UTC)[ответить]

Три писателя-фантаста

В викиданных есть три очень схожих элемента писатель-фантаст (Q108710753), писатель-фантаст (Q28225718) и писатель научной фантастики (Q18844224) (являющийся подклассами первых двух!). При этом по-английски разница в них более осязаемая (speculative/fantastic fiction writer (Q108710753), science fiction author (Q28225718) и science fiction writer (Q18844224). Нашёл это я когда пытался понять, откуда отвязалось перенаправление писатель-фантаст и куда бы его надо вернуть. Категория ссылается на Q108710753, но при этом такая профессия указана всего у двух человек. Я, если честно, немного запутался, и думаю, что категория и перенаправление должны относиться к Q18844224, но какие должны быть у всех этих элементов понятные описания, не очень соображу. windewrix (обс.) 14:14, 23 ноября 2021 (UTC)[ответить]

  • Никто не соображает. Fiction - это в смысле не публицистика, не документалистика, не исторически достоверные произведения. Обычно — "художественные произведения", но мне не очень понятен момент с исторически достоверной литературой, так как она вполне художественная в смысле искусства слова. Далее, автор — вроде бы проще: это не только писатель, но и музыкант, художник, фотограф и др. Соответственно на стыке fiction и author получаются "музыканты, художники, фотографы, создающие произведения о вымышленном" (если они это могут, что, например, не так просто для музыканта... или вообще единственное, что может создавать музыкант ;) ). С writer проще всего - это так и будет "писатель". Science fiction - научная фантастика (если не углубляться в национальные особенности жанра).
    Поэтому:
    d:Q108710753 — "писатель спекулятивной фантастики" либо "писатель спекулятивной литературы". И в России таких, по идее быть не может, в силу отсутствия теории.
    d:Q28225718 — "автор художественных произведений" (включает не только литературу, но и другие искусства)
    d:Q18844224 — "писатель-фантаст", Категория:Писатели-фантасты должна ссылаться сюда. Igel B TyMaHe (обс.) 15:40, 23 ноября 2021 (UTC)[ответить]

На викиданных есть возможность разместить ссылку для отображения в статье только на персоналию и на клуб (ниспадающее меню-окошко на «FootballFacts.ru player ID» и «FootballFacts.ru team ID»). На стадион — никак, или можно без выбора ниспадающего списка как-то сделать? https://footballfacts.ru/stadium/900-stadiongazovik в Газовик (стадион). - 5.250.170.7 12:51, 22 ноября 2021 (UTC)[ответить]

Сверлильные станки

d:Q2211295 vs. d:Q20820500 - ? Правильно ли я понимаю, что русское Сверлильно-расточная группа станков следует, как понятие собирательное, вынести в свой особый уголок, а всё прочее (просто сверлильные станки) смёржить вместе? Русская группа включает, в том числе, станки с горизонтальным шпинделем, которые исключаются, например, в de:Ständerbohrmaschine. Retired electrician (обс.) 04:55, 22 ноября 2021 (UTC)[ответить]

Певческий голос

В процессе беседы про другое выяснилось, что у нас довольно много статей, куда с ВД подтягивается, даже при отсутствии соответствующей строчки в карточке, свойство "Певческий голос", помещающее статью в одну из подкатегории внутри категории Категория:Певцы и певицы по голосам. Проблема в том, что на Викиданных это свойство ставят кому ни попадя, а должно оно стоять только у академических вокалистов: поп-, рок- и т. д. певцам категория голоса не определяется. Отследить, кому из многих тысяч певцов сегодня притащат эту строчку в ВД, нет никакой возможности. Я убрал на ВД возможность выставлять тип голоса кому-либо, кроме певцов, но оставить возможность выставлять его только оперным певцам не могу, потому что бывают академические вокалисты, которые не поют в опере (а поют, скажем, только романсы), и для них на ВД нет отдельного класса. Что делать? По идее все исполнители академической музыки должны попадать в одну из подкатегорий Категория:Академические музыканты. Можно ли подавить вывод свойства "Певческий голос" (и в карточку, и в категории) для статей, не входящих в эту ветку дерева категорий? Или, вернее, сперва собрать список статей, в которые это свойство выводится и которые не входят в эту ветку, чтобы проверить, не надо ли какие-то из них в эту ветку включить? Андрей Романенко (обс.) 00:57, 22 ноября 2021 (UTC)[ответить]

  • Правка на ВД довольно решительная, можно договориться в одном проекте признавать обладателями типов голосов только академистов (включая народников?), но по многим эстрадникам тип голоса проставляется на основе публикаций того же уровня, как источники всех остальных сведений в статьях. На основе каких более авторитетных источников Тони Брэкстон можно раз и навсегда запретить быть контральто и означить повсеместно распространённое расширительное толкование «маргинальным»?
Для технического решения раньше обсуждали создание отдельного шаблона: Обсуждение проекта:Музыка/Архив/2018#Шаблон:Музыкант-2188.123.231.25 aka .2 08:42, 22 ноября 2021 (UTC)[ответить]
  • Запретить Брэкстон быть контральто, а Эминему - тенором можно по элементарным культурным различиям: если русскоязычные авторитетные в голосах источники не употребляют к их голосам данные термины, то иноязычные источники идут лесом. Igel B TyMaHe (обс.) 10:35, 23 ноября 2021 (UTC)[ответить]
    • Всё то же ОРИСС, пока не показано по АИ, что tenore переводится на русский не (только) как «тенор I: тип голоса оперного певца, определяемый в зависимости от тесситуры», а (ещё и) как «перен. тенор II: тип голоса певца или актёра, пользующегося эстрадной манерой пения (постановкой голоса) либо не поющего, определяемый в зависимости либо от тесситуры, либо от особенностей тембровой окраски». — 188.123.231.25 14:34, 23 ноября 2021 (UTC)[ответить]

Только что исправил координаты в статье. Вижу в карточке трудночитаемые значения параметров в поле "Соседние о.п." Полез разбираться. Догадываюсь, что эти наименования идут с Викиданных. Но не пойму главного. В шаблоне-карточке {{Железнодорожная станция}} вообще отсутствует такой параметр! Как он появляется тогда в карточке? И как это исправить на нормально читаемые названия "Полесский Парк" и "Пригородный"? — 193.233.70.48 12:21, 15 ноября 2021 (UTC)[ответить]

Для исправления надо было добавить русские метки: вот так. — Vort (обс.) 12:26, 15 ноября 2021 (UTC)[ответить]
Хорошо, это понял. А что по поводу механизма отображения этой информации? В документации шаблона не указан параметр "Соседние о.п." И упс - одно наименование показано в виде красной ссылки, другое вообще без ссылки. — 193.233.70.48 12:37, 15 ноября 2021 (UTC)[ответить]
Есть параметр Предыдущая, но я нигде не вижу его заполненным. Наверно, функции заполнения из Викиданных хватает. — Vort (обс.) 12:41, 15 ноября 2021 (UTC)[ответить]
К элементам Викиданных не привязаны статьи рувики, поэтому нет нормальных ссылок. — Vort (обс.) 12:42, 15 ноября 2021 (UTC)[ответить]
  • Я, честно говоря, тоже задавался вопросом, почему, если нет связанной статьи в рувики, в одном случае показывается красная ссылка, а в другом вообще нет ссылки. Michgrig (talk to me) 22:11, 15 ноября 2021 (UTC)[ответить]
    • Как и для текста ссылки, для названия несуществующей статьи, на которую она будет вести, используется метка элемента Викиданных. Но так как она не уникальна, то уже может существовать другая статья с такой же меткой. Чтобы не делать некорректную ссылку, в таком случае показывается просто текст. Если кто-то предложит вариант, как в таком случае генерировать уникальное название статьи, то можно попробовать добавить другую логику. — putnik 00:21, 16 ноября 2021 (UTC)[ответить]

Поправьте плз, чтобы ссылка из этой статьи вела не на Пол Уильямс, а на Уильямс, Пол (артист). — Igor Borisenko (обс.) 19:20, 12 ноября 2021 (UTC)[ответить]

Устранение дублей элементов населённых пунктов Курганской области

В результате анализа списка Участник:Vort/PpCodes обнаружил кластер статей с дублированными элементами. Предлагаю заняться их слиянием. Для этого достаточно открыть Шаблон:Населённые пункты Далматовского района и прокликивать ссылки в поисках статей без интервик. Затем в uk:Шаблон:Далматовський район искать соответствующие статьи, открывать элементы и вызывать скрипт объединения. Чтобы не ошибиться, стоит сравнивать население (обычно стоит за 2010 год). Пример: Бабинова -> стоят интервики, идём дальше: Белое (Далматовский район) (67, 2010) -> d:Q108786525, uk:Біле (Далматовський район) (67, 2010) -> d:Q27578041, можно объединять (заодно в объединённом элементе можно убрать это : населённый пункт, так как там, скорее всего, будет стоять более точный тип). В других районах то же самое: Шаблон:Населённые пункты Звериноголовского района + uk:Шаблон:Звіриноголовський район, Шаблон:Населённые пункты Катайского района + uk:Шаблон:Катайський район, Шаблон:Населённые пункты Кетовского района + uk:Шаблон:Кетовський район. Некоторые из районов я уже пообъединял, с некоторыми до меня кто-то справился. Так что если во многих статьях района есть интервики, стоит переходить к следующему. — Vort (обс.) 11:19, 7 ноября 2021 (UTC)[ответить]

Категория ставится шаблоном из Викиданных

Конкретно, карточка "Организация" проставляет категорию Категория:Лауреаты Нобелевской премии мира, беря информацию из Викиданных. На параметр nocat не реагирует. Что делать, если требуется поставить не эту категорию, а Категория:Организации, удостоенные Нобелевской премии мира? Данный вариант не предусмотрен. Разберитесь. -- Badger M. (обс.) 09:21, 7 ноября 2021 (UTC)[ответить]

  • В коде шаблона {{организация}} это делает строчка |викиданные51 = p166, однако просто убирать её оттуда не надо (этот код не только ставит категорию, но и заполняет графу «Награды» в карточке). Можете вместо шаблона {{организация}} использовать шаблон {{некоммерческая организация}}, а категорию добавлять руками (но в этом случае и наград в карточке не будет). Гамлиэль Фишкин 02:21, 8 ноября 2021 (UTC)[ответить]
  • Чтобы меньше пришлось разгадывать, статья, в которой это наблюдается: Американский комитет Друзей на службе обществу
    nocat пробросить дело нехитрое, но нужно ли именно оно тут? ·Carn 05:06, 8 ноября 2021 (UTC)[ответить]
  • Я вчера пытался на викиданных разграничить категории, присваиваемые лауреатам премии, в зависимости от их принадлежности к людям или организациям, но, к сожалению, так и не сумел подобрать верный вариант настройки такого разграничения. — Jim_Hokins (обс.) 05:48, 8 ноября 2021 (UTC)[ответить]
    • Тут два важных момента. Во-первых, свойство категорий сейчас исключительно для людей. Добавление для него новых сущностей вполне можно обсудить в Викиданных, там же можно обсудить подходящую для этого структуру. Во-вторых, есть локальный код модуля, который должен поддерживать эту структуру. Сейчас в нём нет ничего подобного. Так что, к сожалению, ваша идея попробовать подобрать ограничения изначально была обречена на провал. — putnik 07:50, 8 ноября 2021 (UTC)[ответить]
      • Понятно. Спасибо за разъяснение! Буду знать. Жаль, что не знал этого раньше, не тратил бы время. :-)Jim_Hokins (обс.) 09:33, 8 ноября 2021 (UTC)[ответить]
      • Если дело обстоит так, как Вы говорите, тогда ещё проще -- это банально ваш косяк. Ну так исправляйте. -- Badger M. (обс.) 14:12, 8 ноября 2021 (UTC)[ответить]
        • Я отвечаю на этом форуме и поддерживаю довольно большое количество кода в Википедии, чтобы людям становилось лучше. В первую очередь тем людям, которые мне приятны. Так что запросы от хамов я выполняю в последнюю очередь. — putnik 02:47, 9 ноября 2021 (UTC)[ответить]
          • Кто бы говорил? Консенсус на реализацию подкачки из Викиданных предъявите. Иначе по умолчанию вынужден считать Вас пушером. -- Badger M. (обс.) 08:36, 9 ноября 2021 (UTC)[ответить]
            • Вы меня можете считать кем хотите, это полностью ваше право. Особенно, если вы сможете это выражать корректно без нарушения ВП:ЭП. Но если же вы хотите от меня хотите добиться какой-то помощи, то я уже вам выше написал, что это худшая стратегия из всех возможных. Хотя, возможно, я всё неправильно понял, и ваша цель состоит совсем не в исправлении проблемы. В таком случае не буду вам мешать. — putnik 17:39, 9 ноября 2021 (UTC)[ответить]
              • Нарушение ВП:ЭП (явное) я вижу разве что в Вашей реплике. От Вас мне ничего не требуется (о проблеме поставлены в известность, и ладно). Вас же я просил дать ссылку на упомянутый консенсус о реализации подкачки в карточки из Викиданных, не более. -- Badger M. (обс.) 18:22, 9 ноября 2021 (UTC)[ответить]
    • Извиняюсь, про первое я ошибся. Категории не только для людей (я увидел в тот раз ограничение свойства, но не перепроверил, что именно оно запрещает), но конкретного формата, как должны указываться несколько категорий (и должны ли, потому что сейчас стоит ограничение на одно значение) всё же нет. — putnik 07:25, 9 ноября 2021 (UTC)[ответить]
  1. Скорректировать getRecipientCategoryFromEntity в Модуль:Wikidata/Medals примерно как тут: Модуль:Wikidata#L-1336 (т.е. брать из прилетевшего селектора, а если он не указан, то из P2517)
  2. Навставлять в викиданных аналогичных утверждений для подкатегорий Категория:Награждённые организации
Ghuron (обс.) 08:04, 10 ноября 2021 (UTC)[ответить]

Устаревшие названия рек

На ВД тысячи рек всё ещё носят устаревшие названия, как они были залиты из первой версии ГВР. Кто может всё исправить? К:Реки по алфавиту. 185.16.139.144 17:39, 2 ноября 2021 (UTC)[ответить]

Бот-создатель элементов

Сейчас тысячи статей не имеют элементов ВД. Предлагаю сделать бота, который бы ждал неделю от момента создания статьи, а затем делал новый элемент со страной и типом. Тип можно брать из алфавитных категорий, страну из параметров карточки. Недельная задержка нужна, чтобы желающие успевали связывать интервики и выставлять на удаление. С шаблоном КУ/КБУ/КОБ понятно игнорировать. 185.16.137.60 08:59, 22 октября 2021 (UTC)[ответить]

Не всегда элемент надо создавать. Часто надо просто найти. — Vort (обс.) 09:02, 22 октября 2021 (UTC)[ответить]
Инструментами ВД дубликаты обнаружить проще. Кроме того, никто этим не занимается: полагаю, объектов без элемента с каждым днём больше. 185.16.137.60 09:04, 22 октября 2021 (UTC)[ответить]
Проблема ещё и в том, что объекты создаёт d:user:GZWDer (flood) вот в таком виде: Q97315412. Уж лучше нормальный дубликат, чем вот это рукожопие, которое также может быть дубликатом, но уже сложным для выявления. 185.16.137.60 09:40, 22 октября 2021 (UTC)[ответить]
Уже не создаёт. Кстати, не одному мне не нравится такая деятельность. — Vort (обс.) 09:54, 22 октября 2021 (UTC)[ответить]
Ну так он годами это делает, ещё с 2015 если не ошибаюсь. И дальше будет. Создавать нормальные элементы с опознавательными характеристиками наперёд этого бота — меньшее из зол, да ещё с положительным эффектом в большинстве случаев. Интервик реально нет для очень многого из создаваемых здесь статей. И если интервику, скажем, целый год никто не искал, чего ждать-то? 185.16.137.60 10:17, 22 октября 2021 (UTC)[ответить]
Сейчас он в бане. — Vort (обс.) 10:19, 22 октября 2021 (UTC)[ответить]
А, не так прочёл. Появятся другие… 185.16.137.60 10:20, 22 октября 2021 (UTC)[ответить]
По сути вопроса: подождём ещё мнений. — Vort (обс.) 10:20, 22 октября 2021 (UTC)[ответить]
  • Справа в разделе «Работа для участников» в третьей строчке ссылка на duplicity. В статистике видна пила, т.е. раньше кто-то (GZWDer) создавал элементы пачками. Ghuron (обс.) 11:52, 22 октября 2021 (UTC)[ответить]
    • То есть без бота получаем непрерывный рост прямо в космос. Никто статьи не перевязывает. Так и не понял что там за ерунда в подписях дат. 185.16.137.60 12:19, 22 октября 2021 (UTC)[ответить]
      • Я не уверен что тут поможет бот — много хитрых случаев, например, у людей страну писать нельзя (можно гражданство, но я бы его импортировать из наших категорий не стал бы).
        Я сейчас зарядил литься дизамбиги по следующему сценарию:
  1. Копи-пастим из дуплисити в эксель, вырезаем все лишнее, оставляя только названия статей
  2. Создаем табличку с 5 колонками:
    1. qid оставляем пустой
    2. Sruwiki название статьи (я делаю в кавычках, но, возможно, и не надо)
    3. Lru название статьи без уточнения в скобках
    4. Dru "страница значений"
    5. P31 Q4167410
  3. копипастим в текстовый редактор и заменяем табуляцию на запятые
  4. скармливаем в QuickStatements под видом CSV commands
подробная справка по формату: d:Help:QuickStatements#CSV file syntax
По аналогии можно попробовать лить другие Ghuron (обс.) 13:09, 22 октября 2021 (UTC)[ответить]

Есть хороший инструмент для поиска существущих и быстрого создания новых элементов Duplicity (как раз с минимальным наполнением). Ещё один Match new articles to items, увы, отключен. Рекомендую дать линк на первый в раздел «Работа для участников». — Kareyac (обс.) 13:09, 22 октября 2021 (UTC)[ответить]

  • Паттерны, которые прослеживаются при прокликивании элементов в Duplicity:
    1) много страниц неоднозначностей, возможно их действительно стоит создавать ботом с нужным значением P31;
    2) страницы, у которых после переименования элемент остался привязанным к перенаправлению — очень странный случай, вроде бы раньше был бот, который это исправлял;
    3) темы, лучше всего описанные в русскоязычных источниках, с большой вероятностью без существующих элементов.
    Возможно, если расчистить две первые категории ботами, то ситуация значительно улучшится, и будет проще привлекать участников к работе с тем, что не поддаётся автоматизации. — putnik 09:43, 1 ноября 2021 (UTC)[ответить]

Есть карточка. В карточке есть графа "Участники". В ней указаны Лесли Гровс и Роберт Оппенгеймер, руководители проекта, что верно. Но почему-то перед ними указаны Lilli Hornig (по которому даже нет русскоязычной статьи) и Ву Цзяньсюн. Непонятно, почему из десятков ученых-участников проекта указаны эти двое (и отнюдь не самые известные). Правильно было бы указать как руководителей Гровса и Оппенгеймера, а дальше указать "и многие другие" со ссылкой на ru:Категория:Участники Манхэттенского проекта. Но как это сделать я не знаю. Сделайте! 109.252.201.66 12:32, 19 октября 2021 (UTC)[ответить]

  • Я передвинул Оппенгеймера с Гровсом на первые места и указал им приоритетный ранг, так что теперь в карточке выводятся только они. Не вижу проблемы, что другие значимые персоны тоже будут перечислены с нормальным рангом, если их, конечно, будет не 130 тысяч. Ну и вы всегда можете указать в карточке локально что-то другое. — putnik 21:25, 19 октября 2021 (UTC)[ответить]

Спасибо! Ещё там есть графа "Место проведения", где почему-то указано "Реактор В". В качестве "места проведения" стоило бы указать просто "США", так как объектов было несколько (Лос-Аламос, Оак-Ридж, Хенфорд, Чикагский университет). 109.252.201.66 11:47, 20 октября 2021 (UTC)[ответить]

Предки, шаблон

Тут, оказывается, опять придумали какое-то эзотерическое знание, с которым я обычно не сталкиваюсь, поскольку не правлю про королей и т.п. Вот смотрите: Вильгельм_Франц_Габсбург-Лотарингский#Предки. Из того, что мы видим в правом верхнем углу этого родословного древа, ясно, что император Леопольд был, внезапно, женат на герцоге Тешенском, а императрица Мария Луиза - замужем за герцогиней. И я вообще не могу понять, где это исправить. Андрей Романенко (обс.) 21:20, 17 октября 2021 (UTC)[ответить]

  • Насколько я смог понять это генеалогическое дерево, и император Леопольд и герцог Тешенский указаны в качестве отцов Карла Австрийского (а не в качестве супругов друг друга), а Мария Луиза и герцогиня Тешенская — в качестве матерей (аналогично). Нужно ли указывать приёмных родителей в генеалогическом дереве — другой вопрос. — Jim_Hokins (обс.) 04:40, 18 октября 2021 (UTC)[ответить]
    • Верю, что вы правы, но 1) выглядит это совершенно дико, и 2) вообще нет ни малейшей возможности разобраться, где внести изменения, если в такой схеме что-то вызывает вопросы. Андрей Романенко (обс.) 14:54, 18 октября 2021 (UTC)[ответить]
      • 1) Выглядит не очень понятно, согласен. 2) Судя по документации шаблона, информация полностью берётся из викиданных. Я так понимаю, что если нужно изменить какого-нибудь предка, надо изменить родителя на странице ребёнка этого самого предка в викиданных. То есть, например, если нужно убрать из обсуждаемого генеалогического дерева вышеупомянутого герцога Тешенского, нужно удалить его из параметра «отец» на странице Карла Австрийского в Викиданных. Возможно (возможно), достаточно будет присвоить ему нерекомендуемый ранг, но в этом я точно не уверен, а тестировать не хочу. — Jim_Hokins (обс.) 16:27, 18 октября 2021 (UTC)[ответить]
        • Всё, до меня дошло. Там у герцога и герцогини Тешенских стоит же квалификатор "приёмные родители". Значит, задача сводится к тому, чтобы разграничить способы выведения родителей в карточках и шаблонах в зависимости от того, родные они или приёмные. Я только не понимаю, где это должно обсуждаться - у нас или на Викиданных. Андрей Романенко (обс.) 17:18, 18 октября 2021 (UTC)[ответить]
          • У нас. Наверное, здесь. Надо, чтобы при наличии "приёмные родители" информация из Викиданных не подгружалась. Правда автор шаблона сейчас неактивен, но может кто-то ещё возьмётся исправить. Vladimir Solovjev обс 19:50, 18 октября 2021 (UTC)[ответить]
            • Запрос-то этот, может, технически и несложный, но его ещё как-то додумать надо до конца. Я бы осторожно предположил, что приёмные родители не должны подгружаться только в том случае, если наряду с ними указаны и родные, а если родных нет, то пусть подгружаются приёмные. Но тут бы хорошо бы какого-то специалиста именно по королевским династиям спросить, как правильно. Кто бы это у нас мог быть? Андрей Романенко (обс.) 22:49, 18 октября 2021 (UTC)[ответить]

Викимапия

Может у кого есть мысли как автоматизировать перевязку? См. ВП:Ф-ГЕО#Викимапия. 194.50.15.241 05:55, 14 октября 2021 (UTC)[ответить]

В карточку статьи из ВД импортируется некорректная информация («рум. Tiraspol» — румынский язык вместо молдавского). Соответствующий элемент в ВД защищён до уровня автоподов, подавить импорт непосредственно черед код статьи не получается. Просьба оказать содействие с исправлением некорректной информации; также прошу указать, как в подобных ситуациях корректно и результативно подавлять некорректные данные, импортируемые из ВД. С уважением, — Полиционер (обс.) 18:08, 12 октября 2021 (UTC)[ответить]

Похоже на ошибку где-то в шаблонах. — Vort (обс.) 18:19, 12 октября 2021 (UTC)[ответить]

Заливка ГКГН в Викиданные

Кто-то мог бы осуществить заливку d:Property:P1397 при помощи шаблона шаблон:ГКГН? Свойство почти не заполнено (608 на ВД против 7706 здесь), но позволяет осуществлять быструю валидацию названий и координат. Первично достаточно проверить, чтобы шаблон использовался в статье один раз (по таким случаям сделать список к ручному разбору), остальные мелкие ошибки всплывут в отчётах по дубликатам на ВД. 185.16.136.13 13:46, 14 сентября 2021 (UTC)[ответить]

Заливка из шаблонов и списка

  • harvest templates? Ghuron (обс.) 02:55, 15 сентября 2021 (UTC)[ответить]
  • Вопрос (наивный, но от сторонника интеграции с ВД): а что мешает просто залить полностью ГКГН в ВД? То есть названия статей не всегда понятны, но в шаблоне по населению (например) они ведь уже готовые? — Vulpo (обс.) 19:01, 15 сентября 2021 (UTC)[ответить]
    • Полагаю, что могут существовать недалеко друг от друга объекты с одним и тем же названием и алгоритм заливки их попутает. Если же координат в элементе ВД нет, так вообще не будет понятно, куда привязывать, так как в таком случае идентичных наименований будет совсем много. — Vort (обс.) 05:46, 16 сентября 2021 (UTC)[ответить]
    • Ещё могут быть различающиеся (при этом равноправные) написания названий одного и того же объекта. — Vort (обс.) 05:48, 16 сентября 2021 (UTC)[ответить]
    • Технически залить можно табличку из двух колонок: идентификатора викиданных (вида QXXXX) и, собственно, семизначного регистрационного номера. Вот тут есть 170 pdfок, которые можно превратить в одну большую табличку (если гугль-док нам не окончательно заблочили), и потом попытаться по названию и «типу объекта» получить корректный идентификатор викиданных. Я готов помочь в том, что касается собственно викиданных, но тут много ручной работы, а времени у меня почти нет Ghuron (обс.) 06:19, 16 сентября 2021 (UTC)[ответить]
      • Неужели технологии уже дошли до корректного импорта pdf`ок? Не пользовался гугл-доками, но про то, что pdf привести в приемлемый вид алгоритмически непросто, в курсе. — Vort (обс.) 06:28, 16 сентября 2021 (UTC)[ответить]
        • Ну pdfка pdfке рознь, я попробовал скопипастить текст из алтайского края, он в целом вставляется нормально. Разбиение на столбцы пропадает, но это поправимо, хотя, конечно, и потребует значительной ручной (а не алгоритмической) работы. Ghuron (обс.) 06:58, 16 сентября 2021 (UTC)[ответить]
          • Дарю. Но протяжённые объекты всё равно так не получится залить, для тех же рек логично взять из ref. 194.50.12.142 08:10, 16 сентября 2021 (UTC)[ответить]
            • На случай если кто-то решит делать заливку по этой таблице, хотелось бы знать методику её получения. — Vort (обс.) 08:19, 16 сентября 2021 (UTC)[ответить]
            • А он спецом по 812530 обрезан или это у меня эксель не справился? Ghuron (обс.) 08:55, 16 сентября 2021 (UTC)[ответить]
            • Попробовал сделать примитивный матчинг по сёлам. Расстояние < 0.1 градуса, полное совпадение по уникальному имени. Из 637441 записи ГКГН и 21745 записи ВД удалось сопоставить всего 39 записей. Но этот результат явно можно улучшать. Может, даже на 1-2 порядка. Если кому-то интересно посмотреть на результаты, то они в скрытом блоке:
Vort (обс.) 09:44, 16 сентября 2021 (UTC)[ответить]
Vort, судя по выхлопу куда эффективнее обработать ref в Рувике и просто сопоставить названия — 5500+ новых привязок гарантировано. 194.50.12.142 10:34, 16 сентября 2021 (UTC)[ответить]
Да полезно и то, и другое. Попробую разобраться, почему такой слабый результат. Наверно в ВД полно названий со скобками. — Vort (обс.) 10:36, 16 сентября 2021 (UTC)[ответить]
Загадка какая-то. В выгрузке из ВД оказались попутаны широта и долгота. Разбираюсь. — Vort (обс.) 10:49, 16 сентября 2021 (UTC)[ответить]
Ага, выше — список ошибок с перевёрнутыми координатами. Вот так случайно создал валидатор. Скоро нормальный список подготовлю. — Vort (обс.) 10:57, 16 сентября 2021 (UTC)[ответить]
  • Это больше разведка. До качественного списка ещё далеко. К примеру, в версии №2 очень много расхождений по кодам. Может, устаревшие. Может, надо 0.1 градус в 0.01 превращать. Может, без добавления обработки АТЕ ничего толкового не выйдет. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)[ответить]
Теперь другое дело: список. 12173 записи. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)[ответить]
Проверил типы в этой (второй) версии. Получилось вот так:
Для версии номер три оставил только село, деревня, посёлок: Special:Permalink/116681436, всего 10763 + 196 + 63 = 11022 записи. — Vort (обс.) 11:45, 16 сентября 2021 (UTC)[ответить]
Оценка количества ошибок в 3й версии: ~0.3%. Неплохо, думал будет хуже. Только в одной записи (с заполненным кодом) вышло расхождение — Q4319356. Случай близкого расположения, кстати: https://imgur.com/a/UOM4wLb. Такое только по типам можно отфильтровать (при условии их корректного задания в Викиданных). — Vort (обс.) 12:01, 16 сентября 2021 (UTC)[ответить]
Построил гистограмму распределения расстояний между одноимёнными объектами. Видно, что наугад выбранная граница в 0.1 градус почти идеальна: https://imgur.com/a/JpuvsJ7. — Vort (обс.) 12:47, 16 сентября 2021 (UTC)[ответить]
Более полная версия (убрал требование уникальности имени для выгрузки из ВД, толку от него было мало) №4: Special:Permalink/116682460. Получилось 18033 записи. Примерно 83% из выгрузки ВД удалось сопоставить. По дублям (ошибкам сопоставления) отдельно буду таблицу делать. — Vort (обс.) 12:56, 16 сентября 2021 (UTC)[ответить]
Случаи, когда для одного элемента ВД находится несколько элементов ГКГН:
Случаи, когда для одного элемента ГКГН находится несколько элементов ВД:
Vort (обс.) 13:15, 16 сентября 2021 (UTC)[ответить]
Vort, их нет нужды мониторить, все дубликаты всплывают в отчёте на ВД: d:Wikidata:Database reports/Constraint violations/P1397. 194.50.12.142 14:55, 16 сентября 2021 (UTC)[ответить]
Идея в том, чтобы их не создавать. То есть, вручную обработать то, что для алгоритма слишком сложное. Я смогу исключить уже заполненные элементы из формируемого списка. — Vort (обс.) 15:08, 16 сентября 2021 (UTC)[ответить]
Да, чуть позже догадался. Тем не менее в таком формате, как представлен выше, разбирать список явно никто не будет. Я бы предпочёл разбирать отчёты Викиданных, где список имеет понятную структуру. Или в любом другом месте, но с позициями и со ссылкой на валидатор (есть в местном шаблоне). В любом случае вручную разобранное быстрее сразу заносить на ВД, чем формировать список и потом отдавать боту. Так что всё что уже однозначно идентифицировано надо заливать. 194.50.12.142 15:16, 16 сентября 2021 (UTC)[ответить]
Разобрать список так, чтобы в следующий раз при проходе алгоритма он оказался пустой — это я и имею в виду. Докидать ссылок — не проблема. Обновил списки выше. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)[ответить]
  • @Ghuron: как я понимаю, u:ShinePhantom решил, что заливка с дублями — это нормально. Такой вариант тоже годится. Если кто-то потом расчистит дубли. Мне было важно, чтобы кто-то заливкой подтвердил, что мой список пригоден. Что и произошло. На всякий случай выкладываю упрощённый список с недозалитыми остатками (v5): Special:Permalink/116694490. Код для формирования (на всякий случай):
Vort (обс.) 06:51, 17 сентября 2021 (UTC)[ответить]
Vort (обс.) 10:22, 17 сентября 2021 (UTC)[ответить]
С lat <-> lon уже сам разобрался, тот список можно не смотреть. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)[ответить]

Заливка из сносок

templ_fail — то ли не нашёлся шаблон, то ли нашлось несколько. val_fail — нетрадиционный формат у идентификатора. no_gkgn_id_in_db — нет кода в базе. name_mismatch — не совпадает название в базе и заголовок статьи (с минимальной нормализацией). Хотелось, чтобы кто-нибудь проверил результат и залил, если результат годный. Процент ошибок на этот раз не оценивал. — Vort (обс.) 12:18, 21 сентября 2021 (UTC) (Списки ошибок и заливки обновлены 13:07, 22 сентября 2021 (UTC))[ответить]
Код не очень качественный, но всё равно выкладываю, для желающих проверить методику: https://github.com/Vort/WikiTasks/tree/wp_gkgn_exportVort (обс.) 12:21, 21 сентября 2021 (UTC)[ответить]
По templ_fail — не знаю насколько распространено, но только что был случай одного объекта просто на разные даты. Это надо заливать. 194.50.13.235 17:30, 21 сентября 2021 (UTC)[ответить]
Ещё бывает, что объект в нескольких АТЕ и из-за этого два шаблона. Но вот что проще — прописывать все эти хитрости в код или обработать вручную — не знаю. Ну, как минимум, можно начать с name_mismatch. Там большая часть — реальные проблемы. Особенно «Суровручей». — Vort (обс.) 17:37, 21 сентября 2021 (UTC)[ответить]
val_fail исправил. Среди no_gkgn_id_in_db надо отсечь всё что свыше 812530 — этого в файле просто нет. 194.50.13.235 17:49, 21 сентября 2021 (UTC)[ответить]
Я ж их провалидировать не могу. 3 штуки можно перенести вручную. Насчёт повторного запуска — не знаю. Может, всё из списка выше стоит вручную обработать. Ну либо как-то договориться. — Vort (обс.) 17:53, 21 сентября 2021 (UTC)[ответить]
Vort, name_mismatch слишком много, их надо бы в отдельный список и на форум к разбору. Заливать не надо, понятно. То есть хотелось бы выше увидеть список с обновлением val_fail, без no_gkgn_id_in_db свыше 812530 и без name_mismatch. 194.50.13.235 17:55, 21 сентября 2021 (UTC)[ответить]
Я сейчас пытаюсь НП скачать, не хочу, чтобы сервер меня послал. Большие no_gkgn_id_in_db исключить из списка могу, но на заливку их не помещу, так как не провалидированы :) Чуть позже обновлю, в общем. — Vort (обс.) 17:58, 21 сентября 2021 (UTC)[ответить]
По no_gkgn_id_in_db всё оказалось не так просто. Эти объекты или утеряны в файле или были удалены из реестра. Надо изучать досконально все случаи. Хочу спросить, это анализ вообще всех статей или только без кодов ГКГН на ВД? Список всего что пропало был бы полезен. 194.50.13.235 18:28, 21 сентября 2021 (UTC)[ответить]
Без Викиданные: указано свойство: код ГКГН. Поэтому писал, что процент ошибок не оценивал. Полная валидация — это отдельная задача, сейчас бы залить. — Vort (обс.) 19:14, 21 сентября 2021 (UTC)[ответить]
По-моему все препятствия к заливке устранены: исключаем name_mismatch, no_gkgn_id_in_db и в путь. По templ_fail взять самый первый код и сравнить название, вручную 125 записей проверять некому. 194.50.13.235 19:19, 21 сентября 2021 (UTC)[ответить]
Первая попавшаяся статья: Островня (приток Москвы). Тут вообще, похоже, оба кода имеют право быть залитыми. Так что с заливкой первого попавшегося — это не ко мне. — Vort (обс.) 19:25, 21 сентября 2021 (UTC)[ответить]
Да, оба заливать. Ниже сделал список по templ_fail, его можно заливать, каждую позицию проверил. 194.50.13.235 20:27, 21 сентября 2021 (UTC)[ответить]
Кеш поиска тупит, я уже 5xxxxxx прописал вручную, purge сделал, а всё равно в списке всплыли. Так что обновилось только частично. — Vort (обс.) 19:21, 21 сентября 2021 (UTC)[ответить]
Уже прочистился. — Vort (обс.) 19:32, 21 сентября 2021 (UTC)[ответить]
Вот name_mismatch отдельно:
Vort (обс.) 19:32, 21 сентября 2021 (UTC) (обновлено 04:04, 22 сентября 2021 (UTC))[ответить]
Vort, в этом списке больше половины можно заливать, из 160 записей 99 соответствуют:
194.50.13.235 20:24, 21 сентября 2021 (UTC)[ответить]
Ок. — Vort (обс.) 04:04, 22 сентября 2021 (UTC)[ответить]
Начал разбирать name_mismatch. А с не упомянутыми тремя тысячами какие-то проблемы? 194.50.13.235 10:53, 22 сентября 2021 (UTC)[ответить]
Предполагаю, что можно заливать. Но это ж только моя оценка. Надо, чтобы кто-нибудь по аналогии с секцией выше проверил и залил. Защита от «замыленного глаза». — Vort (обс.) 13:11, 22 сентября 2021 (UTC)[ответить]
Не особо понятно, что предлагается проверить. Статьи в petscan? name_mismatch к слову, ещё остался, я просто удалил из списка не ошибки, а сноски-АИ к тексту. 13:46, 22 сентября 2021 (UTC)
1. Случайную выборку из списка для грубой оценки процента ошибок. 2. Код на предмет наличия глупых ошибок. Ну или ничего не проверять — под ответственность загружающего. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)[ответить]
И val_fail пустые вижу. Ну это уже детали, список этот для людей, а не для ботов, можно менять как угодно. Всё равно в заливку без валидации не пойдёт. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)[ответить]
Пустые val_fail заливать не надо, прочие исправлены. 1. Смотреть здесь? Пять случайных штук проверил, всё совпадает (название, регион, тип). 2. Там блин 360 строк, и не все жалуют C#. Если совпало название статьи, а код с файлом, то и заливать, никаких специфических сносок типа подтверждения омонимов в текстах статей нет. 194.50.13.235 14:17, 22 сентября 2021 (UTC)[ответить]
Ghuron, похоже ждём вашего мнения. 194.50.13.235 16:10, 22 сентября 2021 (UTC)[ответить]
Vort, готово. 194.50.13.235 12:47, 22 сентября 2021 (UTC)[ответить]
  • Vort, после заливки осталось 195 ВО, я так понимаю в основе это templ_fail на 121 штуку? Возможно по ним сделать такой же перебор, как и с другими? Просто взять самый первый шаблон в статье. 194.50.13.235 21:46, 22 сентября 2021 (UTC)[ответить]
    • Вот эта штучка отключается и в алгоритм идут первые попавшиеся шаблоны. 108 + 43 = 151. Куда ещё 44 делись — без понятия. Алгоритм кривой (как у меня, так, судя по всему, и у Фонда), может быть всё, что угодно. Если очень надо будет, поищу. Результат прогона:
В случае ручной перепроверки, может, и залью. Хотя тут качество ещё хуже, чем в большом списке. — Vort (обс.) 04:36, 23 сентября 2021 (UTC)[ответить]
Vort, первые 10 совпали, сразу и закинул на ВД. По-моему можно заливать. А список с названиями даже перебирать смысла нет, это посторонние сноски. 194.50.13.235 15:54, 23 сентября 2021 (UTC)[ответить]
Ну это оценка < 10% ошибок. Лучше бы ещё проверить. Но уже залил, так что проверять уже в ВД можно. — Vort (обс.) 16:19, 23 сентября 2021 (UTC)[ответить]
Значит остался список ниже на 350 статей. Чистка ВД уже последний этап. 194.50.13.235 16:48, 23 сентября 2021 (UTC)[ответить]
Кажется, я понял, из чего состоят остатки. Я не сделал кода ошибки для маленького количества параметров. Наподобие insource:/\{\{ГКГН\}\}/. — Vort (обс.) 17:31, 23 сентября 2021 (UTC)[ответить]

Заливка из сносок 2

С тематическим списком выше похоже разобрались (осталось залить), но их ещё под тысячу в других статьях. Запрос. 194.50.13.235 16:10, 22 сентября 2021 (UTC)[ответить]

Vort (обс.) 17:40, 23 сентября 2021 (UTC)[ответить]
Vort, как и в прошлый раз, первые 10 совпали, все записал. По-моему надо заливать. По списку с названиями посмотрел только name_mismatch, остальное лучше на геофорум. К заливке:
194.50.13.235 18:26, 23 сентября 2021 (UTC)[ответить]
Ghuron, ShinePhantom, Vort, заливаем? 194.50.13.235 13:09, 24 сентября 2021 (UTC)[ответить]
Проверенные name_mismatch закинул. — Vort (обс.) 08:00, 25 сентября 2021 (UTC)[ответить]

Бот отчитался о ряде ошибок, большинство из них появилось после заливки из НП шаблонов вне сносок и/или привязки по названиям: #Заливка из шаблонов и списка. 194.50.13.235 14:20, 24 сентября 2021 (UTC)[ответить]

  • За 10 дней интереса никто не проявил, так что тем НП, куда залили сразу два кода, я возвращаю исходную версию, чтобы ошибки не расползались дальше. 185.16.139.228 16:30, 27 сентября 2021 (UTC)[ответить]
    • Неужели надо ещё раз уточнять, что потенциальные проблемы надо смотреть в списке этой темы, а не на ВД? — Vort (обс.) 05:03, 29 сентября 2021 (UTC)[ответить]
      • Vort, ? Эти ошибки были залиты без моего участия в самом начале. А те списки, где я принимал участие и вышли косяки, я на ВД скрупулёзно исправил вообще-то. 185.16.139.123 16:20, 29 сентября 2021 (UTC)[ответить]
        • Для достижения цели «чтобы ошибки не расползались дальше» надо работать над элементами из списков result_wdd.txt и result_gkd.txt. Отмены по валидатору в ВД самые коварные ошибки «заметают под ковёр», это недопустимо — если делать отмену проблемной части заливки, то полностью. Разве что за исключением вручную проверенных элементов (смотреть по истории правок, видимо). — Vort (обс.) 17:00, 29 сентября 2021 (UTC)[ответить]
          • Желающие всё также могут открыть историю валидатора ВД и проверять сколько угодно. Не было там ничего коварного, всё что я отменил это проблема двух одноимённых НП в одном субъекте. То есть двум таким сёлам выдали по два кода. В статьях Рувики этих кодов нет. Исправлять эти ошибки даже дольше, чем поставить коды заново вручную. 185.16.139.123 17:20, 29 сентября 2021 (UTC)[ответить]
            • Окей, ещё раз попробую пояснить. В списке есть недозалитые дубли. То есть, алгоритм не смог сделать точную привязку, но залит был только первый код. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)[ответить]
              • Vort, не вижу связи между этими двумя проблемами. Зачистка вылезших дубликатов никак не повлияла на варианты выявления недозалитых дублей. И зачем вообще заливали случаи «алгоритм не смог сделать точную привязку, но залит был только первый код»? Это очень и очень плохо, ошибки разбежались по принципу 50/50. 185.16.139.123 17:34, 30 сентября 2021 (UTC)[ответить]
                • 1. Создаётся иллюзия, что проблема решена. Иначе в ВД валидаторе видны последствия, напоминающие о необходимости решения проблемы. 2. Потому, что заливка была в два этапа. 3. Все эти случаи есть в списке, про который я уже не первый раз говорю. Разобрать список — разберутся и недо-дубли. — Vort (обс.) 04:37, 1 октября 2021 (UTC)[ответить]
                  • 1. Это не аргумент — проблемы есть везде и всегда, это самый простой тезис к приятию. Никому кроме тебя или меня абсолют не нужен. 2. И что, что два этапа? На втором этапе надо было исправлять первый, а не усугублять ошибку. 3. А кто бы спорил? Есть желающие — пусть разбирают. У меня на это времени нет, работая с ВП я верю в пункт 1. 185.16.139.123 18:24, 2 октября 2021 (UTC)[ответить]
        • Кстати, ручную работу по спискам я предлагал изначально. Но нет, вначале «как-нибудь рассосётся», а теперь отмены. Ещё и не до конца. — Vort (обс.) 17:02, 29 сентября 2021 (UTC)[ответить]
          • Ну не я работал над алгоритмом сравнения «название-тип-регион». Я исходно только из шаблонов предлагал заливать, и там всё хорошо получилось. Почему претензия мне-то? Прошло 10 дней, объявление было здесь и на геофоруме — интереса нуль. 185.16.139.123 17:20, 29 сентября 2021 (UTC)[ответить]
          • Vort, к слову, подход «как-нибудь рассосётся» хоть мне и не по нраву, но в данном случае легко нивелируется сверкой координат в ГКГН и в статье. Но для этого надо было коды залить по-максимуму, чтобы сделать всё и сразу. 185.16.139.123 17:29, 29 сентября 2021 (UTC)[ответить]
            • Координаты в статье разве чем-то лучше координат в ВД? Ведь именно по координатам я и привязывал. Но в некоторых случаях в радиусе ~10км было по несколько НП с одним и тем же названием. Кстати, забавно, но даже при перепутанных lat<->lon бывали совпадения. То есть, в реальности существуют НП с одинаковыми названиями и с координатами XX, YY и YY, XX. При большом количестве данных удивительные совпадения попадаются. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)[ответить]

Источники для валидации

Случайно заметил, что вывод инструмента содержит колонку ОКТМО. По ней привязывать было бы надёжнее, чем по координатам. Но раз по координатам привязали, то по этой колонке можно провалидировать. Только вот во вкладке «Исходные коды» находится что угодно, но не источник для этих данных. Кто-нибудь знает, откуда они берутся? — Vort (обс.) 05:10, 29 сентября 2021 (UTC)[ответить]

  • @Vort: ГКГН в PDF [5] + привязка по регион/район/название/тип [6]. Актуальность базы на конец 2019 года. Если руки дойдут, то обновлю (если оно нужно). -- dima_st_bk 11:28, 29 октября 2021 (UTC)[ответить]
    • Понял, спасибо. Тут выше была ссылка на ODS, это получше, чем PDF. Но всё равно для такого типа привязки надо делать анализ качества сопоставления. Жаль, что не код <-> код. — Vort (обс.) 11:45, 29 октября 2021 (UTC)[ответить]
  • d:Q4410451 — живой пример почему после всех заливок нужна будет валидация по координатам. Тут совпало название, регион и единичность объекта (вторая Светлушка не внесена в ГКГН). 185.16.139.251 15:01, 10 ноября 2021 (UTC)[ответить]

Повторная перевязка по названиям и координатам

Ghuron исправил на ВД тысячи названий рек. Как я понимаю, первой проходкой сверялись именно они, а не названия статей в Рувике. Предлагаю сделать вторую перевязку по совпадению название/регион/координаты/тип=река/страна=Россия. 194.50.15.16 18:42, 7 ноября 2021 (UTC)[ответить]

В случае с шаблонами сверял по названию статей, из ВД только коды брал. Я ж даже исходники выложил. Связь по координатам же делал для сёл. Что там по координатам свяжется, если алгоритм на реки направить — без понятия, но в качестве результата большие сомнения, так что пока что этим заниматься не буду. — Vort (обс.) 19:30, 7 ноября 2021 (UTC)[ответить]
  • Я делал довольно примитивную привязку примерно по следующим правилам:
  1. Найти список рек в РФ, вытащить из него те, у которых метка уникальна (то есть идентифицирует элемент в списке)
  2. Отфильтровать список ГКГН по рекам и оставить в нем те, у которых метка уникальна
  3. Сравнить списки, и если название совпадает — залить ГКГН
Насколько я помню, в таком подходе было некоторое количество ошибок (вы вроде бы меня отменяли в ВД). Вы уверены что это стоит прогнать ещё раз? В смысле мне несложно, но ненакосячить бы :) Ghuron (обс.) 06:50, 8 ноября 2021 (UTC)[ответить]
  • Уникальность имеет смысл учитывать только при полноте. Чего ни в ВП, ни в ГКГН нет и не будет. По-моему важнее сопоставить координаты, они уникальнее названий, а на регион можно вообще не смотреть, он неявно присутствует в координатах. — Vort (обс.) 06:57, 8 ноября 2021 (UTC)[ответить]
    • Нет, уникальность имеет смысл проверять чтобы не заливать ГКГН в «однофамильцев»
      Координаты — это не то, что я могу на коленке сделать в экселе Ghuron (обс.) 07:16, 8 ноября 2021 (UTC)[ответить]
      • Теоретическая ситуация: существуют всего две реки с одинаковым названием: маленькая, есть в ГКГН, нет в ВП и очень маленькая, есть в ВП, но нет в ГКГН. Алгоритм их свяжет. Можно предположить, что такая ситуация маловероятна и ей стоит пренебречь. Возможно. — Vort (обс.) 07:35, 8 ноября 2021 (UTC)[ответить]
      • Может, сравнивать все координаты со всеми в Екселе и неудобно. Но провалидировать уже готовые сопоставления уж точно можно. Вынуть географические координаты / указано для части: устье с ВД, теоремой Пифагора посчитать расстояние и сравнить с пороговым значением. — Vort (обс.) 07:57, 8 ноября 2021 (UTC)[ответить]
  • Ghuron, методика проседает в моменте регионов, их лучше сравнивать. Также сразу надо убрать объекты ВД, где уже указан код ГКГН. Отменял я и Фантома, но заливку из сносок только исправлял — потому что за неё была моя часть ответственности. Я считаю, что надо заливать дальше, потому что хуже уже не будет: проще потом провалидировать всё залитое, чем вечность валидировать старое и ту же вечность вручную добавлять новое. 194.50.15.16 15:39, 8 ноября 2021 (UTC)[ответить]
Q36360274 - 512065
512065|Вурдъёль|река|Республика Коми| |65,8656608|57,8560015
169058|Вурдъёль|река|Республика Коми| |63,8515482|53,3274538
Q36360146 - 548736
548736|Веръёль|река|Республика Коми| |61,45831215|55,9601413
169152|Веръёль|река|Республика Коми| |63,9341306|53,7017933
Ещё есть куча отсутствующих сопоставлений. Надеюсь их проанализировать следом. — Vort (обс.) 08:09, 12 ноября 2021 (UTC)[ответить]