Википедия:Форум/Викиданные: различия между версиями
Строка 11: | Строка 11: | ||
** Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 18:03, 6 декабря 2021 (UTC) |
** Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 18:03, 6 декабря 2021 (UTC) |
||
*** Это нам рассказывает [[У:Schekinov Alexey Victorovich|зарег]], расставивший [[Бюдель-Адами, Аделаида|в этой статье]] сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило [[ВП:ПРОВ]] написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — [[Special:Contributions/188.123.231.48|188.123.231.48]] aka [[Special:Contributions/188.123.231.25|.25]] 18:11, 7 декабря 2021 (UTC) |
*** Это нам рассказывает [[У:Schekinov Alexey Victorovich|зарег]], расставивший [[Бюдель-Адами, Аделаида|в этой статье]] сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило [[ВП:ПРОВ]] написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — [[Special:Contributions/188.123.231.48|188.123.231.48]] aka [[Special:Contributions/188.123.231.25|.25]] 18:11, 7 декабря 2021 (UTC) |
||
**** Л - Логика анонимная: «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 20:07, 7 декабря 2021 (UTC) |
**** Л - Логика анонимная: 1) «Это нам...» - вот точно не вам. 2) «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» - список литературы он для чего? Думаем, осмысливаем самостоятельно. 3) «так-то нет в них ничего красивого» - вижно потому сабж их и поставил в СЛ. 4) разговор окончен. — [[У:Schekinov Alexey Victorovich|''<span style="text-shadow:#404040 0.2em 0.2em 0.4em">@ → SAV ©</span>'']] 20:07, 7 декабря 2021 (UTC) |
||
=== Итог === |
=== Итог === |
Версия от 20:13, 7 декабря 2021
Если вы что-то поменяли в Викиданных, а в карточке оно не отображается, для начала попробуйте сбросить кэш.
Вопросы наполнения Викиданных информацией лучше обсудить на русскоязычном форуме Викиданных.
Инструменты: Гаджет для объединения элементов.
Узнавать о правках в наблюдаемых статьях: флажок на вкладке «Список наблюдения» (Расширенные настройки)
- Авторское право
- Викиданные
- Географический
- Грамотность
- Исторический
- Источники
- Помощь начинающим
- Форум Инкубатора
- Оспаривание итогов
- административных действий
- Запросы к администраторам
- арбитрам
- ботоводам
- бюрократам
- иллюстраторам
- патрулирующим
- службе VRT
- чекъюзерам
- технические
Связать
Эрдеи и английскую Erdélyi. Рефлексист (обс.) 17:35, 7 декабря 2021 (UTC)
В ВД говорится, что она родилась в Варшаве, а в тексте польской статьи, что в Люблине. — @ → SAV © 16:09, 6 декабря 2021 (UTC)
- Коллега Schekinov Alexey Victorovich, насколько я могу видеть, ни на Викиданных, ни в польском разделе википедии не указан источник на место рождения. Вот Вам ссылка на первый встреченный на гуглобуксах биографический источник. — Jim_Hokins (обс.) 17:02, 6 декабря 2021 (UTC)
- Я вижу, что первым был создан элемент Викиданных (с Варшавой), а позднее — польская статья (тоже с Варшавой). А потом в польскую статью пришёл аноним с такой правкой. Ссылка, между прочим, работает, по ней рукописный документ на польском, который моя не понимай, однако вверху его стоит число 1853, совпадающее с годом, названным в описании правки. Считаю, пока не доказано иное, что аноним, утверждающий, что в середине XIX века в европейской стране то ли 7-, то ли 5-летняя девочка могла быть выдана замуж, позорит высокое звание анонима. --83.220.227.242 17:33, 6 декабря 2021 (UTC).
- Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — @ → SAV © 18:03, 6 декабря 2021 (UTC)
- Это нам рассказывает зарег, расставивший в этой статье сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило ВП:ПРОВ написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — 188.123.231.48 aka .25 18:11, 7 декабря 2021 (UTC)
- Л - Логика анонимная: 1) «Это нам...» - вот точно не вам. 2) «Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил).» - список литературы он для чего? Думаем, осмысливаем самостоятельно. 3) «так-то нет в них ничего красивого» - вижно потому сабж их и поставил в СЛ. 4) разговор окончен. — @ → SAV © 20:07, 7 декабря 2021 (UTC)
- Это нам рассказывает зарег, расставивший в этой статье сноски на «источники», в которых «подтверждаемых» сведений нет. Просто эти «источники» приведены в списке литературы у Пружанского (чей текст полностью рерайтнут в неэнциклопедическом стиле для статьи), но взято ли из них хоть что-нибудь, наш зарег не проверял (а то бы к другим абзацам подставил). Тем временем правило ВП:ПРОВ написано не для декоративного увешивания статей цифрками и скобащьками (так-то нет в них ничего красивого). — 188.123.231.48 aka .25 18:11, 7 декабря 2021 (UTC)
- Или подтверждает статус этого звания и еще (стотысячпяццотый) раз говорит о том, что ру.Вика пережила времена анонимного редактирования. Не понимаю, что мешает назваться «Груздем» и править используя все возможности викидвижка. — @ → SAV © 18:03, 6 декабря 2021 (UTC)
Итог
Пусть МР будет Варшава. — @ → SAV © 17:59, 6 декабря 2021 (UTC)
Перенос в Викиданные свойства "Код в «Экспресс-3»"
Привет!
Наткнулся на то, что гаждет переноса свойств из карточки в Викиданные не срабатывает для свойства "Код в «Экспресс-3»", если оно сопровождается источником. Пример статьи: Воденяпинский (станция). @Putnik, в чем тут может быть дело? Michgrig (talk to me) 15:07, 5 декабря 2021 (UTC)
МС
Это нормально, когда из карточки выходит такое, через ВД:
Место смерти - Алжир, Франция[6] или Q98046137?[5]
,
где «Q98046137» - просто "населенный пункт, ьез единого названия, хоть на каком-либо языке?
Такое сразу сносить, или когданибудддить до победного? — @ → SAV © 03:30, 4 декабря 2021 (UTC)
- Там кнопочка есть - Все введённые языки. — Kareyac (обс.) 04:14, 4 декабря 2021 (UTC)
- Где хоть один введённый? — @ → SAV © 07:17, 4 декабря 2021 (UTC)
- у меня показывает итальянский, норвежский букмол и нидерландский, кнопочку надо нажать и будет счастье или несчастье, придётся копать глубже. — Kareyac (обс.) 07:38, 4 декабря 2021 (UTC)
- Нашел. Ввёл пока по басурмански, но хоть понятно, где это. — @ → SAV © 09:45, 4 декабря 2021 (UTC)
- у меня показывает итальянский, норвежский букмол и нидерландский, кнопочку надо нажать и будет счастье или несчастье, придётся копать глубже. — Kareyac (обс.) 07:38, 4 декабря 2021 (UTC)
- Где хоть один введённый? — @ → SAV © 07:17, 4 декабря 2021 (UTC)
Обсуждение новых свойств в Викиданных
MasterRus21thCentury последнее время подаёт много заявок на создание идентификаторов в русскоязычных базах, за что ему большое спасибо. Но их обсуждает не так много участников, как хотелось бы. Поэтому я хотел бы пригласить всех интересующихся записаться в участники вики-проекта Россия в Викиданных, чтобы получать уведомления о новых заявках. — putnik 08:21, 3 декабря 2021 (UTC)
Почему в карточке название задвоено? — Ghirla -трёп- 11:16, 28 ноября 2021 (UTC)
- Это не Викиданные. Проблему можно решить очисткой параметра «название», но, мне кажется, при переводе шаблона на карточку что-то было напутано — это особенно заметно, когда название статьи нерусское (пример; или это нормально?). --188.65.244.97 11:56, 28 ноября 2021 (UTC)
- Я так понимаю, что подтягивающееся с викиданных значение параметра
|русское название =
совпадает с прописанным в статье значением параметра|название =
, а отображаются значения обоих параметров, поэтому название в карточке и выглядит задвоенным. — Jim_Hokins (обс.) 12:04, 28 ноября 2021 (UTC)- Нет-нет, не с Викиданных, а через PAGENAME. --188.65.244.97 12:09, 28 ноября 2021 (UTC)
- Ок. Через PAGENAME. Спасибо, что уточнили. Всё равно задваивание происходит из-за наличия двух совпавших (по значению) параметров. — Jim_Hokins (обс.) 12:35, 28 ноября 2021 (UTC)
- Нет-нет, не с Викиданных, а через PAGENAME. --188.65.244.97 12:09, 28 ноября 2021 (UTC)
- На мой взгляд, тут основная проблема с тем, что параметры названы не так, как это обычно делается. То есть
название
отвечает не за основной заголовок, а за оригинальное название. По-хорошему, надо бы переименовать и заменить во всех статьях ботом, если кто-нибудь возьмётся. — putnik 12:15, 28 ноября 2021 (UTC)- Это было бы полезно. — Ghirla -трёп- 13:09, 28 ноября 2021 (UTC)
Три писателя-фантаста
В викиданных есть три очень схожих элемента писатель-фантаст (Q108710753), писатель-фантаст (Q28225718) и писатель научной фантастики (Q18844224) (являющийся подклассами первых двух!). При этом по-английски разница в них более осязаемая (speculative/fantastic fiction writer (Q108710753), science fiction author (Q28225718) и science fiction writer (Q18844224). Нашёл это я когда пытался понять, откуда отвязалось перенаправление писатель-фантаст и куда бы его надо вернуть. Категория ссылается на Q108710753, но при этом такая профессия указана всего у двух человек. Я, если честно, немного запутался, и думаю, что категория и перенаправление должны относиться к Q18844224, но какие должны быть у всех этих элементов понятные описания, не очень соображу. windewrix (обс.) 14:14, 23 ноября 2021 (UTC)
- Никто не соображает. Fiction - это в смысле не публицистика, не документалистика, не исторически достоверные произведения. Обычно — "художественные произведения", но мне не очень понятен момент с исторически достоверной литературой, так как она вполне художественная в смысле искусства слова. Далее, автор — вроде бы проще: это не только писатель, но и музыкант, художник, фотограф и др. Соответственно на стыке fiction и author получаются "музыканты, художники, фотографы, создающие произведения о вымышленном" (если они это могут, что, например, не так просто для музыканта... или вообще единственное, что может создавать музыкант ;) ). С writer проще всего - это так и будет "писатель". Science fiction - научная фантастика (если не углубляться в национальные особенности жанра).
Поэтому:
d:Q108710753 — "писатель спекулятивной фантастики" либо "писатель спекулятивной литературы". И в России таких, по идее быть не может, в силу отсутствия теории.
d:Q28225718 — "автор художественных произведений" (включает не только литературу, но и другие искусства)
d:Q18844224 — "писатель-фантаст", Категория:Писатели-фантасты должна ссылаться сюда. Igel B TyMaHe (обс.) 15:40, 23 ноября 2021 (UTC)
На викиданных есть возможность разместить ссылку для отображения в статье только на персоналию и на клуб (ниспадающее меню-окошко на «FootballFacts.ru player ID» и «FootballFacts.ru team ID»). На стадион — никак, или можно без выбора ниспадающего списка как-то сделать? https://footballfacts.ru/stadium/900-stadiongazovik в Газовик (стадион). - 5.250.170.7 12:51, 22 ноября 2021 (UTC)
- Нужно подать заявку на создание нового свойства в Викиданных (раздел Библиотечные указатели/Authority control). — putnik 13:31, 22 ноября 2021 (UTC)
Сверлильные станки
d:Q2211295 vs. d:Q20820500 - ? Правильно ли я понимаю, что русское Сверлильно-расточная группа станков следует, как понятие собирательное, вынести в свой особый уголок, а всё прочее (просто сверлильные станки) смёржить вместе? Русская группа включает, в том числе, станки с горизонтальным шпинделем, которые исключаются, например, в de:Ständerbohrmaschine. Retired electrician (обс.) 04:55, 22 ноября 2021 (UTC)
- На викиданных следует мёрджить прям совсем одинаковые, если есть сомнения, то лучше ставить отношения в точности соответствует (P2888) или предположительно одно и то же с (P460), а также отношения части и целого ·Carn 07:02, 22 ноября 2021 (UTC)
Певческий голос
В процессе беседы про другое выяснилось, что у нас довольно много статей, куда с ВД подтягивается, даже при отсутствии соответствующей строчки в карточке, свойство "Певческий голос", помещающее статью в одну из подкатегории внутри категории Категория:Певцы и певицы по голосам. Проблема в том, что на Викиданных это свойство ставят кому ни попадя, а должно оно стоять только у академических вокалистов: поп-, рок- и т. д. певцам категория голоса не определяется. Отследить, кому из многих тысяч певцов сегодня притащат эту строчку в ВД, нет никакой возможности. Я убрал на ВД возможность выставлять тип голоса кому-либо, кроме певцов, но оставить возможность выставлять его только оперным певцам не могу, потому что бывают академические вокалисты, которые не поют в опере (а поют, скажем, только романсы), и для них на ВД нет отдельного класса. Что делать? По идее все исполнители академической музыки должны попадать в одну из подкатегорий Категория:Академические музыканты. Можно ли подавить вывод свойства "Певческий голос" (и в карточку, и в категории) для статей, не входящих в эту ветку дерева категорий? Или, вернее, сперва собрать список статей, в которые это свойство выводится и которые не входят в эту ветку, чтобы проверить, не надо ли какие-то из них в эту ветку включить? Андрей Романенко (обс.) 00:57, 22 ноября 2021 (UTC)
- Правка на ВД довольно решительная, можно договориться в одном проекте признавать обладателями типов голосов только академистов (включая народников?), но по многим эстрадникам тип голоса проставляется на основе публикаций того же уровня, как источники всех остальных сведений в статьях. На основе каких более авторитетных источников Тони Брэкстон можно раз и навсегда запретить быть контральто и означить повсеместно распространённое расширительное толкование «маргинальным»?
- Для технического решения раньше обсуждали создание отдельного шаблона: Обсуждение проекта:Музыка/Архив/2018#Шаблон:Музыкант-2 — 188.123.231.25 aka .2 08:42, 22 ноября 2021 (UTC)
- Запретить Брэкстон быть контральто, а Эминему - тенором можно по элементарным культурным различиям: если русскоязычные авторитетные в голосах источники не употребляют к их голосам данные термины, то иноязычные источники идут лесом. Igel B TyMaHe (обс.) 10:35, 23 ноября 2021 (UTC)
- Всё то же ОРИСС, пока не показано по АИ, что tenore переводится на русский не (только) как «тенор I: тип голоса оперного певца, определяемый в зависимости от тесситуры», а (ещё и) как «перен. тенор II: тип голоса певца или актёра, пользующегося эстрадной манерой пения (постановкой голоса) либо не поющего, определяемый в зависимости либо от тесситуры, либо от особенностей тембровой окраски». — 188.123.231.25 14:34, 23 ноября 2021 (UTC)
- Запретить Брэкстон быть контральто, а Эминему - тенором можно по элементарным культурным различиям: если русскоязычные авторитетные в голосах источники не употребляют к их голосам данные термины, то иноязычные источники идут лесом. Igel B TyMaHe (обс.) 10:35, 23 ноября 2021 (UTC)
- Если в ру-вики под певческим голосом понимают исключительно de:Stimmfach, то использовать надо свойство d:Property:P1731, а не пытаться вводить искусственные ограничения на d:Property:P412 Ghuron (обс.) 16:11, 24 ноября 2021 (UTC)
- Эстрадным певцам начнут заполнять именно Fach (причём неподходящими значениями), если шаблон-карточка останется универсальной. — 188.123.231.25 17:42, 24 ноября 2021 (UTC)
- Я не понимаю вторую часть вашей фразы Ghuron (обс.) 19:24, 24 ноября 2021 (UTC)
- Раньше обсуждали создание отдельной карточки для академических музыкантов (или только певцов), в ней было бы уместно и предложение с соседнего форума (возможно, в «многоэтажной» реализации, как с должностями у государственных деятелей), и послабление условий для отображения типа голоса. В свою очередь, для певцов с не-академической карточкой можно было бы, например, разрешить отображение «сопрано» с источником, но запретить неуместные значения «Fach». — 188.123.231.25 19:57, 24 ноября 2021 (UTC)
- Неплохая идея, но это, очевидно, надо обсуждать не здесь Ghuron (обс.) 03:32, 25 ноября 2021 (UTC)
- Раньше обсуждали создание отдельной карточки для академических музыкантов (или только певцов), в ней было бы уместно и предложение с соседнего форума (возможно, в «многоэтажной» реализации, как с должностями у государственных деятелей), и послабление условий для отображения типа голоса. В свою очередь, для певцов с не-академической карточкой можно было бы, например, разрешить отображение «сопрано» с источником, но запретить неуместные значения «Fach». — 188.123.231.25 19:57, 24 ноября 2021 (UTC)
- Я не понимаю вторую часть вашей фразы Ghuron (обс.) 19:24, 24 ноября 2021 (UTC)
- Эстрадным певцам начнут заполнять именно Fach (причём неподходящими значениями), если шаблон-карточка останется универсальной. — 188.123.231.25 17:42, 24 ноября 2021 (UTC)
Только что исправил координаты в статье. Вижу в карточке трудночитаемые значения параметров в поле "Соседние о.п." Полез разбираться. Догадываюсь, что эти наименования идут с Викиданных. Но не пойму главного. В шаблоне-карточке {{Железнодорожная станция}} вообще отсутствует такой параметр! Как он появляется тогда в карточке? И как это исправить на нормально читаемые названия "Полесский Парк" и "Пригородный"? — 193.233.70.48 12:21, 15 ноября 2021 (UTC)
- Для исправления надо было добавить русские метки: вот так. — Vort (обс.) 12:26, 15 ноября 2021 (UTC)
- Хорошо, это понял. А что по поводу механизма отображения этой информации? В документации шаблона не указан параметр "Соседние о.п." И упс - одно наименование показано в виде красной ссылки, другое вообще без ссылки. — 193.233.70.48 12:37, 15 ноября 2021 (UTC)
- Есть параметр
Предыдущая
, но я нигде не вижу его заполненным. Наверно, функции заполнения из Викиданных хватает. — Vort (обс.) 12:41, 15 ноября 2021 (UTC) - К элементам Викиданных не привязаны статьи рувики, поэтому нет нормальных ссылок. — Vort (обс.) 12:42, 15 ноября 2021 (UTC)
- Я, честно говоря, тоже задавался вопросом, почему, если нет связанной статьи в рувики, в одном случае показывается красная ссылка, а в другом вообще нет ссылки. Michgrig (talk to me) 22:11, 15 ноября 2021 (UTC)
- Как и для текста ссылки, для названия несуществующей статьи, на которую она будет вести, используется метка элемента Викиданных. Но так как она не уникальна, то уже может существовать другая статья с такой же меткой. Чтобы не делать некорректную ссылку, в таком случае показывается просто текст. Если кто-то предложит вариант, как в таком случае генерировать уникальное название статьи, то можно попробовать добавить другую логику. — putnik 00:21, 16 ноября 2021 (UTC)
- Ясно. Про такую логику я не подумал. Michgrig (talk to me) 07:01, 16 ноября 2021 (UTC)
- Как и для текста ссылки, для названия несуществующей статьи, на которую она будет вести, используется метка элемента Викиданных. Но так как она не уникальна, то уже может существовать другая статья с такой же меткой. Чтобы не делать некорректную ссылку, в таком случае показывается просто текст. Если кто-то предложит вариант, как в таком случае генерировать уникальное название статьи, то можно попробовать добавить другую логику. — putnik 00:21, 16 ноября 2021 (UTC)
- Я, честно говоря, тоже задавался вопросом, почему, если нет связанной статьи в рувики, в одном случае показывается красная ссылка, а в другом вообще нет ссылки. Michgrig (talk to me) 22:11, 15 ноября 2021 (UTC)
- Есть параметр
- Хорошо, это понял. А что по поводу механизма отображения этой информации? В документации шаблона не указан параметр "Соседние о.п." И упс - одно наименование показано в виде красной ссылки, другое вообще без ссылки. — 193.233.70.48 12:37, 15 ноября 2021 (UTC)
Поправьте плз, чтобы ссылка из этой статьи вела не на Пол Уильямс, а на Уильямс, Пол (артист). — Igor Borisenko (обс.) 19:20, 12 ноября 2021 (UTC)
- @Igor Borisenko, я сейчас в статье не вижу такой ссылки. Где именно она должна находиться? Michgrig (talk to me) 21:55, 12 ноября 2021 (UTC)
- В том то и дело, что в коде русской статьи и я не вижу. Но если со статьи Пол Уильямс нажать "ссылки сюда", то будет показываться ссылка со статьи Багси Мэлоун. Подозреваю, что это подтягивается из карточки, в которой есть элемент Викиданных для Уильямса. — Igor Borisenko (обс.) 22:06, 12 ноября 2021 (UTC)
- Это ведь решает заявленную проблему? Ну а на ВД Пол Вильямс записан в сценаристы без источника. Удалить его там надо. — 188.123.231.59 09:57, 13 ноября 2021 (UTC)
- В том то и дело, что в коде русской статьи и я не вижу. Но если со статьи Пол Уильямс нажать "ссылки сюда", то будет показываться ссылка со статьи Багси Мэлоун. Подозреваю, что это подтягивается из карточки, в которой есть элемент Викиданных для Уильямса. — Igor Borisenko (обс.) 22:06, 12 ноября 2021 (UTC)
- Страницу «ссылки сюда» стоит воспринимать исключительно как служебный инструмент. Проблема в том, что при проверки названия статьи через функцию
{{#ifexist:…}}
, проверяемая статья попадает в список ссылок. Ну а коду, который генерирует красные ссылки на статьи, приходится так делать, чтобы не сослаться случайно на какую-нибудь другую статью с таким же названием. — putnik 05:15, 15 ноября 2021 (UTC)
Устранение дублей элементов населённых пунктов Курганской области
В результате анализа списка Участник:Vort/PpCodes обнаружил кластер статей с дублированными элементами. Предлагаю заняться их слиянием. Для этого достаточно открыть Шаблон:Населённые пункты Далматовского района и прокликивать ссылки в поисках статей без интервик. Затем в uk:Шаблон:Далматовський район искать соответствующие статьи, открывать элементы и вызывать скрипт объединения. Чтобы не ошибиться, стоит сравнивать население (обычно стоит за 2010 год). Пример: Бабинова -> стоят интервики, идём дальше: Белое (Далматовский район) (67, 2010) -> d:Q108786525, uk:Біле (Далматовський район) (67, 2010) -> d:Q27578041, можно объединять (заодно в объединённом элементе можно убрать это : населённый пункт, так как там, скорее всего, будет стоять более точный тип). В других районах то же самое: Шаблон:Населённые пункты Звериноголовского района + uk:Шаблон:Звіриноголовський район, Шаблон:Населённые пункты Катайского района + uk:Шаблон:Катайський район, Шаблон:Населённые пункты Кетовского района + uk:Шаблон:Кетовський район. Некоторые из районов я уже пообъединял, с некоторыми до меня кто-то справился. Так что если во многих статьях района есть интервики, стоит переходить к следующему. — Vort (обс.) 11:19, 7 ноября 2021 (UTC)
- Зачем щёлкать, когда есть petscan? Далматовский район без ukwiki. 194.50.15.16 15:20, 7 ноября 2021 (UTC)
- Сортировку только лучше поставить по названию. — Vort (обс.) 15:45, 7 ноября 2021 (UTC)
- Можете поменять, не возражаю. Вообще удивляюсь автору, что оно не сортирует по-умолчанию. И что никто ему, видимо, об этом не скажет. Ещё русский язык интерфейса постоянно сбрасывается. 194.50.15.16 15:49, 7 ноября 2021 (UTC)
- Поменял. Возможно, для больших запросов становится важной трата дополнительных ресурсов на сортировку. — Vort (обс.) 16:14, 7 ноября 2021 (UTC)
- Можете поменять, не возражаю. Вообще удивляюсь автору, что оно не сортирует по-умолчанию. И что никто ему, видимо, об этом не скажет. Ещё русский язык интерфейса постоянно сбрасывается. 194.50.15.16 15:49, 7 ноября 2021 (UTC)
- Что тут можно автоматизировать, а что — нет — вопрос интересный. Если кому-то удобнее petscan — хорошо. — Vort (обс.) 15:47, 7 ноября 2021 (UTC)
- Дать два списка просто: один ru без uk, а второй uk без ru. И ссылки на локаль и на ВД сразу. 194.50.15.16 15:49, 7 ноября 2021 (UTC)
- Проблемы дубликатности не только в Курганской области, например, полно озёр в Карелии без связи с себуанцами. Так что отчёты можно делать на постоянной основе. Хотя их ведёт KrBot, правда пока не разобрался как с ними работать: d:User:Ivan A. Krestinin/To merge/ruwiki. 194.50.15.16 17:34, 7 ноября 2021 (UTC)
- А, вообще, для этих целей есть Лакмус. 217.117.125.83 10:42, 8 ноября 2021 (UTC)
- Сортировку только лучше поставить по названию. — Vort (обс.) 15:45, 7 ноября 2021 (UTC)
- А ещё в ukwiki полно статей об островах со всего света, где нет интервик, а должны быть. 217.117.125.83 10:43, 8 ноября 2021 (UTC)
- Конкретно этот кластер мне показался очень удобным для обработки — думать надо мало, а шанс ошибки минимален. Более сложные (или не проанализированные) случаи можно обрабатывать следом. — Vort (обс.) 11:03, 8 ноября 2021 (UTC)
Категория ставится шаблоном из Викиданных
Конкретно, карточка "Организация" проставляет категорию Категория:Лауреаты Нобелевской премии мира, беря информацию из Викиданных. На параметр nocat не реагирует. Что делать, если требуется поставить не эту категорию, а Категория:Организации, удостоенные Нобелевской премии мира? Данный вариант не предусмотрен. Разберитесь. -- Badger M. (обс.) 09:21, 7 ноября 2021 (UTC)
- В коде шаблона {{организация}} это делает строчка
|викиданные51 = p166
, однако просто убирать её оттуда не надо (этот код не только ставит категорию, но и заполняет графу «Награды» в карточке). Можете вместо шаблона {{организация}} использовать шаблон {{некоммерческая организация}}, а категорию добавлять руками (но в этом случае и наград в карточке не будет). Гамлиэль Фишкин 02:21, 8 ноября 2021 (UTC) - Чтобы меньше пришлось разгадывать, статья, в которой это наблюдается: Американский комитет Друзей на службе обществуnocat пробросить дело нехитрое, но нужно ли именно оно тут? ·Carn 05:06, 8 ноября 2021 (UTC)
- Я вчера пытался на викиданных разграничить категории, присваиваемые лауреатам премии, в зависимости от их принадлежности к людям или организациям, но, к сожалению, так и не сумел подобрать верный вариант настройки такого разграничения. — Jim_Hokins (обс.) 05:48, 8 ноября 2021 (UTC)
- Тут два важных момента. Во-первых, свойство категорий сейчас исключительно для людей. Добавление для него новых сущностей вполне можно обсудить в Викиданных, там же можно обсудить подходящую для этого структуру. Во-вторых, есть локальный код модуля, который должен поддерживать эту структуру. Сейчас в нём нет ничего подобного. Так что, к сожалению, ваша идея попробовать подобрать ограничения изначально была обречена на провал. — putnik 07:50, 8 ноября 2021 (UTC)
- Понятно. Спасибо за разъяснение! Буду знать. Жаль, что не знал этого раньше, не тратил бы время. — Jim_Hokins (обс.) 09:33, 8 ноября 2021 (UTC)
- Если дело обстоит так, как Вы говорите, тогда ещё проще -- это банально ваш косяк. Ну так исправляйте. -- Badger M. (обс.) 14:12, 8 ноября 2021 (UTC)
- Я отвечаю на этом форуме и поддерживаю довольно большое количество кода в Википедии, чтобы людям становилось лучше. В первую очередь тем людям, которые мне приятны. Так что запросы от хамов я выполняю в последнюю очередь. — putnik 02:47, 9 ноября 2021 (UTC)
- Кто бы говорил? Консенсус на реализацию подкачки из Викиданных предъявите. Иначе по умолчанию вынужден считать Вас пушером. -- Badger M. (обс.) 08:36, 9 ноября 2021 (UTC)
- Вы меня можете считать кем хотите, это полностью ваше право. Особенно, если вы сможете это выражать корректно без нарушения ВП:ЭП. Но если же вы хотите от меня хотите добиться какой-то помощи, то я уже вам выше написал, что это худшая стратегия из всех возможных. Хотя, возможно, я всё неправильно понял, и ваша цель состоит совсем не в исправлении проблемы. В таком случае не буду вам мешать. — putnik 17:39, 9 ноября 2021 (UTC)
- Нарушение ВП:ЭП (явное) я вижу разве что в Вашей реплике. От Вас мне ничего не требуется (о проблеме поставлены в известность, и ладно). Вас же я просил дать ссылку на упомянутый консенсус о реализации подкачки в карточки из Викиданных, не более. -- Badger M. (обс.) 18:22, 9 ноября 2021 (UTC)
- Вы меня можете считать кем хотите, это полностью ваше право. Особенно, если вы сможете это выражать корректно без нарушения ВП:ЭП. Но если же вы хотите от меня хотите добиться какой-то помощи, то я уже вам выше написал, что это худшая стратегия из всех возможных. Хотя, возможно, я всё неправильно понял, и ваша цель состоит совсем не в исправлении проблемы. В таком случае не буду вам мешать. — putnik 17:39, 9 ноября 2021 (UTC)
- Кто бы говорил? Консенсус на реализацию подкачки из Викиданных предъявите. Иначе по умолчанию вынужден считать Вас пушером. -- Badger M. (обс.) 08:36, 9 ноября 2021 (UTC)
- Я отвечаю на этом форуме и поддерживаю довольно большое количество кода в Википедии, чтобы людям становилось лучше. В первую очередь тем людям, которые мне приятны. Так что запросы от хамов я выполняю в последнюю очередь. — putnik 02:47, 9 ноября 2021 (UTC)
- Извиняюсь, про первое я ошибся. Категории не только для людей (я увидел в тот раз ограничение свойства, но не перепроверил, что именно оно запрещает), но конкретного формата, как должны указываться несколько категорий (и должны ли, потому что сейчас стоит ограничение на одно значение) всё же нет. — putnik 07:25, 9 ноября 2021 (UTC)
- Спасибо за уточнение! Но тут хоть лбом об пол, всё равно, как я понял из Ваших объяснений, мои попытки настроить разграничение категорий были заведомо безрезультатными ввиду отсутствия соответствующего механизма реализации такого разграничения. То есть вначале нужно создать этот механизм, а уже потом настраивать его применение, а не наоборот — Jim_Hokins (обс.) 08:03, 9 ноября 2021 (UTC)
- @Putnik я когда-то просил сделать свойство для связанных категорий. Например у одного японского режиссёра сделано так: d:Q458192#P7084, в {{Фильм}} вот такая корявая конструкция и поэтому Весь мир, кроме Японии, тонет включен в категорию Категория:Фильмы Минору Кавасаки. Может быть нам сделать что-то подобное и тут?Я для пробы сделал d:Q35637#P7084, но перед тем, как фигачить в {{Организация}} строчку
|викиданные51 = p166~category=P7084[P642:Q109512650]
нужно:
- Тут два важных момента. Во-первых, свойство категорий сейчас исключительно для людей. Добавление для него новых сущностей вполне можно обсудить в Викиданных, там же можно обсудить подходящую для этого структуру. Во-вторых, есть локальный код модуля, который должен поддерживать эту структуру. Сейчас в нём нет ничего подобного. Так что, к сожалению, ваша идея попробовать подобрать ограничения изначально была обречена на провал. — putnik 07:50, 8 ноября 2021 (UTC)
- Скорректировать getRecipientCategoryFromEntity в Модуль:Wikidata/Medals примерно как тут: Модуль:Wikidata#L-1336 (т.е. брать из прилетевшего селектора, а если он не указан, то из P2517)
- Навставлять в викиданных аналогичных утверждений для подкатегорий Категория:Награждённые организации
- Ghuron (обс.) 08:04, 10 ноября 2021 (UTC)
Устаревшие названия рек
На ВД тысячи рек всё ещё носят устаревшие названия, как они были залиты из первой версии ГВР. Кто может всё исправить? К:Реки по алфавиту. 185.16.139.144 17:39, 2 ноября 2021 (UTC)
- Примеры можно? Ghuron (обс.) 05:45, 3 ноября 2021 (UTC)
- Ай-Ватьсортъягун, Арматолито-Тяха, Вадыръяха. — Vort (обс.) 05:53, 3 ноября 2021 (UTC)
- Только старые же удалять не надо, их надо в синонимы переносить. — Vort (обс.) 05:53, 3 ноября 2021 (UTC)
- То есть топикстартер предлагает обновить лейблы у рек, взяв за основу названия ру-вики статей? Ghuron (обс.) 06:02, 3 ноября 2021 (UTC)
- Судя по всему, да. Но раз речь про ГВР, то мне кажется, что стоит не всё-всё менять, а сузить область до России или даже до кластеров статей с проблемными названиями (наверно, какие-то из областей больше всего затронуты). [Однако, это только моё мнение, традиционно осторожное :)] — Vort (обс.) 06:07, 3 ноября 2021 (UTC)
- Я лейблами обычно не занимаюсь, но если кто-то решится, то вот запрос по рекам, выдающий лейблы, алиасы и названия ру-вики статей. Это дело можно причесать в экселе (уточнение в скобочках там из названий выкусить и т.п.), а потом запузырить в quickstatements, который позволяет все что надо поправить. Ghuron (обс.) 09:06, 3 ноября 2021 (UTC)
- Vort, разве существуют причины, по которым название на ВД должно отличаться от названия Рувики? Кроме уточнений в скобках, понятно. 194.50.14.83 19:36, 3 ноября 2021 (UTC)
- Не должно, а может. Из-за ошибок. Понимаю, что участники проекта стараются, чтобы такого не было. Но поменять правильное название на неправильное всё равно не хочется. Хоть такая ситуация глубоко теоретическая. — Vort (обс.) 05:45, 4 ноября 2021 (UTC)
- Скорее невероятная. ВД даже не содержит поля для указания источника названия. Там априори инфа хуже чем в разделе. 185.16.139.69 17:29, 4 ноября 2021 (UTC)
- Ну, например, насколько мне известно, почти все активные русскоязычные пользователи викиданных придерживаются естественного именования И(О)Ф, вместо принятого тут Ф,ИО Ghuron (обс.) 05:49, 4 ноября 2021 (UTC)
- А причём тут речки? 185.16.139.69 17:29, 4 ноября 2021 (UTC)
- Ну вы задали вопрос без ограничения по темам, я ответил Ghuron (обс.) 05:38, 5 ноября 2021 (UTC)
- А причём тут речки? 185.16.139.69 17:29, 4 ноября 2021 (UTC)
- Вспомнился класс случаев, о которых стоит подумать. В Википедии все статьи начинаются с большой буквы, для меток в Викиданных такого ограничения нету. И есть практика писать с большой буквы только названия. Так вот вопрос. Есть статья Залив Святого Лаврентия. Не «залив Святого Лаврентия» ли метка в ВД должна быть? — Vort (обс.) 06:23, 4 ноября 2021 (UTC)
- Должна быть так, как бы вы написали в середине предложения. И судя по тому, что в статье написано «От Атлантического океана залив Святого Лаврентия отделяют острова…», то да, должно быть со строчной. — putnik 08:42, 4 ноября 2021 (UTC)
- Проверить капитализацию первой буквы на ВД дело одной минуты. И залив многие годы на ВД с большой, никто не переживает. 185.16.139.69 17:29, 4 ноября 2021 (UTC)
- Ну, в данном случае получаются тысячи минут. Да, это не критично, если в ВД будет заглавная, но если это можно быстро поправить при импорте и не тратить время на исправление потом в каждом элементе отдельно, то лучше всё же поправить. — putnik 08:36, 5 ноября 2021 (UTC)
- Проверить капитализацию первой буквы на ВД дело одной минуты. И залив многие годы на ВД с большой, никто не переживает. 185.16.139.69 17:29, 4 ноября 2021 (UTC)
- Должна быть так, как бы вы написали в середине предложения. И судя по тому, что в статье написано «От Атлантического океана залив Святого Лаврентия отделяют острова…», то да, должно быть со строчной. — putnik 08:42, 4 ноября 2021 (UTC)
- Не должно, а может. Из-за ошибок. Понимаю, что участники проекта стараются, чтобы такого не было. Но поменять правильное название на неправильное всё равно не хочется. Хоть такая ситуация глубоко теоретическая. — Vort (обс.) 05:45, 4 ноября 2021 (UTC)
- Судя по всему, да. Но раз речь про ГВР, то мне кажется, что стоит не всё-всё менять, а сузить область до России или даже до кластеров статей с проблемными названиями (наверно, какие-то из областей больше всего затронуты). [Однако, это только моё мнение, традиционно осторожное :)] — Vort (обс.) 06:07, 3 ноября 2021 (UTC)
- То есть топикстартер предлагает обновить лейблы у рек, взяв за основу названия ру-вики статей? Ghuron (обс.) 06:02, 3 ноября 2021 (UTC)
- Кстати из-за этой проблемы вы не смогли автоматически перевязать почти 18 тысяч рек с ГКГН. Таковы объёмы вопроса: не менее 15 тысяч устаревших названий. 185.16.139.69 17:33, 4 ноября 2021 (UTC)
- Проблема решена или остались ещё примеры некорректного именования? Ghuron (обс.) 20:18, 5 ноября 2021 (UTC)
- Ghuron, а кто его знает, все 18 тысяч рек проверять некогда. Но мусорные технические редиректы вносили на ВД зря… Теперь можно заново перевязать ГКГН по рекам. 194.50.15.16 18:35, 7 ноября 2021 (UTC)
Бот-создатель элементов
Сейчас тысячи статей не имеют элементов ВД. Предлагаю сделать бота, который бы ждал неделю от момента создания статьи, а затем делал новый элемент со страной и типом. Тип можно брать из алфавитных категорий, страну из параметров карточки. Недельная задержка нужна, чтобы желающие успевали связывать интервики и выставлять на удаление. С шаблоном КУ/КБУ/КОБ понятно игнорировать. 185.16.137.60 08:59, 22 октября 2021 (UTC)
- Не всегда элемент надо создавать. Часто надо просто найти. — Vort (обс.) 09:02, 22 октября 2021 (UTC)
- Инструментами ВД дубликаты обнаружить проще. Кроме того, никто этим не занимается: полагаю, объектов без элемента с каждым днём больше. 185.16.137.60 09:04, 22 октября 2021 (UTC)
- Проблема ещё и в том, что объекты создаёт d:user:GZWDer (flood) вот в таком виде: Q97315412. Уж лучше нормальный дубликат, чем вот это рукожопие, которое также может быть дубликатом, но уже сложным для выявления. 185.16.137.60 09:40, 22 октября 2021 (UTC)
- Уже не создаёт. Кстати, не одному мне не нравится такая деятельность. — Vort (обс.) 09:54, 22 октября 2021 (UTC)
- Ну так он годами это делает, ещё с 2015 если не ошибаюсь. И дальше будет. Создавать нормальные элементы с опознавательными характеристиками наперёд этого бота — меньшее из зол, да ещё с положительным эффектом в большинстве случаев. Интервик реально нет для очень многого из создаваемых здесь статей. И если интервику, скажем, целый год никто не искал, чего ждать-то? 185.16.137.60 10:17, 22 октября 2021 (UTC)
- Сейчас он в бане. — Vort (обс.) 10:19, 22 октября 2021 (UTC)
- А, не так прочёл. Появятся другие… 185.16.137.60 10:20, 22 октября 2021 (UTC)
- По сути вопроса: подождём ещё мнений. — Vort (обс.) 10:20, 22 октября 2021 (UTC)
- Сейчас он в бане. — Vort (обс.) 10:19, 22 октября 2021 (UTC)
- Ну так он годами это делает, ещё с 2015 если не ошибаюсь. И дальше будет. Создавать нормальные элементы с опознавательными характеристиками наперёд этого бота — меньшее из зол, да ещё с положительным эффектом в большинстве случаев. Интервик реально нет для очень многого из создаваемых здесь статей. И если интервику, скажем, целый год никто не искал, чего ждать-то? 185.16.137.60 10:17, 22 октября 2021 (UTC)
- Уже не создаёт. Кстати, не одному мне не нравится такая деятельность. — Vort (обс.) 09:54, 22 октября 2021 (UTC)
- Справа в разделе «Работа для участников» в третьей строчке ссылка на duplicity. В статистике видна пила, т.е. раньше кто-то (GZWDer) создавал элементы пачками. Ghuron (обс.) 11:52, 22 октября 2021 (UTC)
- То есть без бота получаем непрерывный рост прямо в космос. Никто статьи не перевязывает. Так и не понял что там за ерунда в подписях дат. 185.16.137.60 12:19, 22 октября 2021 (UTC)
- Я не уверен что тут поможет бот — много хитрых случаев, например, у людей страну писать нельзя (можно гражданство, но я бы его импортировать из наших категорий не стал бы).
Я сейчас зарядил литься дизамбиги по следующему сценарию:
- Я не уверен что тут поможет бот — много хитрых случаев, например, у людей страну писать нельзя (можно гражданство, но я бы его импортировать из наших категорий не стал бы).
- То есть без бота получаем непрерывный рост прямо в космос. Никто статьи не перевязывает. Так и не понял что там за ерунда в подписях дат. 185.16.137.60 12:19, 22 октября 2021 (UTC)
- Копи-пастим из дуплисити в эксель, вырезаем все лишнее, оставляя только названия статей
- Создаем табличку с 5 колонками:
- qid оставляем пустой
- Sruwiki название статьи (я делаю в кавычках, но, возможно, и не надо)
- Lru название статьи без уточнения в скобках
- Dru "страница значений"
- P31 Q4167410
- копипастим в текстовый редактор и заменяем табуляцию на запятые
- скармливаем в QuickStatements под видом CSV commands
- подробная справка по формату: d:Help:QuickStatements#CSV file syntax
По аналогии можно попробовать лить другие Ghuron (обс.) 13:09, 22 октября 2021 (UTC)
- А вот немецкий и английский разделы кто-то обслуживает, там плато, в отличие от французов. 185.16.137.60 12:27, 22 октября 2021 (UTC)
Есть хороший инструмент для поиска существущих и быстрого создания новых элементов Duplicity (как раз с минимальным наполнением). Ещё один Match new articles to items, увы, отключен. Рекомендую дать линк на первый в раздел «Работа для участников». — Kareyac (обс.) 13:09, 22 октября 2021 (UTC)
- Паттерны, которые прослеживаются при прокликивании элементов в Duplicity:
1) много страниц неоднозначностей, возможно их действительно стоит создавать ботом с нужным значением P31;
2) страницы, у которых после переименования элемент остался привязанным к перенаправлению — очень странный случай, вроде бы раньше был бот, который это исправлял;
3) темы, лучше всего описанные в русскоязычных источниках, с большой вероятностью без существующих элементов.
Возможно, если расчистить две первые категории ботами, то ситуация значительно улучшится, и будет проще привлекать участников к работе с тем, что не поддаётся автоматизации. — putnik 09:43, 1 ноября 2021 (UTC)
Есть карточка. В карточке есть графа "Участники". В ней указаны Лесли Гровс и Роберт Оппенгеймер, руководители проекта, что верно. Но почему-то перед ними указаны Lilli Hornig (по которому даже нет русскоязычной статьи) и Ву Цзяньсюн. Непонятно, почему из десятков ученых-участников проекта указаны эти двое (и отнюдь не самые известные). Правильно было бы указать как руководителей Гровса и Оппенгеймера, а дальше указать "и многие другие" со ссылкой на ru:Категория:Участники Манхэттенского проекта. Но как это сделать я не знаю. Сделайте! 109.252.201.66 12:32, 19 октября 2021 (UTC)
- Я передвинул Оппенгеймера с Гровсом на первые места и указал им приоритетный ранг, так что теперь в карточке выводятся только они. Не вижу проблемы, что другие значимые персоны тоже будут перечислены с нормальным рангом, если их, конечно, будет не 130 тысяч. Ну и вы всегда можете указать в карточке локально что-то другое. — putnik 21:25, 19 октября 2021 (UTC)
Спасибо! Ещё там есть графа "Место проведения", где почему-то указано "Реактор В". В качестве "места проведения" стоило бы указать просто "США", так как объектов было несколько (Лос-Аламос, Оак-Ридж, Хенфорд, Чикагский университет). 109.252.201.66 11:47, 20 октября 2021 (UTC)
Предки, шаблон
Тут, оказывается, опять придумали какое-то эзотерическое знание, с которым я обычно не сталкиваюсь, поскольку не правлю про королей и т.п. Вот смотрите: Вильгельм_Франц_Габсбург-Лотарингский#Предки. Из того, что мы видим в правом верхнем углу этого родословного древа, ясно, что император Леопольд был, внезапно, женат на герцоге Тешенском, а императрица Мария Луиза - замужем за герцогиней. И я вообще не могу понять, где это исправить. Андрей Романенко (обс.) 21:20, 17 октября 2021 (UTC)
- Насколько я смог понять это генеалогическое дерево, и император Леопольд и герцог Тешенский указаны в качестве отцов Карла Австрийского (а не в качестве супругов друг друга), а Мария Луиза и герцогиня Тешенская — в качестве матерей (аналогично). Нужно ли указывать приёмных родителей в генеалогическом дереве — другой вопрос. — Jim_Hokins (обс.) 04:40, 18 октября 2021 (UTC)
- Верю, что вы правы, но 1) выглядит это совершенно дико, и 2) вообще нет ни малейшей возможности разобраться, где внести изменения, если в такой схеме что-то вызывает вопросы. Андрей Романенко (обс.) 14:54, 18 октября 2021 (UTC)
- 1) Выглядит не очень понятно, согласен. 2) Судя по документации шаблона, информация полностью берётся из викиданных. Я так понимаю, что если нужно изменить какого-нибудь предка, надо изменить родителя на странице ребёнка этого самого предка в викиданных. То есть, например, если нужно убрать из обсуждаемого генеалогического дерева вышеупомянутого герцога Тешенского, нужно удалить его из параметра «отец» на странице Карла Австрийского в Викиданных. Возможно (возможно), достаточно будет присвоить ему нерекомендуемый ранг, но в этом я точно не уверен, а тестировать не хочу. — Jim_Hokins (обс.) 16:27, 18 октября 2021 (UTC)
- Всё, до меня дошло. Там у герцога и герцогини Тешенских стоит же квалификатор "приёмные родители". Значит, задача сводится к тому, чтобы разграничить способы выведения родителей в карточках и шаблонах в зависимости от того, родные они или приёмные. Я только не понимаю, где это должно обсуждаться - у нас или на Викиданных. Андрей Романенко (обс.) 17:18, 18 октября 2021 (UTC)
- У нас. Наверное, здесь. Надо, чтобы при наличии "приёмные родители" информация из Викиданных не подгружалась. Правда автор шаблона сейчас неактивен, но может кто-то ещё возьмётся исправить. Vladimir Solovjev обс 19:50, 18 октября 2021 (UTC)
- Запрос-то этот, может, технически и несложный, но его ещё как-то додумать надо до конца. Я бы осторожно предположил, что приёмные родители не должны подгружаться только в том случае, если наряду с ними указаны и родные, а если родных нет, то пусть подгружаются приёмные. Но тут бы хорошо бы какого-то специалиста именно по королевским династиям спросить, как правильно. Кто бы это у нас мог быть? Андрей Романенко (обс.) 22:49, 18 октября 2021 (UTC)
- У нас. Наверное, здесь. Надо, чтобы при наличии "приёмные родители" информация из Викиданных не подгружалась. Правда автор шаблона сейчас неактивен, но может кто-то ещё возьмётся исправить. Vladimir Solovjev обс 19:50, 18 октября 2021 (UTC)
- Всё, до меня дошло. Там у герцога и герцогини Тешенских стоит же квалификатор "приёмные родители". Значит, задача сводится к тому, чтобы разграничить способы выведения родителей в карточках и шаблонах в зависимости от того, родные они или приёмные. Я только не понимаю, где это должно обсуждаться - у нас или на Викиданных. Андрей Романенко (обс.) 17:18, 18 октября 2021 (UTC)
- 1) Выглядит не очень понятно, согласен. 2) Судя по документации шаблона, информация полностью берётся из викиданных. Я так понимаю, что если нужно изменить какого-нибудь предка, надо изменить родителя на странице ребёнка этого самого предка в викиданных. То есть, например, если нужно убрать из обсуждаемого генеалогического дерева вышеупомянутого герцога Тешенского, нужно удалить его из параметра «отец» на странице Карла Австрийского в Викиданных. Возможно (возможно), достаточно будет присвоить ему нерекомендуемый ранг, но в этом я точно не уверен, а тестировать не хочу. — Jim_Hokins (обс.) 16:27, 18 октября 2021 (UTC)
- Верю, что вы правы, но 1) выглядит это совершенно дико, и 2) вообще нет ни малейшей возможности разобраться, где внести изменения, если в такой схеме что-то вызывает вопросы. Андрей Романенко (обс.) 14:54, 18 октября 2021 (UTC)
Викимапия
Может у кого есть мысли как автоматизировать перевязку? См. ВП:Ф-ГЕО#Викимапия. 194.50.15.241 05:55, 14 октября 2021 (UTC)
- Чем вас идентификатор Викимапии (P7678) не устраивает? — evs 💬 04:50, 29 октября 2021 (UTC)
- Сказано же, «автоматизировать». Или вы готовы 250 тысяч НП перевязать руками? 194.50.15.16 18:38, 7 ноября 2021 (UTC)
В карточку статьи из ВД импортируется некорректная информация («рум. Tiraspol» — румынский язык вместо молдавского). Соответствующий элемент в ВД защищён до уровня автоподов, подавить импорт непосредственно черед код статьи не получается. Просьба оказать содействие с исправлением некорректной информации; также прошу указать, как в подобных ситуациях корректно и результативно подавлять некорректные данные, импортируемые из ВД. С уважением, — Полиционер (обс.) 18:08, 12 октября 2021 (UTC)
- Похоже на ошибку где-то в шаблонах. — Vort (обс.) 18:19, 12 октября 2021 (UTC)
- Коллега @Полиционер, поправил, это в код забрался неразрывный пробел, получилось «| оригинальное название наразрывный-пробел =» и движок воспринимал параметр как «оригинальное название наразрывный-пробел». Это стандартная поломка, по которой параметры неожиданно не работают, её наличие можно проверить, стерев пробелы между «оригинальное название» и «=», поставив новые в том же количестве и нажав «внесённые изменения» — если изменилось что-то, был неразрывный пробел, или же скопировав кусок кода страницы (не из диффа, там неразрывные пробелы и пробелы могут меняться вроде) в [1]. Викизавр (обс.) 18:21, 12 октября 2021 (UTC)
- Так и не сделали подсветку. — Vort (обс.) 18:24, 12 октября 2021 (UTC)
- Благодарю за помощь, коллега! С уважением, — Полиционер (обс.) 18:29, 12 октября 2021 (UTC)
- По идее, если выделить строчку и нажать викификатор, он сам зачистит неразрывные пробелы. И это опять проблема, отчасти порождённая тем вносильщиком замены мнемоники nbsp; в викификатор. Годами жалуются, ноль реакции. 194.50.15.241 03:53, 13 октября 2021 (UTC)
- возьмите да поправьте код, делов-то ShinePhantom (обс) 04:41, 13 октября 2021 (UTC)
- Ага, зарегаться, набрать стаж, сходить за флагом админа интерфейса и внести. Ах, забыл, ещё надо месяц-два-три организовывать опрос, ибо на СО вопрос не решается. 194.50.15.241 04:51, 13 октября 2021 (UTC)
- ну тогда чего жаловаться? ShinePhantom (обс) 09:00, 13 октября 2021 (UTC)
- Ага, зарегаться, набрать стаж, сходить за флагом админа интерфейса и внести. Ах, забыл, ещё надо месяц-два-три организовывать опрос, ибо на СО вопрос не решается. 194.50.15.241 04:51, 13 октября 2021 (UTC)
- возьмите да поправьте код, делов-то ShinePhantom (обс) 04:41, 13 октября 2021 (UTC)
- Т.е. все-таки заменили локальным значением информацию из Викиданных. Может, лучше было бы поправить в Викиданных (что я, собственно, и сделал). Michgrig (talk to me) 06:50, 13 октября 2021 (UTC)
- Локальную ошибку (вредящие неразрывные пробелы) всё равно надо было исправлять. — Vort (обс.) 06:51, 13 октября 2021 (UTC)
- Ее можно было исправить и полным удалением параметра из кода карточки :))) Michgrig (talk to me) 07:02, 13 октября 2021 (UTC)
- К сожалению, с консенсусностью таких удалений есть проблемы. — Vort (обс.) 07:05, 13 октября 2021 (UTC)
- Ее можно было исправить и полным удалением параметра из кода карточки :))) Michgrig (talk to me) 07:02, 13 октября 2021 (UTC)
- Не заменяли, она всегда там была, только в какой-то момент сломали. --217.118.92.78 07:13, 13 октября 2021 (UTC)
- Коллега @Лобачев Владимир, к сожалению, у вас редактор ломает параметры шаблонов, см. [2]. Скажите, вы можете попробовать воспроизвести баг из phab:T233809? Викизавр (обс.) 08:25, 13 октября 2021 (UTC)
- Может я случайно «на автомате» нажал неразрывный пробел? Мне по работе нередко приходится его вставлять в текст с помощью нажатия клавиш Sift+Spase. — Лобачев Владимир (обс.) 20:17, 13 октября 2021 (UTC)
- Коллега @Лобачев Владимир, к сожалению, у вас редактор ломает параметры шаблонов, см. [2]. Скажите, вы можете попробовать воспроизвести баг из phab:T233809? Викизавр (обс.) 08:25, 13 октября 2021 (UTC)
- Коллега @Michgrig, на всякий случай: с точки зрения лингвистики и конституции Молдавии никакого молдавского языка нет, есть только молдавская разновидность румынского языка. В рувики с принятием этого проблемы и потому тут везде проставляют молдавский язык, но вряд ли корректно добавлять молдавский язык и на Викиданные, не страдающие от наших системных отклонений. В статье Тирасполь особый случай, потому что он находится под контролем ПМР, которая признаёт существование молдавского языка (и потому, возможно, корректно проставить оба языка, румынский с точки зрения Молдавии и молдавский с точки зрения ПМР), но вот в городах вне контроля ПМР никакой молдавский язык не ставьте, пожалуйста. Викизавр (обс.) 08:14, 13 октября 2021 (UTC)
- Локальную ошибку (вредящие неразрывные пробелы) всё равно надо было исправлять. — Vort (обс.) 06:51, 13 октября 2021 (UTC)
Заливка ГКГН в Викиданные
Кто-то мог бы осуществить заливку d:Property:P1397 при помощи шаблона шаблон:ГКГН? Свойство почти не заполнено (608 на ВД против 7706 здесь), но позволяет осуществлять быструю валидацию названий и координат. Первично достаточно проверить, чтобы шаблон использовался в статье один раз (по таким случаям сделать список к ручному разбору), остальные мелкие ошибки всплывут в отчётах по дубликатам на ВД. 185.16.136.13 13:46, 14 сентября 2021 (UTC)
Заливка из шаблонов и списка
- harvest templates? Ghuron (обс.) 02:55, 15 сентября 2021 (UTC)
- нет, увы, почему-то не может найти в тексте шаблон.
@Pasleim could you please advise why [3] doesn't work? Ghuron (обс.) 04:04, 15 сентября 2021 (UTC)- Если это был пинг, то неудачный. — Vort (обс.) 04:07, 15 сентября 2021 (UTC)
- он в рефах не обрабатывает. И мне кажется, что по делу. Потому что подтверждается ими что угодно, а не только объект статьи.
На территории заповедника расположены хребет [[Маньпупунёр]]<ref>{{Реестры зарегистрированных наименований географических объектов|Республика Коми||0169098|Мань-Пупунёр}}</ref>
ShinePhantom (обс) 09:24, 15 сентября 2021 (UTC)- да, похоже ты прав: Templates within < ref >...< /ref> are not read Ghuron (обс.) 10:05, 15 сентября 2021 (UTC)
- я пустил вчера и сегодня продолжил. Речки все мимо, а вот нп в основном переносятся. Но результативность не более 10 % ShinePhantom (обс) 13:08, 15 сентября 2021 (UTC)
- 1926 стало на ВД. На этом все. ShinePhantom (обс) 18:03, 15 сентября 2021 (UTC)
- нет, увы, почему-то не может найти в тексте шаблон.
- Вопрос (наивный, но от сторонника интеграции с ВД): а что мешает просто залить полностью ГКГН в ВД? То есть названия статей не всегда понятны, но в шаблоне по населению (например) они ведь уже готовые? — Vulpo (обс.) 19:01, 15 сентября 2021 (UTC)
- Полагаю, что могут существовать недалеко друг от друга объекты с одним и тем же названием и алгоритм заливки их попутает. Если же координат в элементе ВД нет, так вообще не будет понятно, куда привязывать, так как в таком случае идентичных наименований будет совсем много. — Vort (обс.) 05:46, 16 сентября 2021 (UTC)
- Ещё могут быть различающиеся (при этом равноправные) написания названий одного и того же объекта. — Vort (обс.) 05:48, 16 сентября 2021 (UTC)
- Технически залить можно табличку из двух колонок: идентификатора викиданных (вида QXXXX) и, собственно, семизначного регистрационного номера. Вот тут есть 170 pdfок, которые можно превратить в одну большую табличку (если гугль-док нам не окончательно заблочили), и потом попытаться по названию и «типу объекта» получить корректный идентификатор викиданных. Я готов помочь в том, что касается собственно викиданных, но тут много ручной работы, а времени у меня почти нет Ghuron (обс.) 06:19, 16 сентября 2021 (UTC)
- Неужели технологии уже дошли до корректного импорта pdf`ок? Не пользовался гугл-доками, но про то, что pdf привести в приемлемый вид алгоритмически непросто, в курсе. — Vort (обс.) 06:28, 16 сентября 2021 (UTC)
- Ну pdfка pdfке рознь, я попробовал скопипастить текст из алтайского края, он в целом вставляется нормально. Разбиение на столбцы пропадает, но это поправимо, хотя, конечно, и потребует значительной ручной (а не алгоритмической) работы. Ghuron (обс.) 06:58, 16 сентября 2021 (UTC)
- Дарю. Но протяжённые объекты всё равно так не получится залить, для тех же рек логично взять из ref. 194.50.12.142 08:10, 16 сентября 2021 (UTC)
- На случай если кто-то решит делать заливку по этой таблице, хотелось бы знать методику её получения. — Vort (обс.) 08:19, 16 сентября 2021 (UTC)
- Взято с сайта Росреестра в открытых данных. Свежесть около двух-трёх месяцев. Далее всё отсортировано по кодам средствами LibbreOffice Calc. Искать оригинал не буду, там вечные переезды, да и капчу тут опять вводить… 194.50.12.142 08:23, 16 сентября 2021 (UTC)
- Ок, спасибо. Главное, что это не парсинг pdf`ки. — Vort (обс.) 08:24, 16 сентября 2021 (UTC)
- Взято с сайта Росреестра в открытых данных. Свежесть около двух-трёх месяцев. Далее всё отсортировано по кодам средствами LibbreOffice Calc. Искать оригинал не буду, там вечные переезды, да и капчу тут опять вводить… 194.50.12.142 08:23, 16 сентября 2021 (UTC)
- А он спецом по 812530 обрезан или это у меня эксель не справился? Ghuron (обс.) 08:55, 16 сентября 2021 (UTC)
- Похоже, что 7й разряд — задел на будущее. Копаю сейчас выгрузку из WD — из 602 элементов ни в одном нет ненулевого 7го разряда. — Vort (обс.) 09:08, 16 сентября 2021 (UTC)
- В файле-оригинале 812530 — максимальный номер объекта. 194.50.12.142 09:59, 16 сентября 2021 (UTC)
- Ghuron, Vort, я нашёл где 7-й разряд. Это коды для наименований в Антарктике и открытом море. В моём файле их нет, к сожалению. Но на сайте Росреестра есть pdf с перечнем (ОБЪЕКТЫ КОНТИНЕНТАЛЬНОГО ШЕЛЬФА И ИСКЛЮЧИТЕЛЬНОЙ ЭКОНОМИЧЕСКОЙ ЗОНЫ РОССИЙСКОЙ ФЕДЕРАЦИИ). 194.50.12.142 16:36, 16 сентября 2021 (UTC)
- Попробовал сделать примитивный матчинг по сёлам. Расстояние < 0.1 градуса, полное совпадение по уникальному имени. Из 637441 записи ГКГН и 21745 записи ВД удалось сопоставить всего 39 записей. Но этот результат явно можно улучшать. Может, даже на 1-2 порядка. Если кому-то интересно посмотреть на результаты, то они в скрытом блоке:
- На случай если кто-то решит делать заливку по этой таблице, хотелось бы знать методику её получения. — Vort (обс.) 08:19, 16 сентября 2021 (UTC)
- Дарю. Но протяжённые объекты всё равно так не получится залить, для тех же рек логично взять из ref. 194.50.12.142 08:10, 16 сентября 2021 (UTC)
- Ну pdfка pdfке рознь, я попробовал скопипастить текст из алтайского края, он в целом вставляется нормально. Разбиение на столбцы пропадает, но это поправимо, хотя, конечно, и потребует значительной ручной (а не алгоритмической) работы. Ghuron (обс.) 06:58, 16 сентября 2021 (UTC)
- Неужели технологии уже дошли до корректного импорта pdf`ок? Не пользовался гугл-доками, но про то, что pdf привести в приемлемый вид алгоритмически непросто, в курсе. — Vort (обс.) 06:28, 16 сентября 2021 (UTC)
30657|Старое Зеленое|Q18802189||0,0036 72135|Староаширово|Q18802130||0,0529 72538|Верхняя Вязовка|Q13649064||0,0977 146520|Шалушка|Q16719194||0,0482 146543|Яникой|Q13647914||0,0561 146563|Кишпек|Q4222705||0,0275 146602|Карагач|Q13667170||0,0383 155262|Псыншоко|Q18408736||0,0589 221250|Уртакуль|Q1059266||0,0768 250662|Кишпек|Q4222705||0,0581 250977|Карагач|Q13667170||0,0425 346894|Есаул|Q4177041||0,0990 346927|Тюй|Q4467372||0,0553 347189|Андреево|Q16014567||0,0376 347201|Спасо-Барда|Q16014672||0,0069 347274|Зернино|Q19615906||0,0518 347427|Сабарка|Q4403443||0,0639 347429|Седа|Q18408976||0,0617 518182|Метевбаш|Q1054440||0,0848 519788|Ташлыкуль|Q1058882||0,0443 519993|Киска-Елга|Q1059663||0,0931 520080|Балышлы|Q1057826||0,0184 520130|Канлы-Туркеево|Q1058500||0,0974 520186|Старосеменкино|Q2570909||0,0694 520254|Такчура|Q1056308||0,0691 520306|Старокучербаево|Q1056472||0,0782 520958|Акуди|Q1056498||0,0303 520998|Маядыково|Q4286306||0,0344 521011|Чирша-Тартыш|Q1068741||0,0225 521939|Улеево|Q1057684||0,0116 522331|Башкортостан|Q1051637||0,0109 522458|Старый Мутабаш|Q1051712||0,0882 524921|Новотураево|Q1062631||0,0170 525002|Исламбахты|Q1063057||0,0313 525108|Новошахово|Q1062440||0,0297 655576|Троицкий|Q4463492||0,0189 666502|Ташлыкуль|Q1058882||0,0809 666513|Уртакуль|Q1059266||0,0732 670136|Акудибашево|Q1056072||0,0973
SELECT ?item ?itemLabel ?coords ?ate ?gkgn WHERE {
?item wdt:P17 wd:Q159 .
?item wdt:P31 wd:Q532 .
?item wdt:P131 ?ate .
?item wdt:P625 ?coords .
OPTIONAL { ?item wdt:P1397 ?gkgn . }
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text.RegularExpressions;
namespace ConsoleApplication95
{
class GKGNRecord
{
public int Id;
public string Name;
public string Type;
public string ATE1;
public string ATE2;
public double Lat;
public double Lon;
}
class WdRecord
{
public string Id;
public string Name;
public double Lat;
public double Lon;
public string GkgnId;
}
class Program
{
static void Main(string[] args)
{
string wde = "http://www.wikidata.org/entity/";
Console.Write("Loading wd...");
var wdRecords = new List<WdRecord>();
var lines = File.ReadAllLines("wd.tsv").Skip(1).ToArray();
foreach (var line in lines)
{
var ls = line.Split('\t');
var rec = new WdRecord();
rec.Id = ls[0].Replace(wde, "");
rec.Name = ls[1];
var ptm = Regex.Match(ls[2].Replace('.', ','), "Point\\(([0-9,\\-]+) ([0-9,\\-]+)\\)");
if (!ptm.Success)
continue;
rec.Lat = double.Parse(ptm.Groups[1].Value); // rus locale required
rec.Lon = double.Parse(ptm.Groups[2].Value);
rec.GkgnId = ls[4];
wdRecords.Add(rec);
}
Console.WriteLine("Done");
Console.Write("Loading gkgn...");
var gkgnRecords = new List<GKGNRecord>();
lines = File.ReadAllLines(
"goskatalog_Spisok_NP_i_ATE_na_vsu_RF_1_1.csv");
foreach (var line in lines)
{
var ls = line.Split('|');
var rec = new GKGNRecord();
rec.Id = int.Parse(ls[0]);
rec.Name = ls[1];
rec.Type = ls[2];
rec.ATE1 = ls[3];
rec.ATE2 = ls[4];
rec.Lat = double.Parse(ls[5]); // rus locale required
rec.Lon = double.Parse(ls[6]);
gkgnRecords.Add(rec);
}
Console.WriteLine("Done");
foreach (var gkgnr in gkgnRecords)
{
var wdrl = wdRecords.Where(r => r.Name == gkgnr.Name).ToArray();
if (wdrl.Length == 0)
continue;
if (wdrl.Length == 1)
{
var wdr = wdrl[0];
double d1 = wdr.Lat - gkgnr.Lat;
double d2 = wdr.Lon - gkgnr.Lon;
double dist = Math.Sqrt(d1 * d1 + d2 * d2);
if (dist < 0.1)
{
Console.WriteLine($"{gkgnr.Id}|{gkgnr.Name}|{wdr.Id}|{wdr.GkgnId}|{dist:0.0000}");
}
}
}
}
}
}
- — Vort (обс.) 09:44, 16 сентября 2021 (UTC)
- Vort, судя по выхлопу куда эффективнее обработать ref в Рувике и просто сопоставить названия — 5500+ новых привязок гарантировано. 194.50.12.142 10:34, 16 сентября 2021 (UTC)
- Да полезно и то, и другое. Попробую разобраться, почему такой слабый результат. Наверно в ВД полно названий со скобками. — Vort (обс.) 10:36, 16 сентября 2021 (UTC)
- Загадка какая-то. В выгрузке из ВД оказались попутаны широта и долгота. Разбираюсь. — Vort (обс.) 10:49, 16 сентября 2021 (UTC)
- Ага, выше — список ошибок с перевёрнутыми координатами. Вот так случайно создал валидатор. Скоро нормальный список подготовлю. — Vort (обс.) 10:57, 16 сентября 2021 (UTC)
- Вы, собсно, можете сразу форматировать его в виде d:Help:QuickStatements#Add simple statement и скармливать в QS Ghuron (обс.) 10:59, 16 сентября 2021 (UTC)
- Это больше разведка. До качественного списка ещё далеко. К примеру, в версии №2 очень много расхождений по кодам. Может, устаревшие. Может, надо 0.1 градус в 0.01 превращать. Может, без добавления обработки АТЕ ничего толкового не выйдет. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)
- Теперь другое дело: список. 12173 записи. — Vort (обс.) 11:10, 16 сентября 2021 (UTC)
- Проверил типы в этой (второй) версии. Получилось вот так:
- Ага, выше — список ошибок с перевёрнутыми координатами. Вот так случайно создал валидатор. Скоро нормальный список подготовлю. — Vort (обс.) 10:57, 16 сентября 2021 (UTC)
- Vort, судя по выхлопу куда эффективнее обработать ref в Рувике и просто сопоставить названия — 5500+ новых привязок гарантировано. 194.50.12.142 10:34, 16 сентября 2021 (UTC)
- — Vort (обс.) 09:44, 16 сентября 2021 (UTC)
+ [0] {[село, 10763]} + [1] {[река, 638]} + [2] {[деревня, 196]} + [3] {[озеро, 121]} + [4] {[гора, 73]} + [5] {[посёлок, 63]} + [6] {[хутор, 41]} + [7] {[ручей, 28]} + [8] {[железнодорожная станция (нп), 20]} + [9] {[станция (нп), 17]} + [10] {[балка, 15]} + [11] {[посёлок при станции, 13]} + [12] {[залив, 13]} + [13] {[падь, 12]} + [14] {[бухта, 10]} + [15] {[мыс, 10]} + [16] {[протока, 9]} + [17] {[водохранилище, 8]} + [18] {[слобода, 7]} + [19] {[рабочий посёлок, 7]} + [20] {[овраг, 7]} + [21] {[посёлок при разъезде, 6]} + [22] {[улус (населенный пункт), 6]} + [23] {[губа, 5]} + [24] {[посёлок при железнодорожной станции, 5]} + [25] {[перевал, 5]} + [26] {[сумон, 5]} + [27] {[город, 4]} + [28] {[посёлок городского типа, 4]} + [29] {[остров, 4]} + [30] {[лес, 4]} + [31] {[болото, 4]} + [32] {[станица, 3]} + [33] {[посёлок сельского типа, 3]} + [34] {[хребет, 3]} + [35] {[курган, 3]} + [36] {[железнодорожный разъезд (нп), 3]} + [37] {[сельсовет, 3]} + [38] {[разъезд (нп), 2]} + [39] {[посёлок при железнодорожном разъезде, 2]} + [40] {[озёра, 2]} + [41] {[сельское поселение, 2]} + [42] {[город областного подчинения, 1]} + [43] {[город краевого подчинения, 1]} + [44] {[город республиканского подчинения, 1]} + [45] {[город областного значения, 1]} + [46] {[город республиканского значения, 1]} + [47] {[сельский посёлок, 1]} + [48] {[населённый пункт, 1]} + [49] {[дорожный разъезд (нп), 1]} + [50] {[ледник, 1]} + [51] {[грива, 1]} + [52] {[канал, 1]} + [53] {[щель, 1]} + [54] {[лагуна, 1]} + [55] {[банка, 1]} + [56] {[ерик, 1]} + [57] {[бугор, 1]} + [58] {[минеральный источник, 1]} + [59] {[порог, 1]} + [60] {[перекат, 1]} + [61] {[старица, 1]} + [62] {[арбан, 1]} + [63] {[поселение, 1]} + [64] {[лог, 1]} + [65] {[район, 1]}
- Для версии номер три оставил только
село
,деревня
,посёлок
: Special:Permalink/116681436, всего 10763 + 196 + 63 = 11022 записи. — Vort (обс.) 11:45, 16 сентября 2021 (UTC) - Оценка количества ошибок в 3й версии: ~0.3%. Неплохо, думал будет хуже. Только в одной записи (с заполненным кодом) вышло расхождение — Q4319356. Случай близкого расположения, кстати: https://imgur.com/a/UOM4wLb. Такое только по типам можно отфильтровать (при условии их корректного задания в Викиданных). — Vort (обс.) 12:01, 16 сентября 2021 (UTC)
- Построил гистограмму распределения расстояний между одноимёнными объектами. Видно, что наугад выбранная граница в 0.1 градус почти идеальна: https://imgur.com/a/JpuvsJ7. — Vort (обс.) 12:47, 16 сентября 2021 (UTC)
- Более полная версия (убрал требование уникальности имени для выгрузки из ВД, толку от него было мало) №4: Special:Permalink/116682460. Получилось 18033 записи. Примерно 83% из выгрузки ВД удалось сопоставить. По дублям (ошибкам сопоставления) отдельно буду таблицу делать. — Vort (обс.) 12:56, 16 сентября 2021 (UTC)
- Случаи, когда для одного элемента ВД находится несколько элементов ГКГН:
- Для версии номер три оставил только
№1: Q4139792|Глинки:
0000159|деревня|0,061486
0329222|село|0,008089
№2: Q18398967|Китово:
0000713|село|0,016313
0331523|деревня|0,016945
№3: Q19691819|Ушмор:
0001391|деревня|0,018177
0001437|село|0,044257
№4: Q19847769|Бавлены:
0002044|посёлок|0,020253
0458090|село|0,000584
№5: Q19884872|Спасское:
0002366|деревня|0,001462
0307808|село|0,000352
№6: Q4163930|Добрятино:
0003009|деревня|0,001129
0003010|посёлок|0,088975
№7: Q4494331|Хабарово:
0003450|деревня|0,021697
0003451|село|0,000823
№8: Q4196756|Ивановское:
0003624|село|0,001501
0003625|посёлок|0,062523
№9: Q19859391|Алексино:
0004499|село|0,000866
0308836|деревня|0,011535
№10: Q19614695|Демидово:
0004932|деревня|0,002672
0115202|село|0,004314
№11: Q4318760|Нижнедевицк:
0006292|село|0,005916
0008582|посёлок|0,004859
№12: Q13664563|Конёво:
0006688|деревня|0,015564
0526836|село|0,000675
№13: Q4209597|Калинино:
0006719|посёлок|0,002449
0006730|село|0,002449
№14: Q13665172|Заболотье:
0006745|село|0,001385
0612691|деревня|0,031278
№15: Q4070631|Архангельское:
0006948|село|0,082882
0617481|деревня|0,005706
№16: Q4070643|Архангельское:
0006948|село|0,001502
0617481|деревня|0,085177
№17: Q19826946|Каверье:
0007801|село|0,075470
0630348|село|0,002894
№18: Q17385166|Абрамовка:
0007805|село|0,005971
0007866|посёлок|0,090403
№19: Q4319356|Омка Нижняя Омка:
0011986|село|0,003633
0364065|деревня|0,018690
№20: Q2236290|Шипуново:
0012264|село|0,007712
0151493|село|0,076021
№21: Q12080617|Балезино:
0012698|посёлок|0,058598
0517466|село|0,003344
№22: Q1069802|Малояз:
0013346|село|0,012578
0674905|село|0,051927
№23: Q15254493|Малояз:
0013346|село|0,048398
0674905|село|0,006366
№24: Q4232567|Копьёво:
0013552|посёлок|0,000323
0562585|село|0,052412
№25: Q16487548|Абрамцево:
0016792|село|0,002762
0016801|деревня|0,051527
№26: Q4107028|Вельяминово:
0020416|посёлок|0,049001
0305839|село|0,006146
№27: Q4169264|Дубки:
0022036|посёлок|0,025760
0305709|село|0,017815
№28: Q18772120|Ганусово:
0022062|село|0,003414
0305658|посёлок|0,034420
№29: Q76831259|Лаишевка:
0030671|село|0,003751
0031411|посёлок|0,069938
№30: Q18765651|Аппаково:
0031305|село|0,003838
0142851|село|0,053677
№31: Q4479486|Ушаки:
0032564|село|0,006267
0208540|посёлок|0,090944
№32: Q4227916|Колкач:
0032950|село|0,010570
0032951|деревня|0,006136
№33: Q13656661|Косково:
0034175|село|0,028612
0241485|деревня|0,017590
№34: Q4323735|Новое:
0035242|село|0,050142
0243645|деревня|0,050142
№35: Q4372847|Поповское:
0035507|село|0,013900
0245889|деревня|0,098736
№36: Q221858|Гжель:
0039711|село|0,002268
0305657|посёлок|0,029586
№37: Q16670940|Лесково:
0040148|деревня|0,016855
0612816|село|0,000876
№38: Q18807294|Шугарово:
0040688|село|0,004742
0807714|деревня|0,018399
№39: Q16022691|Покровское:
0040867|село|0,005137
0305474|посёлок|0,011159
№40: Q4238651|Красное:
0041091|село|0,011623
0305704|посёлок|0,004129
№41: Q18807389|Щапово:
0042520|деревня|0,014831
0305569|село|0,003810
№42: Q4228813|Колчедан:
0051840|посёлок|0,031295
0089330|село|0,011730
№43: Q23957749|Колюткино:
0051843|посёлок|0,020647
0320363|село|0,013622
№44: Q19814850|Памятка:
0052705|село|0,016667
0301224|посёлок|0,084984
№45: Q4325344|Новоселье:
0055221|село|0,007270
0422671|деревня|0,030385
№46: Q4514557|Чернёво:
0055825|село|0,021175
0424524|деревня|0,015865
№47: Q19868805|Тростянка:
0056085|посёлок|0,002745
0056248|село|0,015470
№48: Q29567659|Берёзовик:
0059959|село|0,006092
0315320|деревня|0,012913
№49: Q4067804|Анциферово:
0060153|село|0,034201
0312609|деревня|0,006054
№50: Q4243104|Крюки:
0060354|деревня|0,007857
0807762|деревня|0,007857
№51: Q18803352|Татариново:
0061901|село|0,004353
0305536|деревня|0,004052
№52: Q17387004|Красное:
0062060|село|0,019751
0305756|деревня|0,002000
№53: Q4338568|Остафьево:
0062233|село|0,036573
0080199|посёлок|0,021962
№54: Q4238013|Пахра Красная Пахра:
0062309|село|0,003162
0305703|деревня|0,021418
№55: Q4371830|Понзари:
0065111|село|0,043704
0808242|село|0,011694
№56: Q4239597|Рог Красный Рог:
0066596|село|0,006257
0067458|посёлок|0,057729
№57: Q3656779|Добрунь:
0068584|село|0,002416
0069376|посёлок|0,023595
№58: Q4367982|Подоклинье:
0070091|село|0,029613
0070092|деревня|0,014500
№59: Q16014565|Андреевка:
0072455|посёлок|0,013389
0075211|село|0,004031
№60: Q18407676|Перевесье:
0076209|село|0,000441
0076210|деревня|0,022524
№61: Q14620895|Заречье:
0077484|деревня|0,084494
0077495|село|0,000621
№62: Q4125957|Воротынск:
0078007|посёлок|0,016667
0078243|село|0,012745
№63: Q27572670|Кудиново:
0078040|село|0,010805
0487398|деревня|0,007206
№64: Q27575923|Павлиново:
0078359|село|0,002060
0304304|деревня|0,018627
№65: Q25508262|Московка:
0078635|деревня|0,093161
0079042|село|0,006113
№66: Q16020081|Бредихино:
0078894|деревня|0,042843
0079670|село|0,002657
№67: Q4248005|Курганка:
0078923|деревня|0,010230
0108412|село|0,003626
№68: Q4463366|Троекурово:
0079483|село|0,002176
0108623|деревня|0,056028
№69: Q18401962|Стрельниково:
0085858|село|0,002567
0085859|посёлок|0,087941
№70: Q7491824|Абалаково:
0086592|посёлок|0,072383
0086594|село|0,017373
№71: Q4079530|Батурино:
0087065|село|0,007783
0087066|деревня|0,073191
№72: Q4089395|Богданово:
0087271|село|0,026967
0807881|деревня|0,005727
№73: Q2471455|Лая:
0089362|посёлок|0,064670
0089363|село|0,008967
№74: Q4232433|Коптелово:
0090017|посёлок|0,094791
0090954|село|0,010282
№75: Q4125524|Воронино:
0103300|село|0,000393
0103340|деревня|0,091467
№76: Q25509181|Куликово:
0113931|село|0,005036
0113932|деревня|0,019983
№77: Q4500380|Хотмыжск:
0115631|село|0,004652
0133256|посёлок|0,090746
№78: Q21673064|Сажное:
0115985|посёлок|0,080692
0115986|село|0,004085
№79: Q16273329|Артышта:
0118749|село|0,010035
0221072|посёлок|0,060467
№80: Q13203273|Атрать:
0120465|село|0,007929
0694731|посёлок|0,025984
№81: Q16015035|Азей:
0120922|село|0,009204
0121009|деревня|0,068323
№82: Q13648156|Яр Белый Яр:
0137725|село|0,004730
0137726|посёлок|0,004730
№83: Q18407691|Жерлык:
0137958|посёлок|0,089753
0137959|село|0,023570
№84: Q28516958|Лапшиха:
0144631|посёлок|0,014405
0144632|село|0,033095
№85: Q4349490|Первомайское:
0145366|село|0,027999
0300249|село|0,030471
№86: Q28504389|Шидиб:
0145379|село|0,000923
0300156|село|0,080297
№87: Q28504446|Шидиб:
0145379|село|0,078245
0300156|село|0,001266
№88: Q16024416|Эссойла:
0151142|село|0,010989
0151144|посёлок|0,039082
№89: Q4104776|Васильевка:
0155351|село|0,001910
0289462|деревня|0,007857
№90: Q3326723|Барановка:
0160509|село|0,002678
0253033|село|0,085325
№91: Q12156079|Барановка:
0160509|село|0,086418
0253033|село|0,003883
№92: Q16017196|Покровка:
0165824|село|0,007505
0165825|посёлок|0,024168
№93: Q13643585|Шушь:
0167116|село|0,001620
0167117|посёлок|0,086189
№94: Q4211611|Каминский:
0171641|село|0,009637
0797533|деревня|0,015681
№95: Q4344406|Панфилово:
0171648|село|0,007558
0589116|деревня|0,000731
№96: Q4371861|Понизовье:
0177046|село|0,007857
0807886|деревня|0,028974
№97: Q1291708|Печерск:
0177080|село|0,003622
0807822|деревня|0,013749
№98: Q4169564|Дубосище:
0178173|село|0,025292
0178174|деревня|0,003167
№99: Q4152819|Гусино:
0178181|село|0,035186
0214628|деревня|0,012060
0214632|деревня|0,027167
№100: Q4455596|Теренино:
0178540|село|0,006719
0178541|деревня|0,014554
№101: Q4198534|Издешково:
0180498|деревня|0,033333
0315870|село|0,016667
№102: Q4120969|Салтыганово:
0189547|деревня|0,003616
0189549|деревня|0,003438
№103: Q16014751|Урсаево:
0190051|село|0,003536
0381494|село|0,003441
№104: Q4140422|Глушково:
0216981|деревня|0,041731
0216982|село|0,005343
№105: Q18170419|Лондоко:
0219234|посёлок|0,010528
0781677|село|0,006139
№106: Q4334973|Онор:
0219384|село|0,001930
0219385|село|0,002025
№107: Q4339874|Отнурок:
0221175|деревня|0,000567
0521726|село|0,075069
№108: Q4339875|Отнурок:
0221175|деревня|0,076517
0521726|село|0,002088
№109: Q4303589|Мосейково:
0247720|деревня|0,004615
0247721|село|0,004615
№110: Q4349533|Первомайское:
0247737|деревня|0,004955
0247738|село|0,004955
№111: Q19847936|Дубки:
0307916|посёлок|0,003333
0307921|село|0,007640
№112: Q4233475|Коробец:
0315903|село|0,022778
0315909|деревня|0,007474
№113: Q19908131|Усть-Игум:
0346011|село|0,009161
0796709|деревня|0,025496
№114: Q16018190|Харик:
0348897|село|0,047472
0803848|посёлок|0,025435
№115: Q16020144|Ваулово:
0386688|село|0,052370
0386689|посёлок|0,000823
0386690|деревня|0,077236
№116: Q4160942|Дзякино:
0517439|село|0,013103
0518470|деревня|0,035593
№117: Q18780023|Кекоран:
0518179|деревня|0,036070
0809257|село|0,003107
№118: Q4374279|Постол:
0518367|деревня|0,067796
0518422|село|0,001458
№119: Q4272193|Люкшудья:
0518417|село|0,002806
0718012|деревня|0,027804
0718805|село|0,051162
№120: Q12119369|Люкшудья:
0518417|село|0,053819
0718012|деревня|0,076781
0718805|село|0,002581
№121: Q12116391|Кизнер:
0518786|село|0,000730
0718981|посёлок|0,027563
№122: Q12115523|Кузьма:
0518913|село|0,002856
0522140|деревня|0,024213
№123: Q18923876|Буреть:
0638075|село|0,009410
0647762|деревня|0,061013
0803931|деревня|0,025408
№124: Q4297638|Михайловка:
0666132|деревня|0,081053
0666152|село|0,003871
№125: Q2559698|Шурала:
0688958|село|0,011198
0692774|посёлок|0,046001
№126: Q4102706|Валамаз:
0717066|село|0,092169
0717075|село|0,002746
№127: Q4102707|Валамаз:
0717066|село|0,001360
0717075|село|0,091592
№128: Q4191837|Зилай:
0717158|село|0,002027
0717211|деревня|0,020951
№129: Q12122648|Менил:
0717586|деревня|0,026597
0717589|село|0,000773
№130: Q4402441|Рябово:
0719137|деревня|0,007633
0719197|село|0,019633
№131: Q19690966|Таборы:
0736415|посёлок|0,005004
0736420|село|0,011666
№132: Q12107803|Калиновка:
0809261|село|0,007887
0809262|деревня|0,003172
- Случаи, когда для одного элемента ГКГН находится несколько элементов ВД:
№1: 0006948|Архангельское:
Q4070631|0,082882
Q4070643|0,001502
№2: 0007054|Лозовое:
Q4265612|0,029969
Q4265616|0,014922
№3: 0007183|Мамон Нижний Мамон:
Q4319162|0,041003
Q4319165|0,023223
№4: 0007770|Петропавловка:
Q13664936|0,003442
Q19681468|0,003833
№5: 0007845|Берёзовка:
Q4085453|0,008038
Q4085456|0,045105
№6: 0013346|Малояз:
Q1069802|0,012578
Q15254493|0,048398
№7: 0015621|Волчиха:
Q18771145|0,008799
Q20655576|0,008433
№8: 0031407|Елшанка:
Q4175154|0,010959
Q18776047|0,001337
№9: 0050292|Савины Старые Савины:
Q4440954|0,034248
Q24514474|0,007467
№10: 0065130|Кёрша:
Q21669511|0,005914
Q21669512|0,004687
№11: 0125519|Ой:
Q16896312|0,010176
Q78523327|0,006390
№12: 0145379|Шидиб:
Q28504389|0,000923
Q28504446|0,078245
№13: 0146245|Карланюрт:
Q4215213|0,001981
Q4439548|0,088271
№14: 0160509|Барановка:
Q3326723|0,002678
Q12156079|0,086418
№15: 0221175|Отнурок:
Q4339874|0,000567
Q4339875|0,076517
№16: 0253033|Барановка:
Q3326723|0,085325
Q12156079|0,003883
№17: 0300156|Шидиб:
Q28504389|0,080297
Q28504446|0,001266
№18: 0300696|Мачада:
Q13667577|0,001679
Q25396440|0,003102
№19: 0300778|Шари:
Q4520504|0,001691
Q25396485|0,000218
№20: 0518417|Люкшудья:
Q4272193|0,002806
Q12119369|0,053819
№21: 0521115|Бакаево:
Q4075819|0,002446
Q18766118|0,002883
№22: 0521726|Отнурок:
Q4339874|0,075069
Q4339875|0,002088
№23: 0522530|Михайловка:
Q4297571|0,005551
Q4297508|0,002098
№24: 0617481|Архангельское:
Q4070631|0,005706
Q4070643|0,085177
№25: 0674905|Малояз:
Q1069802|0,051927
Q15254493|0,006366
№26: 0717066|Валамаз:
Q4102706|0,092169
Q4102707|0,001360
№27: 0717075|Валамаз:
Q4102706|0,002746
Q4102707|0,091592
№28: 0718012|Люкшудья:
Q4272193|0,027804
Q12119369|0,076781
№29: 0718805|Люкшудья:
Q4272193|0,051162
Q12119369|0,002581
№30: 0798423|Знаменка:
Q4192749|0,001374
Q4192752|0,037860
- — Vort (обс.) 13:15, 16 сентября 2021 (UTC)
- Vort, их нет нужды мониторить, все дубликаты всплывают в отчёте на ВД: d:Wikidata:Database reports/Constraint violations/P1397. 194.50.12.142 14:55, 16 сентября 2021 (UTC)
- Идея в том, чтобы их не создавать. То есть, вручную обработать то, что для алгоритма слишком сложное. Я смогу исключить уже заполненные элементы из формируемого списка. — Vort (обс.) 15:08, 16 сентября 2021 (UTC)
- Да, чуть позже догадался. Тем не менее в таком формате, как представлен выше, разбирать список явно никто не будет. Я бы предпочёл разбирать отчёты Викиданных, где список имеет понятную структуру. Или в любом другом месте, но с позициями и со ссылкой на валидатор (есть в местном шаблоне). В любом случае вручную разобранное быстрее сразу заносить на ВД, чем формировать список и потом отдавать боту. Так что всё что уже однозначно идентифицировано надо заливать. 194.50.12.142 15:16, 16 сентября 2021 (UTC)
- Разобрать список так, чтобы в следующий раз при проходе алгоритма он оказался пустой — это я и имею в виду. Докидать ссылок — не проблема. Обновил списки выше. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)
- Так чего по итогу-то? Вольёте через d:Help:QuickStatements? Ghuron (обс.) 03:03, 17 сентября 2021 (UTC)
- @Ghuron: как я понимаю, u:ShinePhantom решил, что заливка с дублями — это нормально. Такой вариант тоже годится. Если кто-то потом расчистит дубли. Мне было важно, чтобы кто-то заливкой подтвердил, что мой список пригоден. Что и произошло. На всякий случай выкладываю упрощённый список с недозалитыми остатками (v5): Special:Permalink/116694490. Код для формирования (на всякий случай):
- Разобрать список так, чтобы в следующий раз при проходе алгоритма он оказался пустой — это я и имею в виду. Докидать ссылок — не проблема. Обновил списки выше. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)
- Да, чуть позже догадался. Тем не менее в таком формате, как представлен выше, разбирать список явно никто не будет. Я бы предпочёл разбирать отчёты Викиданных, где список имеет понятную структуру. Или в любом другом месте, но с позициями и со ссылкой на валидатор (есть в местном шаблоне). В любом случае вручную разобранное быстрее сразу заносить на ВД, чем формировать список и потом отдавать боту. Так что всё что уже однозначно идентифицировано надо заливать. 194.50.12.142 15:16, 16 сентября 2021 (UTC)
- Идея в том, чтобы их не создавать. То есть, вручную обработать то, что для алгоритма слишком сложное. Я смогу исключить уже заполненные элементы из формируемого списка. — Vort (обс.) 15:08, 16 сентября 2021 (UTC)
- Vort, их нет нужды мониторить, все дубликаты всплывают в отчёте на ВД: d:Wikidata:Database reports/Constraint violations/P1397. 194.50.12.142 14:55, 16 сентября 2021 (UTC)
- — Vort (обс.) 13:15, 16 сентября 2021 (UTC)
SELECT ?item ?itemLabel ?coords ?gkgn WHERE {
?item wdt:P17 wd:Q159 .
?item wdt:P31 wd:Q532 .
?item wdt:P625 ?coords .
OPTIONAL { ?item wdt:P1397 ?gkgn . }
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
namespace ConsoleApplication95
{
class GKGNRecord
{
public int Id;
public string Name;
public string Type;
public string ATE1;
public string ATE2;
public double Lat;
public double Lon;
}
class WdRecord
{
public string Id;
public string Name;
public double Lat;
public double Lon;
public int? GkgnId;
}
class MatchRecord
{
public int GKGNId;
public string WdId;
public double Distance;
}
class Program
{
static void Main(string[] args)
{
string wde = "http://www.wikidata.org/entity/";
Console.Write("Loading wd...");
var wdRecords = new List<WdRecord>();
var lines = File.ReadAllLines("wd.tsv").Skip(1).ToArray();
foreach (var line in lines)
{
var ls = line.Split('\t');
var rec = new WdRecord();
rec.Id = ls[0].Replace(wde, "");
rec.Name = ls[1];
var ptm = Regex.Match(ls[2].Replace('.', ','), "Point\\(([0-9,\\-]+) ([0-9,\\-]+)\\)");
if (!ptm.Success)
continue;
rec.Lon = double.Parse(ptm.Groups[1].Value); // rus locale required
rec.Lat = double.Parse(ptm.Groups[2].Value);
rec.GkgnId = ls[3] == "" ? (int?)null : int.Parse(ls[3]);
wdRecords.Add(rec);
}
Console.WriteLine("Done");
Console.Write("Loading gkgn...");
var gkgnRecords = new List<GKGNRecord>();
lines = File.ReadAllLines(
"goskatalog_Spisok_NP_i_ATE_na_vsu_RF_1_1.csv");
foreach (var line in lines)
{
var ls = line.Split('|');
var rec = new GKGNRecord();
rec.Id = int.Parse(ls[0]);
rec.Name = ls[1];
rec.Type = ls[2];
rec.ATE1 = ls[3];
rec.ATE2 = ls[4];
rec.Lat = double.Parse(ls[5]); // rus locale required
rec.Lon = double.Parse(ls[6]);
gkgnRecords.Add(rec);
}
Console.WriteLine("Done");
var excludeWd = new HashSet<string>();
var excludeGKGN = new HashSet<int>();
var exclude = wdRecords.Where(r => r.GkgnId != null);
foreach (var er in exclude)
{
excludeWd.Add(er.Id);
excludeGKGN.Add((int)er.GkgnId);
}
gkgnRecords.RemoveAll(r => excludeGKGN.Contains(r.Id));
wdRecords.RemoveAll(r => excludeWd.Contains(r.Id));
var matchRecords = new List<MatchRecord>();
foreach (var gkgnr in gkgnRecords)
{
if (gkgnr.Type != "село" &&
gkgnr.Type != "деревня" &&
gkgnr.Type != "посёлок")
{
continue;
}
var wdrl = wdRecords.Where(r => r.Name == gkgnr.Name).ToArray();
foreach (var wdr in wdrl)
{
var mr = new MatchRecord();
double d1 = wdr.Lat - gkgnr.Lat;
double d2 = wdr.Lon - gkgnr.Lon;
double dist = Math.Sqrt(d1 * d1 + d2 * d2);
mr.GKGNId = gkgnr.Id;
mr.WdId = wdr.Id;
mr.Distance = dist;
matchRecords.Add(mr);
}
}
matchRecords = matchRecords.GroupBy(r => r.GKGNId + r.WdId).
Select(g => g.OrderBy(v => v.Distance).First()).ToList();
matchRecords = matchRecords.Where(r => r.Distance < 0.1).ToList();
var wdGroups = matchRecords.GroupBy(r => r.WdId).Where(g => g.Count() != 1).ToArray();
int i = 0;
var sb = new StringBuilder();
foreach (var g in wdGroups)
{
i++;
string name = gkgnRecords.First(r => r.Id == g.First().GKGNId).Name;
sb.AppendLine($"№{i}: [[:d:{g.First().WdId}|{g.First().WdId}]]|[https://uisrussia.msu.ru/regsearch.php?q={name} {name}]:<br>");
foreach (var mr in g)
sb.AppendLine($"{mr.GKGNId:0000000}|{gkgnRecords.First(r => r.Id == mr.GKGNId).Type}|{mr.Distance:0.000000}<br>");
sb.AppendLine("<br>");
}
File.WriteAllText("result_wdd.txt", sb.ToString());
i = 0;
var gkgnGroups = matchRecords.GroupBy(r => r.GKGNId).Where(g => g.Count() != 1).ToArray();
sb = new StringBuilder();
foreach (var g in gkgnGroups)
{
i++;
string name = gkgnRecords.First(r => r.Id == g.First().GKGNId).Name;
sb.AppendLine($"№{i}: {g.First().GKGNId:0000000}|[https://uisrussia.msu.ru/regsearch.php?q={name} {name}]:<br>");
foreach (var mr in g)
sb.AppendLine($"[[:d:{mr.WdId}|{mr.WdId}]]|{mr.Distance:0.000000}<br>");
sb.AppendLine("<br>");
}
File.WriteAllText("result_gkd.txt", sb.ToString());
var result = matchRecords.Select(r =>
$"{r.GKGNId:0000000}|{r.WdId}|{r.Distance:0.00000}");
File.WriteAllText("result.txt", string.Join(Environment.NewLine, result));
}
}
}
- — Vort (обс.) 06:51, 17 сентября 2021 (UTC)
- да нормально все, разгребется по месту, если что не так. ShinePhantom (обс) 07:02, 17 сентября 2021 (UTC)
- Ок. Если будут какие-то вопросы или пожелания — постараюсь ответить. — Vort (обс.) 07:03, 17 сентября 2021 (UTC)
- ну через пару часиков обновите список недозалитого. А потом подождем отчет об ошибках по уже залитому. Плюс там Гурон параллельно речки льет. ShinePhantom (обс) 07:15, 17 сентября 2021 (UTC)
- Этот отчёт автоматически создаётся или надо боту команду давать? По истории там промежутки времени по полгода. — Vort (обс.) 07:35, 17 сентября 2021 (UTC)
- там бот не пишет новый отчет, если число ошибок не изменилось, а только количество элементов, использующих свойство. Но если ошибки есть - придет и расскажет. ShinePhantom (обс) 08:36, 17 сентября 2021 (UTC)
- @ShinePhantom: из-за особенностей процесса заливки в отчёт на ВД попали не все проблемы. Так что если кто будет исправлять, то проходить с проверкой надо по выложенным мною двум спискам выше. — Vort (обс.) 08:10, 18 сентября 2021 (UTC)
- Этот отчёт автоматически создаётся или надо боту команду давать? По истории там промежутки времени по полгода. — Vort (обс.) 07:35, 17 сентября 2021 (UTC)
- вот, прошлый ваши выкладки вроде залил, проверьте ShinePhantom (обс) 09:34, 17 сентября 2021 (UTC)
- @ShinePhantom: вот остатки. Что-то недозалилось, что-то, видимо, в кеше Викиданных застряло.
- ну через пару часиков обновите список недозалитого. А потом подождем отчет об ошибках по уже залитому. Плюс там Гурон параллельно речки льет. ShinePhantom (обс) 07:15, 17 сентября 2021 (UTC)
- Ок. Если будут какие-то вопросы или пожелания — постараюсь ответить. — Vort (обс.) 07:03, 17 сентября 2021 (UTC)
- — Vort (обс.) 06:51, 17 сентября 2021 (UTC)
0021254|Q21644543|0,00669 0021596|Q16018862|0,00478 0030657|Q18802189|0,00359 0030856|Q18780103|0,00111 0050643|Q19674023|0,00670 0118554|Q16667004|0,00932 0118583|Q27574390|0,01499 0118607|Q16657647|0,01170 0118650|Q16680653|0,09587 0118668|Q21103857|0,00488 0118742|Q4255997|0,01087 0118776|Q28520736|0,01634 0118785|Q4193995|0,01241 0118787|Q20026908|0,00236 0118794|Q28520804|0,00616 0118869|Q20085116|0,00150 0118878|Q4079405|0,02197 0118881|Q20085092|0,01213 0118891|Q19980088|0,00660 0119026|Q20026934|0,02633 0119027|Q4217733|0,00923 0119031|Q28520803|0,01471 0119037|Q4326605|0,00733 0119039|Q4108135|0,01548 0119050|Q4438604|0,00899 0119109|Q4079523|0,03015 0119183|Q4079525|0,01242 0119230|Q20085110|0,00609 0119245|Q4064926|0,01416 0139226|Q13583497|0,00088 0139232|Q4519269|0,00128 0139738|Q4426515|0,01286 0139739|Q4455746|0,00087 0139754|Q4309025|0,00421 0139785|Q4328049|0,00246 0139788|Q4495206|0,00248 0140225|Q4465046|0,00802 0145017|Q3192589|0,00205 0145026|Q4506646|0,00248 0172948|Q28543155|0,00399 0192447|Q21103951|0,01280 0262076|Q12152370|0,00621 0300389|Q4421199|0,04345 0300395|Q4404715|0,00131 0300834|Q4461475|0,00129 0518223|Q1056810|0,01676 0518587|Q1057339|0,00378 0518754|Q4299764|0,01089 0693678|Q65146188|0,00546
- С lat <-> lon уже сам разобрался, тот список можно не смотреть. — Vort (обс.) 16:02, 16 сентября 2021 (UTC)
Заливка из сносок
- Если что, для вноса всё ещё остались тысячи объектов с ГКГН в примечаниях. Пример на 4034 статьи. 194.50.13.235 18:35, 18 сентября 2021 (UTC)
- Повынимал. С минимальной валидацией. Special:Permalink/116794109. Список по какой-то причине необработанных статей:
- Телецкое | templ_fail
- Клязьма | templ_fail
- Межа (приток Западной Двины) | templ_fail
- Вязёмка | templ_fail
- Тамбукан (озеро) | templ_fail
- Тургояк (озеро) | templ_fail
- Уса (приток Печоры) | templ_fail
- Кезенойам | templ_fail
- Ханкуль | templ_fail
- Алтай (озеро) | templ_fail
- Дубня (приток Черёхи) | templ_fail
- Лука (приток Псковы) | templ_fail
- Любавка (река) | templ_fail
- Риэниоя | templ_fail
- Аламбай | templ_fail
- Чехрак (река) | val_fail | 161326
- Герхожансу | templ_fail
- Конча (приток Соти) | templ_fail
- Ефимов (приток Яренги) | templ_fail
- Шежамка | templ_fail
- Айю (река) | templ_fail
- Вылыс-Ловпуа | templ_fail
- Войвож (приток Чубъю) | templ_fail
- Вылькыша (река) | templ_fail
- Косвож (приток Вуктыла) | templ_fail
- Кузобъю | templ_fail
- Кукъювож | templ_fail
- Кыръёль | templ_fail
- Лунвож (приток Чубъю) | templ_fail
- Неа (приток Ныдыба) | templ_fail
- Пэрэмесьвож | templ_fail
- Помоз | templ_fail
- Рубиха (приток Соли) | templ_fail
- Ручью (приток Вычегды) | templ_fail
- Светлица (приток Нюмыда) | val_fail |
- Шер-Ловпуа | templ_fail
- Старая Пивъю | templ_fail
- Тыбъю (приток Сысолы) | templ_fail
- Трунтаиш | templ_fail
- Сепыч (приток Лысьвы) | templ_fail
- Беленгутская | templ_fail
- Татарка (приток Мокрого Карамыка) | templ_fail
- Харбас | templ_fail
- Большой Мадмас | templ_fail
- Большая Ой | templ_fail
- Вежаю (приток Ёввы) | templ_fail
- Ёлва-Мезенская | templ_fail
- Йовсъю | templ_fail
- Западная Йовсъю | templ_fail
- Керъю (приток Вашки) | templ_fail
- Комша (приток Вашки) | templ_fail
- Косвож (приток Содзима) | templ_fail
- Косчовча | templ_fail
- Косъю (приток Вашки) | templ_fail
- Кула (приток Вашки) | templ_fail
- Курмыш (приток Мезени) | templ_fail
- Лёкъю (приток Вашки) | templ_fail
- Мудзью | templ_fail
- Неба (река) | templ_fail
- Пылью | templ_fail
- Северная Ежуга | templ_fail
- Сотчемпола | templ_fail
- Сэбь | templ_fail
- Турунандзи | templ_fail
- Уджъю | templ_fail
- Эблянзи | templ_fail
- Южная Песъю | templ_fail
- Большой Пидым | templ_fail
- Лыхн | templ_fail
- Чебуръюган | templ_fail
- Умасоя | templ_fail
- Танью (река) | templ_fail
- Вочингъяун | templ_fail
- Сортымпим | templ_fail
- Немуръёган | templ_fail
- Сядотаяха | templ_fail
- Беловейвис | templ_fail
- Дикая (приток Куи) | templ_fail
- Ортина | templ_fail
- Сосновый (приток Сулы) | val_fail |
- Табысъяха | templ_fail
- Халытасё | templ_fail
- Асыввож (приток Лыаёли) | templ_fail
- Лёк-Кем (приток Ижмы) | templ_fail
- Рассошина (приток Левой) | templ_fail
- Андриановка (река) | templ_fail
- Нэрыс | templ_fail
- Пыча (приток Ревун-Шара) | templ_fail
- Чираккол | templ_fail
- Вопкаръяха | templ_fail
- Ергус (приток Северной Двины) | templ_fail
- Коргова | templ_fail
- Новь (река) | templ_fail
- Сукина | templ_fail
- Бараний | templ_fail
- Сыалах-Юрях | templ_fail
- Островня (приток Москвы) | templ_fail
- Нименьга (река, впадает в Белое море) | templ_fail
- Лопатинка (река, Сахалин) | templ_fail
- Горянка (река) | templ_fail
- Евъваям | templ_fail
- Воронино-Лахны | templ_fail
- Крутянское (озеро, Калмыкия, южное) | templ_fail
- Утка (нижний приток Кети) | templ_fail
- Аляты (озеро) | templ_fail
- Бабинское (озеро, Калмыкия) | templ_fail
- Лапча (река, впадает в Восточно-Сибирское море) | templ_fail
- Адай (озеро) | templ_fail
- Щучье (озеро, Первомайский район) | templ_fail
- Большая Анга | templ_fail
- Воль (приток Северной Кельтмы) | templ_fail
- Сиркойнъярви | templ_fail
- Летняя (приток Выга) | val_fail |
- Хисъярви | templ_fail
- Новинка (река, впадает в озеро Вуокса) | val_fail | 032532
- Сара (приток Ялмаса) | val_fail |
- Ухта (приток Нименьги) | templ_fail
- Глубокая (приток Выга) | val_fail |
- Чёрный (приток Вожмы) | val_fail |
- Домашняя (река, впадает в Лоухское озеро) | templ_fail
- Амбарные (озёра) | templ_fail
- Сигорецкие | templ_fail
- Большая (приток Пундомы) | templ_fail
- Шивручей | templ_fail
- Корбисалми | templ_fail
- Камонное | templ_fail
- Варчато | templ_fail
- Матервисочное | templ_fail
- Кабановка (приток Неси) | templ_fail
- Эльтон | name_mismatch | 0271857 | Самарода
- Икша (река) | name_mismatch | 0046531 | Скороданка
- Летовка (река) | name_mismatch | 0306364 | Ивановка
- Пять озёр | name_mismatch | 0362958 | Ленево
- Кара (река) | no_gkgn_id_in_db | 0204610
- Хюльгюзи (озеро) | no_gkgn_id_in_db | 0195994
- Кунесъю | no_gkgn_id_in_db | 0168295
- Муртым | no_gkgn_id_in_db | 0737575
- Целау | no_gkgn_id_in_db | 0173347
- Русаковские горячие источники | no_gkgn_id_in_db | 0595941
- Ломовка (приток Чёрной) | no_gkgn_id_in_db | 0722284
- Ялым (река) | name_mismatch | 0100048 | Каминский
- Песочная (приток Истры) | name_mismatch | 0046585 | Колоколенка
- Ивашка (река, впадает в Берингово море) | no_gkgn_id_in_db | 0598156
- Вадты (озеро, Пермский край) | no_gkgn_id_in_db | 0723094
templ_fail
— то ли не нашёлся шаблон, то ли нашлось несколько.val_fail
— нетрадиционный формат у идентификатора.no_gkgn_id_in_db
— нет кода в базе.name_mismatch
— не совпадает название в базе и заголовок статьи (с минимальной нормализацией). Хотелось, чтобы кто-нибудь проверил результат и залил, если результат годный. Процент ошибок на этот раз не оценивал. — Vort (обс.) 12:18, 21 сентября 2021 (UTC) (Списки ошибок и заливки обновлены 13:07, 22 сентября 2021 (UTC))- Код не очень качественный, но всё равно выкладываю, для желающих проверить методику: https://github.com/Vort/WikiTasks/tree/wp_gkgn_export — Vort (обс.) 12:21, 21 сентября 2021 (UTC)
- По templ_fail — не знаю насколько распространено, но только что был случай одного объекта просто на разные даты. Это надо заливать. 194.50.13.235 17:30, 21 сентября 2021 (UTC)
- Ещё бывает, что объект в нескольких АТЕ и из-за этого два шаблона. Но вот что проще — прописывать все эти хитрости в код или обработать вручную — не знаю. Ну, как минимум, можно начать с
name_mismatch
. Там большая часть — реальные проблемы. Особенно «Суровручей». — Vort (обс.) 17:37, 21 сентября 2021 (UTC)- val_fail исправил. Среди no_gkgn_id_in_db надо отсечь всё что свыше 812530 — этого в файле просто нет. 194.50.13.235 17:49, 21 сентября 2021 (UTC)
- Я ж их провалидировать не могу. 3 штуки можно перенести вручную. Насчёт повторного запуска — не знаю. Может, всё из списка выше стоит вручную обработать. Ну либо как-то договориться. — Vort (обс.) 17:53, 21 сентября 2021 (UTC)
- Vort,
name_mismatch
слишком много, их надо бы в отдельный список и на форум к разбору. Заливать не надо, понятно. То есть хотелось бы выше увидеть список с обновлением val_fail, без no_gkgn_id_in_db свыше 812530 и без name_mismatch. 194.50.13.235 17:55, 21 сентября 2021 (UTC)- Я сейчас пытаюсь НП скачать, не хочу, чтобы сервер меня послал. Большие no_gkgn_id_in_db исключить из списка могу, но на заливку их не помещу, так как не провалидированы :) Чуть позже обновлю, в общем. — Vort (обс.) 17:58, 21 сентября 2021 (UTC)
- По no_gkgn_id_in_db всё оказалось не так просто. Эти объекты или утеряны в файле или были удалены из реестра. Надо изучать досконально все случаи. Хочу спросить, это анализ вообще всех статей или только без кодов ГКГН на ВД? Список всего что пропало был бы полезен. 194.50.13.235 18:28, 21 сентября 2021 (UTC)
- Без Викиданные: указано свойство: код ГКГН. Поэтому писал, что процент ошибок не оценивал. Полная валидация — это отдельная задача, сейчас бы залить. — Vort (обс.) 19:14, 21 сентября 2021 (UTC)
- По-моему все препятствия к заливке устранены: исключаем name_mismatch, no_gkgn_id_in_db и в путь. По templ_fail взять самый первый код и сравнить название, вручную 125 записей проверять некому. 194.50.13.235 19:19, 21 сентября 2021 (UTC)
- Первая попавшаяся статья: Островня (приток Москвы). Тут вообще, похоже, оба кода имеют право быть залитыми. Так что с заливкой первого попавшегося — это не ко мне. — Vort (обс.) 19:25, 21 сентября 2021 (UTC)
- Да, оба заливать. Ниже сделал список по templ_fail, его можно заливать, каждую позицию проверил. 194.50.13.235 20:27, 21 сентября 2021 (UTC)
- Первая попавшаяся статья: Островня (приток Москвы). Тут вообще, похоже, оба кода имеют право быть залитыми. Так что с заливкой первого попавшегося — это не ко мне. — Vort (обс.) 19:25, 21 сентября 2021 (UTC)
- По-моему все препятствия к заливке устранены: исключаем name_mismatch, no_gkgn_id_in_db и в путь. По templ_fail взять самый первый код и сравнить название, вручную 125 записей проверять некому. 194.50.13.235 19:19, 21 сентября 2021 (UTC)
- Без Викиданные: указано свойство: код ГКГН. Поэтому писал, что процент ошибок не оценивал. Полная валидация — это отдельная задача, сейчас бы залить. — Vort (обс.) 19:14, 21 сентября 2021 (UTC)
- По no_gkgn_id_in_db всё оказалось не так просто. Эти объекты или утеряны в файле или были удалены из реестра. Надо изучать досконально все случаи. Хочу спросить, это анализ вообще всех статей или только без кодов ГКГН на ВД? Список всего что пропало был бы полезен. 194.50.13.235 18:28, 21 сентября 2021 (UTC)
- Кеш поиска тупит, я уже 5xxxxxx прописал вручную, purge сделал, а всё равно в списке всплыли. Так что обновилось только частично. — Vort (обс.) 19:21, 21 сентября 2021 (UTC)
- Уже прочистился. — Vort (обс.) 19:32, 21 сентября 2021 (UTC)
- Вот name_mismatch отдельно:
- Я сейчас пытаюсь НП скачать, не хочу, чтобы сервер меня послал. Большие no_gkgn_id_in_db исключить из списка могу, но на заливку их не помещу, так как не провалидированы :) Чуть позже обновлю, в общем. — Vort (обс.) 17:58, 21 сентября 2021 (UTC)
- Vort,
- Я ж их провалидировать не могу. 3 штуки можно перенести вручную. Насчёт повторного запуска — не знаю. Может, всё из списка выше стоит вручную обработать. Ну либо как-то договориться. — Vort (обс.) 17:53, 21 сентября 2021 (UTC)
- val_fail исправил. Среди no_gkgn_id_in_db надо отсечь всё что свыше 812530 — этого в файле просто нет. 194.50.13.235 17:49, 21 сентября 2021 (UTC)
- Ещё бывает, что объект в нескольких АТЕ и из-за этого два шаблона. Но вот что проще — прописывать все эти хитрости в код или обработать вручную — не знаю. Ну, как минимум, можно начать с
- По templ_fail — не знаю насколько распространено, но только что был случай одного объекта просто на разные даты. Это надо заливать. 194.50.13.235 17:30, 21 сентября 2021 (UTC)
- — Vort (обс.) 19:32, 21 сентября 2021 (UTC) (обновлено 04:04, 22 сентября 2021 (UTC))
- Vort, в этом списке больше половины можно заливать, из 160 записей 99 соответствуют:
- — Vort (обс.) 19:32, 21 сентября 2021 (UTC) (обновлено 04:04, 22 сентября 2021 (UTC))
- Лабынкыр | name_mismatch | 0125941 | Лабынгкыр
- Ковдозерское водохранилище | name_mismatch | 0038673 | Княжегубское
- Оланга (озеро) | name_mismatch | 0219097 | Оланге
- Восточный Булганак | name_mismatch | 0797920 | Булганак
- Пекульнейское озеро | name_mismatch | 0157176 | Пэкульнейское
- Ледник Геблера | name_mismatch | 0605648 | Геблера
- Кожим | name_mismatch | 0168395 | Кожым
- Сухой Чалтырь | name_mismatch | 0532719 | Чалтырская
- Веда (река) | name_mismatch | 0061225 | Вяда
- Левашка (приток Беломорканала) | name_mismatch | 0149702 | Левешка
- Тюлькас | name_mismatch | 0661846 | Ближний Тюлькас
- Симаховка | name_mismatch | 0287481 | Симаховка(Дубровка)
- Большой Лёч | name_mismatch | 0168300 | Большой Лэч
- Лёч | name_mismatch | 0168448 | Лэч
- Малый Лёч | name_mismatch | 0168299 | Малый Лэч
- Сэдбарью | name_mismatch | 0546759 | Сыдбарью
- Ямщиков-Содмес | name_mismatch | 0170476 | Ямщиков-Седмес
- Кыръю | name_mismatch | 0169453 | Керъю
- Куломъю | name_mismatch | 0168611 | Кулэмъю
- Курнос | name_mismatch | 0547490 | Курнос 1-й
- Лэпъю (приток Локчима) | name_mismatch | 0168636 | Лопъю
- Гызъяёль | name_mismatch | 0513382 | Гизъяёль
- Сэбин (приток Локчима) | name_mismatch | 0546064 | Собинка
- Чед-Ю | name_mismatch | 0170243 | Западная Чед
- Шудог | name_mismatch | 0169837 | Шудэг
- Шехостанка | name_mismatch | 0518889 | Шихостанка
- Зайченон | name_mismatch | 0153892 | Зайченок
- Текелю (приток Карагая) | name_mismatch | 0604971 | Текелю(Янтау)
- Рысь (приток Медведицы) | name_mismatch | 0015173 | Большая Рысь
- Ёртома | name_mismatch | 0510056 | Ертома
- Северная Цебьюга | name_mismatch | 0171397 | Северная Цебъюга
- Увью | name_mismatch | 0170547 | Увъю
- Южная Цебьюга | name_mismatch | 0171398 | Южная Цебъюга
- Натынка | name_mismatch | 0040960 | Нытынка
- Селепъюган | name_mismatch | 0542504 | Селепьюган
- Польта | name_mismatch | 0135032 | Польто
- Варчатывис | name_mismatch | 0143109 | Варчато
- Ай-Котингтур | name_mismatch | 0760534 | Котингтур
- Вармъюган | name_mismatch | 0143230 | Вармъеган
- Нангпайсоим (приток Ненсъюгана) | name_mismatch | 0543798 | Нангпайлор
- Ненсъюган | name_mismatch | 0162858 | Ненсъеган
- Тунаманохтьюган | name_mismatch | 0543825 | Тунамонохтьюган
- Тутлеймъяун | name_mismatch | 0181331 | Тутлимъяун
- Танлаваяха | name_mismatch | 0181432 | Танловаяха
- Задворная | name_mismatch | 0167866 | Большая Задворная
- Себервиска | name_mismatch | 0481040 | Сябервиска
- Кыдрым | name_mismatch | 0169789 | Кыдрымъю
- Берденъёль | name_mismatch | 0510679 | Берданъёль
- Ванъёль | name_mismatch | 0547631 | Ваньёль
- Войвож (приток Чути) | name_mismatch | 0169795 | Чуть(Войвож)
- Лунвож (приток Чути) | name_mismatch | 0169796 | Чуть(Лунвож)
- Кизилташский лиман | name_mismatch | 0160812 | Кизилташский
- Ёлтырева | name_mismatch | 0119213 | Елтырева
- Экечь | name_mismatch | 0679423 | 1-я Речка (Экечь)
- 2-я Речка (приток Камчатки) | name_mismatch | 0679502 | Речка 2-я (Киминш)
- Протока Ажабачья | name_mismatch | 0618512 | Ажабачья
- Тонкий-Шор | name_mismatch | 0182978 | Тонкий Шор
- Улыстом | name_mismatch | 0171130 | Улыс-Том
- Верхний Далъёль | name_mismatch | 0548035 | Верхняя Далъёль
- Вежняньга | name_mismatch | 0048385 | Веж-Няньга
- Делингдэ (приток Лены) | name_mismatch | 0121620 | Делинде
- Каргина | name_mismatch | 0573235 | Никандровская(Каргина)
- Вятитерьво | name_mismatch | 0438232 | Вятитерьево
- Конанъер | name_mismatch | 0218991 | Конан-Ер
- Нижне-Исетский пруд | name_mismatch | 0091939 | Нижне-Исетское
- Канал Волга — Уводь | name_mismatch | 0006379 | Волга-Уводь
- Ясень (озеро) | name_mismatch | 0437433 | Ясеньское
- Степная (приток Мирновки) | name_mismatch | 0801112 | Степной
- Табуска (приток Рассыпной) | name_mismatch | 0668348 | Табуска 1-я
- Киста (река) | name_mismatch | 0183919 | Кистинская
- Большое Толони | name_mismatch | 0196374 | Большие Толони
- Нестиарское | name_mismatch | 0105309 | Нестиар
- Гачуча | name_mismatch | 0302186 | Гочуча
- Алагёз (река) | name_mismatch | 0800332 | Алакоз
- Бухта Лососей | name_mismatch | 0303604 | Лососей
- Верхне-Иремельское водохранилище | name_mismatch | 0345141 | Иремельское
- Большой Майгашты | name_mismatch | 0660376 | Большая Майгашты
- Матачинайваам | name_mismatch | 0157451 | Матачъынайваам
- Снопот | name_mismatch | 0069836 | Снопоть
- Киргинньех | name_mismatch | 0123477 | Киргиннех
- Озеро Дерюгина | name_mismatch | 0082633 | Дерюгина
- Озеро Усачёва | name_mismatch | 0106569 | Усачёва
- Максунуоха | name_mismatch | 0123832 | Муксунуоха
- Сыалах (река) | name_mismatch | 0131203 | Сельлях
- Богуты (озеро, низовья реки Богуты) | name_mismatch | 0606190 | Богуты(Кок-Куль)
- Иллипех (озеро) | name_mismatch | 0119523 | Иллепех
- Катунские ледники | name_mismatch | 0605646 | Катунские
- Иля-Миэлунъярви | name_mismatch | 0404815 | Ала-Миэлунъярви
- Агата (Нижнее) | name_mismatch | 0194042 | Агата(Нижнее)
- Тапшеньгские озёра | name_mismatch | 0474249 | Тапшеньгские
- Таташъярви | name_mismatch | 0432281 | Теташъярви
- Киекки | name_mismatch | 0429400 | Киеки
- Вазаль (озеро, Южский район) | name_mismatch | 0588325 | Вязаль
- Мульевские озёра | name_mismatch | 0025139 | Мульевские
- Хараелах | name_mismatch | 0205685 | Хараелах(Еловая)
- Торосярви | name_mismatch | 0401854 | Торосъярви
- Верхнемакаровское водохранилище | name_mismatch | 0094807 | Верхне-Макаровское
- Цебъюга (правый приток Мезени) | name_mismatch | 0106896 | Цебьюга
- Йоканьгское | name_mismatch | 0038521 | Иокангское
- 194.50.13.235 20:24, 21 сентября 2021 (UTC)
- Ок. — Vort (обс.) 04:04, 22 сентября 2021 (UTC)
- Начал разбирать name_mismatch. А с не упомянутыми тремя тысячами какие-то проблемы? 194.50.13.235 10:53, 22 сентября 2021 (UTC)
- Предполагаю, что можно заливать. Но это ж только моя оценка. Надо, чтобы кто-нибудь по аналогии с секцией выше проверил и залил. Защита от «замыленного глаза». — Vort (обс.) 13:11, 22 сентября 2021 (UTC)
- Не особо понятно, что предлагается проверить. Статьи в petscan? name_mismatch к слову, ещё остался, я просто удалил из списка не ошибки, а сноски-АИ к тексту. 13:46, 22 сентября 2021 (UTC)
- 1. Случайную выборку из списка для грубой оценки процента ошибок. 2. Код на предмет наличия глупых ошибок. Ну или ничего не проверять — под ответственность загружающего. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)
- И val_fail пустые вижу. Ну это уже детали, список этот для людей, а не для ботов, можно менять как угодно. Всё равно в заливку без валидации не пойдёт. — Vort (обс.) 13:52, 22 сентября 2021 (UTC)
- Пустые val_fail заливать не надо, прочие исправлены. 1. Смотреть здесь? Пять случайных штук проверил, всё совпадает (название, регион, тип). 2. Там блин 360 строк, и не все жалуют C#. Если совпало название статьи, а код с файлом, то и заливать, никаких специфических сносок типа подтверждения омонимов в текстах статей нет. 194.50.13.235 14:17, 22 сентября 2021 (UTC)
- Ghuron, похоже ждём вашего мнения. 194.50.13.235 16:10, 22 сентября 2021 (UTC)
- Я в вашей дискуссии потерялся, если всё ок — лейте Ghuron (обс.) 17:35, 22 сентября 2021 (UTC)
- Ghuron, насколько я понимаю, Vort не хочет заливать сам, а ожидает сторонней оценки списка (моя не устроила) или чтобы кто-то ещё залил. 194.50.13.235 17:44, 22 сентября 2021 (UTC)
- Я в вашей дискуссии потерялся, если всё ок — лейте Ghuron (обс.) 17:35, 22 сентября 2021 (UTC)
- Не особо понятно, что предлагается проверить. Статьи в petscan? name_mismatch к слову, ещё остался, я просто удалил из списка не ошибки, а сноски-АИ к тексту. 13:46, 22 сентября 2021 (UTC)
- Предполагаю, что можно заливать. Но это ж только моя оценка. Надо, чтобы кто-нибудь по аналогии с секцией выше проверил и залил. Защита от «замыленного глаза». — Vort (обс.) 13:11, 22 сентября 2021 (UTC)
- Vort, готово. 194.50.13.235 12:47, 22 сентября 2021 (UTC)
- Начал разбирать name_mismatch. А с не упомянутыми тремя тысячами какие-то проблемы? 194.50.13.235 10:53, 22 сентября 2021 (UTC)
- Ок. — Vort (обс.) 04:04, 22 сентября 2021 (UTC)
- 194.50.13.235 20:24, 21 сентября 2021 (UTC)
- Vort, после заливки осталось 195 ВО, я так понимаю в основе это templ_fail на 121 штуку? Возможно по ним сделать такой же перебор, как и с другими? Просто взять самый первый шаблон в статье. 194.50.13.235 21:46, 22 сентября 2021 (UTC)
- Вот эта штучка отключается и в алгоритм идут первые попавшиеся шаблоны. 108 + 43 = 151. Куда ещё 44 делись — без понятия. Алгоритм кривой (как у меня, так, судя по всему, и у Фонда), может быть всё, что угодно. Если очень надо будет, поищу. Результат прогона:
Q108533861 | 0143109 Q108533816 | 0219828 Q96053258 | 0433390 Q93495796 | 0432430 Q91231874 | 0431545 Q89261738 | 0108134 Q89214499 | 0108203 Q88695754 | 0106588 Q87399506 | 0427066 Q85803212 | 0406047 Q70837625 | 0668967 Q61986392 | 0606189 Q60739179 | 0125764 Q37962204 | 0136177 Q37957025 | 0111956 Q37897771 | 0406964 Q36202380 | 0169012 Q32739759 | 0429905 Q32505382 | 0430387 Q32228589 | 0120882 Q28378891 | 0639117 Q19908142 | 0366643 Q18400168 | 0139482 Q12556970 | 0002806 Q6744304 | 0480409 Q4516149 | 0200634 Q4495167 | 0481808 Q4469384 | 0169289 Q4464499 | 0526621 Q4458391 | 0181768 Q4451365 | 0182015 Q4449339 | 0183033 Q4448610 | 0340249 Q4447847 | 0336696 Q4429390 | 0181162 Q4390480 | 0219817 Q4388742 | 0170515 Q4388097 | 0170480 Q4387168 | 0146793 Q4385659 | 0169173 Q4385417 | 0170850 Q4383086 | 0545041 Q4381835 | 0169689 Q4380108 | 0510102 Q4378448 | 0544730 Q4377965 | 0087964 Q4338983 | 0307192 Q4337111 | 0183061 Q4328747 | 0511143 Q4328255 | 0512644 Q4326935 | 0526321 Q4317020 | 0340263 Q4305767 | 0170751 Q4273090 | 0168718 Q4271342 | 0437446 Q4268673 | 0054853 Q4266633 | 0303709 Q4257595 | 0170615 Q4248606 | 0084701 Q4245928 | 0170606 Q4234828 | 0509949 Q4234728 | 0169358 Q4234727 | 0169041 Q4232735 | 0467335 Q4230321 | 0105333 Q4219744 | 0545521 Q4202611 | 0510060 Q4202610 | 0170534 Q4177314 | 0597649 Q4176188 | 0471223 Q4169346 | 0054601 Q4161499 | 0481710 Q4146247 | 0682791 Q4137553 | 0250713 Q4124988 | 0538586 Q4105879 | 0169184 Q4102197 | 0143218 Q4092799 | 0163046 Q4092426 | 0214362 Q4091481 | 0170540 Q4082253 | 0481705 Q4077679 | 0632933 Q4074366 | 0202184 Q4071853 | 0169055 Q3725849 | 0093089 Q2385400 | 0324930 Q2350647 | 0087958 Q1739762 | 0146237 Q1197635 | 0129833 Q1090316 | 0720776 Q239274 | 0171474 Q239227 | 0548930 Q238876 | 0545896 Q238805 | 0549538 Q238335 | 0168378 Q238254 | 0545751 Q237972 | 0168516 Q237954 | 0549562 Q237942 | 0171725 Q237563 | 0546514 Q237553 | 0172138 Q237464 | 0169457 Q237430 | 0171483 Q236891 | 0546401 Q236580 | 0168836 Q236238 | 0546580 Q236057 | 0170014 Q8175 | 0170439
- Телецкое | val_fail |
- Чехрак (река) | val_fail | 161326
- Светлица (приток Нюмыда) | val_fail |
- Лыхн | val_fail |
- Сосновый (приток Сулы) | val_fail |
- Летняя (приток Выга) | val_fail |
- Новинка (река, впадает в озеро Вуокса) | val_fail | 032532
- Сара (приток Ялмаса) | val_fail |
- Глубокая (приток Выга) | val_fail |
- Чёрный (приток Вожмы) | val_fail |
- Эльтон | name_mismatch | 0271857 | Самарода
- Вязёмка | name_mismatch | 0306399 | Большие Вязёмы
- Икша (река) | name_mismatch | 0046531 | Скороданка
- Летовка (река) | name_mismatch | 0306364 | Ивановка
- Пять озёр | name_mismatch | 0362958 | Ленево
- Ханкуль | name_mismatch | 0601379 | Соленое
- Кара (река) | no_gkgn_id_in_db | 0204610
- Алтай (озеро) | name_mismatch | 0602229 | Малая Куринка (Алтай)
- Хюльгюзи (озеро) | no_gkgn_id_in_db | 0195994
- Риэниоя | name_mismatch | 0405722 | Лёютёоя
- Аламбай | name_mismatch | 0399651 | Хмелевка
- Конча (приток Соти) | name_mismatch | 0002103 | Коньша
- Кунесъю | no_gkgn_id_in_db | 0168295
- Шежамка | name_mismatch | 0170471 | Шежымка
- Помоз | name_mismatch | 0170486 | Помес
- Муртым | no_gkgn_id_in_db | 0737575
- Беленгутская | name_mismatch | 0760295 | Лохемтавка
- Большая Ой | name_mismatch | 0545517 | Ившор
- Умасоя | name_mismatch | 0405986 | Вомаслампи
- Целау | no_gkgn_id_in_db | 0173347
- Русаковские горячие источники | no_gkgn_id_in_db | 0595941
- Ломовка (приток Чёрной) | no_gkgn_id_in_db | 0722284
- Андриановка (река) | name_mismatch | 0261052 | Правая Андриановка
- Ялым (река) | name_mismatch | 0100048 | Каминский
- Песочная (приток Истры) | name_mismatch | 0046585 | Колоколенка
- Нименьга (река, впадает в Белое море) | name_mismatch | 0474197 | Верхнеухтинский
- Ивашка (река, впадает в Берингово море) | no_gkgn_id_in_db | 0598156
- Воронино-Лахны | name_mismatch | 0439740 | Ивановское
- Вадты (озеро, Пермский край) | no_gkgn_id_in_db | 0723094
- Хисъярви | name_mismatch | 0404855 | Хийсиярви
- Амбарные (озёра) | name_mismatch | 0430748 | Верхнее Амбарное
- Корбисалми | name_mismatch | 0148621 | Верхнее Корбисалми
- Матервисочное | name_mismatch | 0182620 | Малая Печора
- В случае ручной перепроверки, может, и залью. Хотя тут качество ещё хуже, чем в большом списке. — Vort (обс.) 04:36, 23 сентября 2021 (UTC)
- Vort, первые 10 совпали, сразу и закинул на ВД. По-моему можно заливать. А список с названиями даже перебирать смысла нет, это посторонние сноски. 194.50.13.235 15:54, 23 сентября 2021 (UTC)
- Ну это оценка < 10% ошибок. Лучше бы ещё проверить. Но уже залил, так что проверять уже в ВД можно. — Vort (обс.) 16:19, 23 сентября 2021 (UTC)
- Значит остался список ниже на 350 статей. Чистка ВД уже последний этап. 194.50.13.235 16:48, 23 сентября 2021 (UTC)
- Ну это оценка < 10% ошибок. Лучше бы ещё проверить. Но уже залил, так что проверять уже в ВД можно. — Vort (обс.) 16:19, 23 сентября 2021 (UTC)
- Vort, первые 10 совпали, сразу и закинул на ВД. По-моему можно заливать. А список с названиями даже перебирать смысла нет, это посторонние сноски. 194.50.13.235 15:54, 23 сентября 2021 (UTC)
- Кажется, я понял, из чего состоят остатки. Я не сделал кода ошибки для маленького количества параметров. Наподобие
insource:/\{\{ГКГН\}\}/
. — Vort (обс.) 17:31, 23 сентября 2021 (UTC)
- В случае ручной перепроверки, может, и залью. Хотя тут качество ещё хуже, чем в большом списке. — Vort (обс.) 04:36, 23 сентября 2021 (UTC)
Заливка из сносок 2
С тематическим списком выше похоже разобрались (осталось залить), но их ещё под тысячу в других статьях. Запрос. 194.50.13.235 16:10, 22 сентября 2021 (UTC)
- ткните еще раз дифф, чего залить? ShinePhantom (обс) 19:47, 22 сентября 2021 (UTC)
- Это уже четвёртая. 194.50.13.235 20:01, 22 сентября 2021 (UTC)
- u:ShinePhantom, спасибо. Только эта заливка относится к секции выше, а будет ли по этой секции что-то заливаться — посмотрим. — Vort (обс.) 04:38, 23 сентября 2021 (UTC)
- Что я думаю про качество, полагаю, понятно.
Q87787259 | 0434049 Q65172536 | 0154710 Q65168819 | 0606081 Q65168298 | 0606017 Q65168260 | 0606031 Q65166570 | 0605059 Q65166514 | 0606069 Q65163643 | 0604969 Q65163112 | 0154493 Q65158601 | 0605175 Q65158259 | 0154667 Q62522208 | 0606015 Q62519123 | 0605192 Q59506130 | 0071370 Q59506121 | 0475292 Q59506108 | 0084759 Q37920027 | 0024923 Q37919567 | 0261296 Q37916308 | 0025928 Q37915416 | 0026666 Q37911120 | 0025252 Q37885662 | 0156611 Q37796573 | 0156614 Q31585700 | 0154457 Q30890653 | 0153904 Q28523035 | 0191836 Q28509197 | 0126608 Q27582306 | 0098139 Q27556416 | 0626933 Q27230980 | 0152187 Q27230975 | 0397651 Q27230365 | 0398414 Q27230344 | 0136326 Q27173749 | 0151597 Q25739505 | 0398415 Q25739339 | 0151763 Q25739304 | 0152053 Q25738108 | 0152792 Q25738039 | 0153174 Q25738029 | 0152557 Q25737930 | 0151790 Q25737909 | 0152837 Q25737889 | 0152031 Q25737834 | 0151644 Q25737670 | 0152429 Q25508913 | 0136481 Q25508912 | 0153180 Q25508795 | 0152006 Q25508790 | 0153541 Q25508786 | 0152357 Q25508776 | 0398416 Q25508775 | 0136492 Q25508372 | 0399325 Q25508365 | 0399518 Q25508364 | 0152890 Q25508298 | 0152359 Q25505892 | 0152339 Q25505842 | 0152809 Q25505839 | 0152805 Q25505838 | 0151760 Q25505836 | 0151774 Q25505832 | 0151826 Q25505829 | 0151841 Q25505828 | 0153832 Q24729329 | 0152585 Q24729268 | 0153592 Q24729260 | 0400006 Q24729259 | 0136602 Q24729251 | 0399515 Q24729249 | 0153547 Q24729247 | 0153591 Q24729246 | 0153025 Q24729237 | 0152793 Q24729236 | 0399692 Q24729177 | 0151808 Q24729104 | 0151849 Q24729007 | 0151751 Q24728967 | 0151745 Q24728955 | 0136474 Q24728950 | 0399319 Q24728948 | 0136587 Q24728940 | 0153555 Q24728835 | 0152602 Q24728809 | 0400586 Q24728801 | 0153175 Q24728795 | 0153749 Q24728793 | 0490437 Q24728790 | 0152029 Q24728744 | 0136573 Q24728740 | 0153594 Q24728739 | 0153603 Q24728727 | 0153530 Q24728726 | 0151768 Q24728725 | 0489335 Q24728722 | 0151977 Q24728721 | 0489786 Q24728720 | 0489597 Q24728717 | 0151896 Q24728716 | 0152789 Q24728588 | 0136707 Q24728427 | 0151615 Q24728424 | 0136466 Q24728415 | 0399321 Q24728410 | 0152022 Q24728405 | 0153535 Q24728404 | 0153135 Q24728400 | 0397652 Q24728399 | 0153095 Q24728398 | 0397653 Q24728393 | 0153117 Q24728390 | 0151903 Q24728381 | 0151771 Q24728379 | 0399324 Q24728376 | 0152336 Q24728371 | 0399323 Q24728370 | 0397645 Q24728364 | 0151876 Q24728357 | 0800199 Q24728353 | 0487937 Q24728351 | 0152523 Q24728349 | 0399517 Q24728233 | 0152591 Q24728230 | 0152774 Q24728228 | 0152555 Q24728227 | 0151913 Q24728224 | 0152390 Q24728185 | 0136465 Q24684478 | 0153526 Q24684469 | 0136329 Q24684396 | 0151895 Q24684375 | 0152769 Q24484468 | 0014190 Q24484322 | 0014279 Q24239712 | 0136469 Q24239707 | 0136336 Q24239688 | 0153038 Q23878508 | 0009588 Q22344194 | 0259437 Q21852196 | 0153078 Q21850274 | 0064781 Q21848796 | 0064942 Q21673719 | 0065145 Q21673319 | 0065051 Q20627590 | 0132017 Q20073127 | 0122850 Q19911074 | 0295733 Q19902989 | 0019477 Q19829741 | 0142010 Q19673197 | 0056043 Q18807258 | 0141352 Q18807187 | 0085750 Q18805801 | 0693804 Q18803794 | 0154498 Q18802964 | 0423779 Q18802572 | 0032225 Q18801700 | 0715541 Q18799294 | 0030878 Q18796111 | 0694301 Q18795574 | 0141497 Q18790898 | 0104725 Q18790896 | 0808559 Q18788444 | 0056214 Q18768959 | 0043496 Q18768106 | 0044365 Q18079374 | 0184608 Q16897518 | 0128561 Q16894788 | 0422144 Q16598967 | 0260479 Q16566868 | 0594898 Q16469473 | 0260486 Q16104373 | 0152370 Q15748774 | 0695058 Q15279907 | 0694860 Q15261934 | 0171529 Q15224793 | 0154730 Q15145699 | 0695287 Q14950595 | 0805655 Q14950594 | 0508654 Q14918786 | 0142001 Q13210497 | 0120512 Q13209927 | 0141626 Q13209210 | 0141653 Q13208274 | 0141009 Q13205622 | 0693786 Q13204670 | 0120446 Q13203803 | 0695344 Q11247485 | 0141689 Q11038248 | 0141222 Q11027485 | 0140987 Q11025141 | 0141961 Q8074924 | 0260477 Q7695619 | 0155702 Q7302416 | 0147684 Q4526180 | 0694939 Q4517477 | 0141086 Q4511918 | 0088622 Q4498315 | 0216129 Q4498314 | 0178456 Q4479061 | 0303330 Q4462498 | 0261291 Q4458480 | 0146766 Q4455901 | 0087648 Q4446819 | 0055676 Q4440602 | 0694856 Q4426833 | 0178063 Q4426588 | 0088688 Q4386133 | 0434177 Q4380507 | 0088007 Q4379783 | 0088764 Q4363512 | 0177714 Q4362146 | 0177642 Q4331145 | 0154579 Q4323931 | 0087825 Q4311932 | 0177898 Q4301468 | 0010363 Q4290644 | 0261396 Q4283520 | 0087686 Q4261700 | 0088445 Q4231380 | 0163899 Q4222550 | 0070044 Q4202700 | 0153891 Q4183811 | 0176258 Q4174755 | 0168088 Q4174477 | 0162738 Q4156695 | 0055019 Q4156132 | 0176764 Q4144683 | 0088024 Q4144681 | 0087872 Q4129621 | 0054344 Q4125258 | 0424845 Q4112814 | 0142298 Q4095264 | 0216829 Q4094109 | 0215082 Q4092784 | 0525640 Q4092461 | 0041712 Q4080700 | 0215075 Q4068386 | 0120491 Q3844049 | 0038765 Q3622591 | 0261000 Q3411797 | 0038441 Q2386387 | 0604992 Q2371368 | 0204529 Q1965458 | 0010351 Q1963840 | 0169667 Q1675325 | 0260710 Q1053469 | 0524692 Q898212 | 0177311 Q862760 | 0261111 Q575563 | 0213979 Q277576 | 0204978 Q218676 | 0260768 Q141260 | 0012186 Q134493 | 0012198 Q133529 | 0168043 Q129423 | 0655422 Q128537 | 0183256 Q6494 | 0010465
- Мещёрская низменность | low_param_count
- Чекалинское озеро | low_param_count
- Лауватсаари | low_param_count
- Новая Вамья | val_fail | 525676
- Удмуртская Тукля | val_fail | 796650
- Локнаш (река) | low_param_count
- Невель (озеро) | low_param_count
- Куя (приток Печоры) | low_param_count
- Малый Актуру | low_param_count
- Истоминка (река) | low_param_count
- Манайли | low_param_count
- Ельжирчан | low_param_count
- Варынгъёган | low_param_count
- Светлица (приток Нюмыда) | val_fail |
- Курятмас | low_param_count
- Ёлва-Мезенская | low_param_count
- Лыхн | val_fail |
- Хольненгпухыръёган | low_param_count
- Пиначевская | low_param_count
- Мыкпайёган (приток Агана) | low_param_count
- Большая Хадата | low_param_count
- Малая Хадата | low_param_count
- Сосновый (приток Сулы) | val_fail |
- Тырабэйсё | low_param_count
- Бадьяёль (приток Берёзовки) | low_param_count
- Кыртаёль (приток Берёзовки) | low_param_count
- Лунвож-Чувки | low_param_count
- Кошки-Новотимбаево | low_param_count
- Тюбер-Сирма | low_param_count
- Нагенъёхан | low_param_count
- Ютырмалькы (приток Часельки) | low_param_count
- Кукчунак | low_param_count
- Чёрная (приток Сургута) | low_param_count
- Старица (озеро, Стерлитамакский район) | low_param_count
- Большое Лесное | low_param_count
- Кысыкуль | low_param_count
- Убиенка (приток Анадыря) | low_param_count
- Посёлок 1-го Мая | low_param_count
- Энмываам | low_param_count
- Итыкит (приток Ангаракана) | low_param_count
- Жеребцово (станция, Новосибирская область) | low_param_count
- Салатау | low_param_count
- Сосновица (река) | low_param_count
- Становка (река, впадает в Верхнерузское водохранилище) | low_param_count
- Пучъэвеем | low_param_count
- Локтево (Удмуртия) | low_param_count
- Орловка (приток Майна) | low_param_count
- Азанколь | low_param_count
- Северные Улянды | low_param_count
- Берёзовка (приток Печоры) | low_param_count
- Согуру-Сала (приток Угояна) | low_param_count
- Юктэ (приок Унгры) | low_param_count
- Малый Бащелак | low_param_count
- Красивка (Инжавинский район) | low_param_count
- Костяки | low_param_count
- Новокопылово (Первомайский район) | low_param_count
- Приозёрный (Усть-Калманский район) | low_param_count
- Молодоевка | low_param_count
- Каркавино | low_param_count
- Летняя (приток Выга) | val_fail |
- Новинка (река, впадает в озеро Вуокса) | val_fail | 032532
- Сара (приток Ялмаса) | val_fail |
- Глубокая (приток Выга) | val_fail |
- Чёрный (приток Вожмы) | val_fail |
- Тимбаево | low_param_count
- Ивановское (городской округ город Шахунья) | val_fail |
- Турочакский район | name_mismatch | 0011313 | Турочакский
- Печоро-Илычский заповедник | name_mismatch | 0169098 | Маньпупунёр (Ичетбэлбанъиз)
- Срединный хребет | name_mismatch | 0303714 | Срединный
- Летовка (река) | name_mismatch | 0306364 | Ивановка
- Югыд ва | no_gkgn_id_in_db | 0633483
- Ануйский хребет | name_mismatch | 0154656 | Ануйский
- Пять озёр | name_mismatch | 0362958 | Ленево
- Арзгирский район | no_gkgn_id_in_db | 0184446
- Тельпосиз | name_mismatch | 0170128 | Тэлпозиз
- Харнаурды-Кеу | name_mismatch | 0204585 | Харнаурдыкев
- Северо-Чуйский хребет | name_mismatch | 0154696 | Северо-Чуйский
- Южно-Чуйский хребет | name_mismatch | 0154256 | Южно-Чуйский
- Чергинский хребет | name_mismatch | 0154288 | Чергинский
- Уймонская степь | name_mismatch | 0154114 | Уймонская
- Курайский хребет | name_mismatch | 0154241 | Курайский
- Шапшальский хребет | name_mismatch | 0154718 | Шапшальский
- Тигирецкий хребет | name_mismatch | 0152939 | Тигирецкий
- Ачи-Су | name_mismatch | 0145019 | Ачису
- Ханкуль | name_mismatch | 0601379 | Соленое
- Узон | no_gkgn_id_in_db | 0679286
- Сорокаозёрки | no_gkgn_id_in_db | 0601637
- Сиртич | name_mismatch | 0145278 | Сыртыч
- Хребет Чихачёва | name_mismatch | 0154293 | Чихачёва
- Умасоя | name_mismatch | 0405986 | Вомаслампи
- Андриановка (река) | name_mismatch | 0261052 | Правая Андриановка
- Ялым (река) | name_mismatch | 0100048 | Каминский
- Ёлкино (Чувашия) | name_mismatch | 0142020 | Елкино
- Могойтуйский хребет | name_mismatch | 0027309 | Могойтуйский
- Валагинский хребет | name_mismatch | 0259225 | Валагинский
- Песочная (приток Истры) | name_mismatch | 0046585 | Колоколенка
- Калгнитунуп | name_mismatch | 0219826 | Калгнитынуп
- Малотерновой | name_mismatch | 0014361 | Лагутин
- Степной (Шпаковский район) | name_mismatch | 0013045 | Степное
- Кресты (Камчатский край) | no_gkgn_id_in_db | 0220051
- Воронино-Лахны | name_mismatch | 0439740 | Ивановское
- Сабетта (аэропорт) | no_gkgn_id_in_db | 0807763
- Вадты (озеро, Пермский край) | no_gkgn_id_in_db | 0723094
- Катравож | no_gkgn_id_in_db | 0807187
- Остров Бабушкина | name_mismatch | 0071254 | Бабушкина
- Березовый Яр | no_gkgn_id_in_db | 0260430
- Верхнекамчатск | no_gkgn_id_in_db | 0260880
- Чёрный Яр (Камчатский край) | no_gkgn_id_in_db | 0618589
- Хваленка | no_gkgn_id_in_db | 0260434
- Гилёв-Лог | name_mismatch | 0136577 | Гилев Лог
- Власиха (станция, Алтайский край) | no_gkgn_id_in_db | 0397354
- Кокбеш | name_mismatch | 0154322 | Кок-Паш
- 3 Интернационал | name_mismatch | 0152746 | III Интернационал
- Красный Алтай | no_gkgn_id_in_db | 0489259
- Железнодорожная Казарма 193 км | name_mismatch | 0397654 | 193 км
- Посёлок Ильича (Алтайский край) | name_mismatch | 0399320 | Ильича
- Лосиха (Первомайский район) | no_gkgn_id_in_db | 0153160
- Нижняя Петровка | name_mismatch | 0397652 | Лесная Поляна
- Сибирский (Первомайский район) | name_mismatch | 0152523 | Старокрайчиково
- Остров Енгалычева | name_mismatch | 0260659 | Енгалычева
- Остров Крашенинникова | name_mismatch | 0260746 | Крашенинникова
- Остров Старичков | name_mismatch | 0259186 | Старичков
- Остров Добржанского | name_mismatch | 0260578 | Добржанского
- Пролетарская Крепость | name_mismatch | 0399692 | Усть-Каменка
- Комсомолец (Алтайский край) | name_mismatch | 0151832 | Новозырянка
- Амбарные (озёра) | name_mismatch | 0430748 | Верхнее Амбарное
- Корбисалми | name_mismatch | 0148621 | Верхнее Корбисалми
- Новодубровский (Каменский район) | no_gkgn_id_in_db | 0151860
- Селемджинский хребет | name_mismatch | 0186669 | Селемджинский
- — Vort (обс.) 17:40, 23 сентября 2021 (UTC)
- Vort, как и в прошлый раз, первые 10 совпали, все записал. По-моему надо заливать. По списку с названиями посмотрел только name_mismatch, остальное лучше на геофорум. К заливке:
- Турочакский район | name_mismatch | 0011313 | Турочакский
- Срединный хребет | name_mismatch | 0303714 | Срединный
- Ануйский хребет | name_mismatch | 0154656 | Ануйский
- Тельпосиз | name_mismatch | 0170128 | Тэлпозиз
- Харнаурды-Кеу | name_mismatch | 0204585 | Харнаурдыкев
- Северо-Чуйский хребет | name_mismatch | 0154696 | Северо-Чуйский
- Южно-Чуйский хребет | name_mismatch | 0154256 | Южно-Чуйский
- Чергинский хребет | name_mismatch | 0154288 | Чергинский
- Уймонская степь | name_mismatch | 0154114 | Уймонская
- Курайский хребет | name_mismatch | 0154241 | Курайский
- Шапшальский хребет | name_mismatch | 0154718 | Шапшальский
- Тигирецкий хребет | name_mismatch | 0152939 | Тигирецкий
- Ачи-Су | name_mismatch | 0145019 | Ачису
- Сиртич | name_mismatch | 0145278 | Сыртыч
- Хребет Чихачёва | name_mismatch | 0154293 | Чихачёва
- Ёлкино (Чувашия) | name_mismatch | 0142020 | Елкино
- Могойтуйский хребет | name_mismatch | 0027309 | Могойтуйский
- Валагинский хребет | name_mismatch | 0259225 | Валагинский
- Калгнитунуп | name_mismatch | 0219826 | Калгнитынуп
- Степной (Шпаковский район) | name_mismatch | 0013045 | Степное
- Остров Бабушкина | name_mismatch | 0071254 | Бабушкина
- Гилёв-Лог | name_mismatch | 0136577 | Гилев Лог
- Кокбеш | name_mismatch | 0154322 | Кок-Паш
- 3 Интернационал | name_mismatch | 0152746 | III Интернационал
- Железнодорожная Казарма 193 км | name_mismatch | 0397654 | 193 км
- Посёлок Ильича (Алтайский край) | name_mismatch | 0399320 | Ильича
- Остров Енгалычева | name_mismatch | 0260659 | Енгалычева
- Остров Крашенинникова | name_mismatch | 0260746 | Крашенинникова
- Остров Старичков | name_mismatch | 0259186 | Старичков
- Остров Добржанского | name_mismatch | 0260578 | Добржанского
- Селемджинский хребет | name_mismatch | 0186669 | Селемджинский
- 194.50.13.235 18:26, 23 сентября 2021 (UTC)
- Ghuron, ShinePhantom, Vort, заливаем? 194.50.13.235 13:09, 24 сентября 2021 (UTC)
- Коллега, я за любую движуху кроме голодовки. Косяки можно выправлять прямо в ВД Ghuron (обс.) 13:25, 24 сентября 2021 (UTC)
- Ну кому-то надо залить же… 194.50.13.235 14:05, 24 сентября 2021 (UTC)
- Ghuron, ShinePhantom, Vort, движухи два дня нет, поэтому напомню: список в скрытом блоке выше не залит. 185.16.139.228 02:31, 27 сентября 2021 (UTC)
- Пока что не хочется над этим думать. Если справитесь без меня, то хорошо. — Vort (обс.) 14:08, 24 сентября 2021 (UTC)
- Проверенные name_mismatch закинул. — Vort (обс.) 08:00, 25 сентября 2021 (UTC)
- Ghuron, ShinePhantom, Vort, заливаем? 194.50.13.235 13:09, 24 сентября 2021 (UTC)
- 194.50.13.235 18:26, 23 сентября 2021 (UTC)
- Ghuron, ShinePhantom, Vort, ау. Список под катом на 257 позиций не залит. Потом разбирать ошибки на ВД будет некому. 185.16.139.123 03:21, 29 сентября 2021 (UTC)
- Вот так вот один раз что-то сделаешь и по гроб жизни будешь обязан :)
Это влил Ghuron (обс.) 04:32, 29 сентября 2021 (UTC)- Спасибо. Всего лишь до конца работ по конкретному вопросу :) 185.16.139.123 17:23, 29 сентября 2021 (UTC)
- Вот так вот один раз что-то сделаешь и по гроб жизни будешь обязан :)
Бот отчитался о ряде ошибок, большинство из них появилось после заливки из НП шаблонов вне сносок и/или привязки по названиям: #Заливка из шаблонов и списка. 194.50.13.235 14:20, 24 сентября 2021 (UTC)
- За 10 дней интереса никто не проявил, так что тем НП, куда залили сразу два кода, я возвращаю исходную версию, чтобы ошибки не расползались дальше. 185.16.139.228 16:30, 27 сентября 2021 (UTC)
- Неужели надо ещё раз уточнять, что потенциальные проблемы надо смотреть в списке этой темы, а не на ВД? — Vort (обс.) 05:03, 29 сентября 2021 (UTC)
- Vort, ? Эти ошибки были залиты без моего участия в самом начале. А те списки, где я принимал участие и вышли косяки, я на ВД скрупулёзно исправил вообще-то. 185.16.139.123 16:20, 29 сентября 2021 (UTC)
- Для достижения цели «чтобы ошибки не расползались дальше» надо работать над элементами из списков
result_wdd.txt
иresult_gkd.txt
. Отмены по валидатору в ВД самые коварные ошибки «заметают под ковёр», это недопустимо — если делать отмену проблемной части заливки, то полностью. Разве что за исключением вручную проверенных элементов (смотреть по истории правок, видимо). — Vort (обс.) 17:00, 29 сентября 2021 (UTC)- Желающие всё также могут открыть историю валидатора ВД и проверять сколько угодно. Не было там ничего коварного, всё что я отменил это проблема двух одноимённых НП в одном субъекте. То есть двум таким сёлам выдали по два кода. В статьях Рувики этих кодов нет. Исправлять эти ошибки даже дольше, чем поставить коды заново вручную. 185.16.139.123 17:20, 29 сентября 2021 (UTC)
- Окей, ещё раз попробую пояснить. В списке есть недозалитые дубли. То есть, алгоритм не смог сделать точную привязку, но залит был только первый код. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
- Vort, не вижу связи между этими двумя проблемами. Зачистка вылезших дубликатов никак не повлияла на варианты выявления недозалитых дублей. И зачем вообще заливали случаи «алгоритм не смог сделать точную привязку, но залит был только первый код»? Это очень и очень плохо, ошибки разбежались по принципу 50/50. 185.16.139.123 17:34, 30 сентября 2021 (UTC)
- 1. Создаётся иллюзия, что проблема решена. Иначе в ВД валидаторе видны последствия, напоминающие о необходимости решения проблемы. 2. Потому, что заливка была в два этапа. 3. Все эти случаи есть в списке, про который я уже не первый раз говорю. Разобрать список — разберутся и недо-дубли. — Vort (обс.) 04:37, 1 октября 2021 (UTC)
- 1. Это не аргумент — проблемы есть везде и всегда, это самый простой тезис к приятию. Никому кроме тебя или меня абсолют не нужен. 2. И что, что два этапа? На втором этапе надо было исправлять первый, а не усугублять ошибку. 3. А кто бы спорил? Есть желающие — пусть разбирают. У меня на это времени нет, работая с ВП я верю в пункт 1. 185.16.139.123 18:24, 2 октября 2021 (UTC)
- 1. Создаётся иллюзия, что проблема решена. Иначе в ВД валидаторе видны последствия, напоминающие о необходимости решения проблемы. 2. Потому, что заливка была в два этапа. 3. Все эти случаи есть в списке, про который я уже не первый раз говорю. Разобрать список — разберутся и недо-дубли. — Vort (обс.) 04:37, 1 октября 2021 (UTC)
- Vort, не вижу связи между этими двумя проблемами. Зачистка вылезших дубликатов никак не повлияла на варианты выявления недозалитых дублей. И зачем вообще заливали случаи «алгоритм не смог сделать точную привязку, но залит был только первый код»? Это очень и очень плохо, ошибки разбежались по принципу 50/50. 185.16.139.123 17:34, 30 сентября 2021 (UTC)
- Окей, ещё раз попробую пояснить. В списке есть недозалитые дубли. То есть, алгоритм не смог сделать точную привязку, но залит был только первый код. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
- Желающие всё также могут открыть историю валидатора ВД и проверять сколько угодно. Не было там ничего коварного, всё что я отменил это проблема двух одноимённых НП в одном субъекте. То есть двум таким сёлам выдали по два кода. В статьях Рувики этих кодов нет. Исправлять эти ошибки даже дольше, чем поставить коды заново вручную. 185.16.139.123 17:20, 29 сентября 2021 (UTC)
- Кстати, ручную работу по спискам я предлагал изначально. Но нет, вначале «как-нибудь рассосётся», а теперь отмены. Ещё и не до конца. — Vort (обс.) 17:02, 29 сентября 2021 (UTC)
- Ну не я работал над алгоритмом сравнения «название-тип-регион». Я исходно только из шаблонов предлагал заливать, и там всё хорошо получилось. Почему претензия мне-то? Прошло 10 дней, объявление было здесь и на геофоруме — интереса нуль. 185.16.139.123 17:20, 29 сентября 2021 (UTC)
- Vort, к слову, подход «как-нибудь рассосётся» хоть мне и не по нраву, но в данном случае легко нивелируется сверкой координат в ГКГН и в статье. Но для этого надо было коды залить по-максимуму, чтобы сделать всё и сразу. 185.16.139.123 17:29, 29 сентября 2021 (UTC)
- Координаты в статье разве чем-то лучше координат в ВД? Ведь именно по координатам я и привязывал. Но в некоторых случаях в радиусе ~10км было по несколько НП с одним и тем же названием. Кстати, забавно, но даже при перепутанных lat<->lon бывали совпадения. То есть, в реальности существуют НП с одинаковыми названиями и с координатами XX, YY и YY, XX. При большом количестве данных удивительные совпадения попадаются. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
- по факту они обычно отличаются типом, село/деревня. Но и это не везде работает ShinePhantom (обс) 06:03, 30 сентября 2021 (UTC)
- Согласен. Но «легко» бывает не всегда. — Vort (обс.) 06:04, 30 сентября 2021 (UTC)
- Vort, в тех случаях, что я разобрал, были ошибки координат на ВД. То есть в Рувике верные, а на ВД координаты одноимённого объекта. Могу предположить, что это последствия чей-то заливки или неверных merge с себуанцами. 185.16.139.123 17:34, 30 сентября 2021 (UTC)
- Ну, значит, надо делать ещё и валидацию ВД<->ВП по координатам. Но мне больше интересен вопрос из темы ниже. Если там надёжный источник, то во многих случаях можно будет не гадать по координатам, а достаточно точно установить соответствие. — Vort (обс.) 04:40, 1 октября 2021 (UTC)
- К сожалению я не помню про ОКТМО. Если реально важно, дай знать, спросим у Димы. 185.16.139.123 18:24, 2 октября 2021 (UTC)
- Зависит от желающих разгребать списки валидатора. Нет желающих — нет смысла их делать. Есть желающие — могу подумать над алгоритмом. — Vort (обс.) 18:28, 2 октября 2021 (UTC)
- К сожалению я не помню про ОКТМО. Если реально важно, дай знать, спросим у Димы. 185.16.139.123 18:24, 2 октября 2021 (UTC)
- Ну, значит, надо делать ещё и валидацию ВД<->ВП по координатам. Но мне больше интересен вопрос из темы ниже. Если там надёжный источник, то во многих случаях можно будет не гадать по координатам, а достаточно точно установить соответствие. — Vort (обс.) 04:40, 1 октября 2021 (UTC)
- Или линии пересечения одинаковых параллелей/меридианов [4]. -- dima_st_bk 12:12, 29 октября 2021 (UTC)
- Да, не сразу заметил, но при обработке списка эту особенность учёл. — Vort (обс.) 15:27, 29 октября 2021 (UTC)
- по факту они обычно отличаются типом, село/деревня. Но и это не везде работает ShinePhantom (обс) 06:03, 30 сентября 2021 (UTC)
- Координаты в статье разве чем-то лучше координат в ВД? Ведь именно по координатам я и привязывал. Но в некоторых случаях в радиусе ~10км было по несколько НП с одним и тем же названием. Кстати, забавно, но даже при перепутанных lat<->lon бывали совпадения. То есть, в реальности существуют НП с одинаковыми названиями и с координатами XX, YY и YY, XX. При большом количестве данных удивительные совпадения попадаются. — Vort (обс.) 05:29, 30 сентября 2021 (UTC)
- Для достижения цели «чтобы ошибки не расползались дальше» надо работать над элементами из списков
- Vort, ? Эти ошибки были залиты без моего участия в самом начале. А те списки, где я принимал участие и вышли косяки, я на ВД скрупулёзно исправил вообще-то. 185.16.139.123 16:20, 29 сентября 2021 (UTC)
- Неужели надо ещё раз уточнять, что потенциальные проблемы надо смотреть в списке этой темы, а не на ВД? — Vort (обс.) 05:03, 29 сентября 2021 (UTC)
Источники для валидации
Случайно заметил, что вывод инструмента содержит колонку ОКТМО. По ней привязывать было бы надёжнее, чем по координатам. Но раз по координатам привязали, то по этой колонке можно провалидировать. Только вот во вкладке «Исходные коды» находится что угодно, но не источник для этих данных. Кто-нибудь знает, откуда они берутся? — Vort (обс.) 05:10, 29 сентября 2021 (UTC)
- @Vort: ГКГН в PDF [5] + привязка по регион/район/название/тип [6]. Актуальность базы на конец 2019 года. Если руки дойдут, то обновлю (если оно нужно). -- dima_st_bk 11:28, 29 октября 2021 (UTC)
- Понял, спасибо. Тут выше была ссылка на ODS, это получше, чем PDF. Но всё равно для такого типа привязки надо делать анализ качества сопоставления. Жаль, что не код <-> код. — Vort (обс.) 11:45, 29 октября 2021 (UTC)
- d:Q4410451 — живой пример почему после всех заливок нужна будет валидация по координатам. Тут совпало название, регион и единичность объекта (вторая Светлушка не внесена в ГКГН). 185.16.139.251 15:01, 10 ноября 2021 (UTC)
Повторная перевязка по названиям и координатам
Ghuron исправил на ВД тысячи названий рек. Как я понимаю, первой проходкой сверялись именно они, а не названия статей в Рувике. Предлагаю сделать вторую перевязку по совпадению название/регион/координаты/тип=река/страна=Россия. 194.50.15.16 18:42, 7 ноября 2021 (UTC)
- В случае с шаблонами сверял по названию статей, из ВД только коды брал. Я ж даже исходники выложил. Связь по координатам же делал для сёл. Что там по координатам свяжется, если алгоритм на реки направить — без понятия, но в качестве результата большие сомнения, так что пока что этим заниматься не буду. — Vort (обс.) 19:30, 7 ноября 2021 (UTC)
- До перевязки из шаблонов была перевязка по названиям и типам. 194.50.15.16 19:39, 7 ноября 2021 (UTC)
- Я делал довольно примитивную привязку примерно по следующим правилам:
- Найти список рек в РФ, вытащить из него те, у которых метка уникальна (то есть идентифицирует элемент в списке)
- Отфильтровать список ГКГН по рекам и оставить в нем те, у которых метка уникальна
- Сравнить списки, и если название совпадает — залить ГКГН
- Насколько я помню, в таком подходе было некоторое количество ошибок (вы вроде бы меня отменяли в ВД). Вы уверены что это стоит прогнать ещё раз? В смысле мне несложно, но ненакосячить бы :) Ghuron (обс.) 06:50, 8 ноября 2021 (UTC)
- Уникальность имеет смысл учитывать только при полноте. Чего ни в ВП, ни в ГКГН нет и не будет. По-моему важнее сопоставить координаты, они уникальнее названий, а на регион можно вообще не смотреть, он неявно присутствует в координатах. — Vort (обс.) 06:57, 8 ноября 2021 (UTC)
- Нет, уникальность имеет смысл проверять чтобы не заливать ГКГН в «однофамильцев»
Координаты — это не то, что я могу на коленке сделать в экселе Ghuron (обс.) 07:16, 8 ноября 2021 (UTC)- Теоретическая ситуация: существуют всего две реки с одинаковым названием: маленькая, есть в ГКГН, нет в ВП и очень маленькая, есть в ВП, но нет в ГКГН. Алгоритм их свяжет. Можно предположить, что такая ситуация маловероятна и ей стоит пренебречь. Возможно. — Vort (обс.) 07:35, 8 ноября 2021 (UTC)
- Может, сравнивать все координаты со всеми в Екселе и неудобно. Но провалидировать уже готовые сопоставления уж точно можно. Вынуть географические координаты / указано для части: устье с ВД, теоремой Пифагора посчитать расстояние и сравнить с пороговым значением. — Vort (обс.) 07:57, 8 ноября 2021 (UTC)
- Нет, уникальность имеет смысл проверять чтобы не заливать ГКГН в «однофамильцев»
- Уникальность имеет смысл учитывать только при полноте. Чего ни в ВП, ни в ГКГН нет и не будет. По-моему важнее сопоставить координаты, они уникальнее названий, а на регион можно вообще не смотреть, он неявно присутствует в координатах. — Vort (обс.) 06:57, 8 ноября 2021 (UTC)
- Ghuron, методика проседает в моменте регионов, их лучше сравнивать. Также сразу надо убрать объекты ВД, где уже указан код ГКГН. Отменял я и Фантома, но заливку из сносок только исправлял — потому что за неё была моя часть ответственности. Я считаю, что надо заливать дальше, потому что хуже уже не будет: проще потом провалидировать всё залитое, чем вечность валидировать старое и ту же вечность вручную добавлять новое. 194.50.15.16 15:39, 8 ноября 2021 (UTC)
- Результаты весьма скромные Ghuron (обс.) 07:19, 12 ноября 2021 (UTC)
- Первый результат валидации по моему списку: два расхождения среди сопоставленных элементов:
- Результаты весьма скромные Ghuron (обс.) 07:19, 12 ноября 2021 (UTC)
Q36360274 - 512065 512065|Вурдъёль|река|Республика Коми| |65,8656608|57,8560015 169058|Вурдъёль|река|Республика Коми| |63,8515482|53,3274538 Q36360146 - 548736 548736|Веръёль|река|Республика Коми| |61,45831215|55,9601413 169152|Веръёль|река|Республика Коми| |63,9341306|53,7017933
- Ещё есть куча отсутствующих сопоставлений. Надеюсь их проанализировать следом. — Vort (обс.) 08:09, 12 ноября 2021 (UTC)
- @Ghuron: вот гистограмма расстояний по залитому: [7]. Вот список элементов, попавших в «хвост» (> 0.1): Special:Permalink/117827028. Стоит проверить эти элементы. — Vort (обс.) 08:38, 12 ноября 2021 (UTC)
- И ещё немного комбинацией метка+субъектРФ. Дофига рек не имеют русской метки и много где не проставлен d:Property:P131 Ghuron (обс.) 13:06, 12 ноября 2021 (UTC)
- Если кто-нибудь проверит «хвост» выше, сделаю новый по второй части заливки. — Vort (обс.) 14:49, 12 ноября 2021 (UTC)
- И ещё немного комбинацией метка+субъектРФ. Дофига рек не имеют русской метки и много где не проставлен d:Property:P131 Ghuron (обс.) 13:06, 12 ноября 2021 (UTC)
- Решил всё-таки прогнать своим алгоритмом реки. Результаты ещё не смотрел. Вот они: Special:Permalink/117767535, Special:Permalink/117767541, Special:Permalink/117767547. Может, буду обновлять после анализа, пока ещё не знаю. — Vort (обс.) 16:02, 8 ноября 2021 (UTC)
- Сделал гистограмму расстояний и для рек. Чтобы лучше было видно, поменял масштаб: реки, сёла. Видно, что, во-первых, порог в 0.1 градус подходит и для рек, и, во-вторых, граница между правильной и ошибочной классификацией в случае рек более размыта (именно это я предполагал, когда говорил о качестве результата). Также обновил списки в сообщении выше. — Vort (обс.) 07:07, 9 ноября 2021 (UTC)