Википедия:Форум ботоводов

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Боты

U:H2Bot[править | править вики-текст]

Бот наконец-то скончался. Что делать будем? -- dima_st_bk 08:20, 10 ноября 2014 (UTC)

Прежде связаться с ботоводом и попытаться реанимировать. Если не получится, затем решить нужно ли что-то делать. Если нужно, делать. — w2. 07:55, 19 ноября 2014 (UTC)
Автор не появлялся с марта. Писал ему по поводу другого бага в июне — ни привета, ни ответа. Не вижу смысла писать снова. -- dima_st_bk 17:44, 21 ноября 2014 (UTC)
По поводу бага это ерунда. Это ведь даже не повтор письма, а новое письмо и тема более серьезная - существование бота. Надо написать ещё раз. Напишешь, или мне заняться? ~Нирваньчик~ øβς 22:26, 21 ноября 2014 (UTC)

Исправление лжекириллицы[править | править вики-текст]

Здравствуйте, коллеги. Вот хотел заняться ботоводством, а именно исправлением лжекириллицы. Раньше этим занимался Latitude, но на данный момент он неактивен. А вот алгоритмов исправления лжекириллицы он не оставил. Собственно, вопрос мой состоит в том, как алгоритмически исправить или хотя бы выявить лжекириллицу, если такое возможно, конечно.--Дрейкхем Обс. 17:29, 7 ноября 2014 (UTC)

  • Что вы называете лжекириллицей? MaxBioHazard 17:45, 7 ноября 2014 (UTC)
    • Когда в русском слове одна или несколько похожих на кириллицу латинских букв. Например, Cоветский (здесь первая буква С - латинская). Обычно ошибаются с буквой С, потому что латинская Цэ на той же кнопке--Дрейкхем Обс. 17:51, 7 ноября 2014 (UTC)
    • См. также Участник:LatitudeBot/Кириллица_и_Латиница
  • Подозреваю, что это настолько нетривиальная задача, что вряд ли одобрят вашего бота. Также будут те, кто скажет, что вы давите на серваки такими мелкими правками. В общем, я бы не стал даже пробовать без единогласного одобрения где-нить на главном форуме. - DZ - 11:10, 8 ноября 2014 (UTC)
    • Скорее всего, вы правы, но просто интересно, как это возможно в теории. Писал на парочку программистских форумов, но никто не предложил внятных решений--Дрейкхем Обс. 12:05, 8 ноября 2014 (UTC)
      • В первом приближении так: если в слове есть только символы кириллицы и псевдокириллицы, но нет латинских букв, которые не похожи на кириллицу, то скорее всего это слово надо исправить. Но это только в предположении, что весь текст написан на русском языке. Если попадется слово, которое должно быть написано латиницей, например MTA, а в нем случайно русская буква вместо латинской, то оно будет обработано неправильно. Vcohen 12:30, 8 ноября 2014 (UTC)
        • Во-втором приближении: можно взять словарь русского языка и проверять по нему. Если после замены псевдокириллицы, слово с учетом падежей/родов/чисел находится в словаре, то все хорошо. Если нет, то лучше не рисковать. - DZ - 12:40, 8 ноября 2014 (UTC)
          • Я пробовал первый метод реализовать регуляркой, но она довольно быстро разрасталась и понять, почему она неправильно работает, стало решительно невозможно. Вообще-то говоря, ещё более интересным является вопрос о нахождении статей с такими вот ошибками. Не будешь же весь миллион статей пробегать. --Дрейкхем Обс. 13:06, 8 ноября 2014 (UTC)
            • Выкачать дамп. Просматривать локально. Если есть косяк, качать текущую версию статьи и там исправлять. - DZ - 13:36, 8 ноября 2014 (UTC)
          • Словарь тоже не абсолютно спасает. Например, одинаково выглядят кириллическое слово Веер и латинское Beep. Vcohen 13:31, 8 ноября 2014 (UTC)
            • Ну так это же второе приближение придуманное на ходу. До абсолюта там еще копать и копать. :) - DZ - 13:36, 8 ноября 2014 (UTC)
            • И в теории, я бы заложился на 1-2 ошибки в слове. Если больше латиницы, то тупо пропускаем. - DZ - 13:38, 8 ноября 2014 (UTC)
              • Вообще, интересно было бы узнать, как с этим делом управлялся Latitude--Дрейкхем Обс. 14:14, 8 ноября 2014 (UTC)
                • Напишите на почту. Может, читает и поделится. - DZ - 14:20, 8 ноября 2014 (UTC)
  • en:User:Yurik/CaseCheckerBot: casechecker.py в pywikibot это умеет делать rubin16 18:58, 8 ноября 2014 (UTC)
    • Я бы делал самообучающегося бота с постепенным усложнением по мере накапливания ошибок, но это слишком геморройно. Не окупится. Во всяком случае, я таких слов не знаю, где бы комбинировались латинские и русские буквы, кроме каверзных наименований некоторых рок-групп. Исходя из этого, можно написать простого бота, а случаи из 2-3 символов, или где EN/RU 50/50 отложить для ручной проверки. А вообще, лучше сначала достучаться до Latitude. ~Нирваньчик~ øβς 20:13, 10 ноября 2014 (UTC)
      • Ещё записи транскрипции слов некоторых славянских языков (когда я последний раз заменял с на с, мне по этому поводу высказали фе участники проекта Лингвистика) MaxBioHazard 20:19, 10 ноября 2014 (UTC)
        • Пришёл в голову альтернативный метод. Сделать скрипт/гаджет, подсвечивающий такие слова, где комбинируются алфавиты, и распиарить его. ~Нирваньчик~ øβς 14:35, 16 ноября 2014 (UTC)
          • А вот это отличная идея. MaxBioHazard 03:31, 22 ноября 2014 (UTC)

Сообщение о предыдущих номинациях на КУ[править | править вики-текст]

Говорят, бот перестал автоматически проставлять уведомления о предыдущих номинациях номинируемой на удаление статьи. Правда ли? Если да, то можно ли это исправить починить? --Томасина 21:50, 14 октября 2014 (UTC)

Да, проблему подтверждаю. Я только вернулся, когда найдётся свободное время - сразу займусь. --DR 08:01, 15 октября 2014 (UTC)
В рамках торжественного отмечания месяца с дня обещания разобраться боты был починен. --DR 10:14, 16 ноября 2014 (UTC)
Спасибки, проверить пока не было возможности, но будем надеяться, всё хорошо. --Томасина 10:07, 22 ноября 2014 (UTC)