Википедия:Заявки на статус бота/DelphiWikiRobot 2

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

User:DelphiWikiRobot[править код]

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

вкладправкиSULжурналыблокироватьлог блокировокжурнал изменения правприсвоить флаг Ответственный ботовод/Botmaster: Участник:KPu3uC B Poccuu.

Цель/Purpose[править код]

Прошу флаг для написанного мной робота. Пока робот только выполняет API запросы, необходимые для собирания статистики и разной информации, так как для участников с этим флагом существуют меньшие ограничения на их количество. После обретения и проверки функциональности, необходимой для непосредственного автоматизированного изменения содержимого страниц Википедии, будет сделан отдельный запрос на флаг. Пример запроса, выполняемого им, см. Википедия:Запросы к ботоводам#Список активно загружающих файлы. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)[ответить]

Технические подробности/Technical details[править код]

Написан мной на Delphi, используется сильно переделанная обёртка для MediaWiki API из проекта Delphi JEDI. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)[ответить]

Имеется флаг бота в других виках?/Already has a bot flag in other wikipedias?[править код]

Нет. KPu3uC B Poccuu 12:06, 8 января 2012 (UTC)[ответить]

Обсуждение/Discussion[править код]

  • Каким образом были учтены те замечания/возражения, которые были высказаны участниками на Википедия:Заявки на статус бота/DelphiWikiRobot? --Obersachse 12:16, 8 января 2012 (UTC)[ответить]
    • Так называемые замечания касались правок личных страниц, которыми я заниматься не собираюсь, если Вы имели в виду это. Не понимаю, какие те замечания относятся к текущей заявке, где я чёрным по белому указал, что вносить правки роботом не собираюсь пока. KPu3uC B Poccuu 12:20, 8 января 2012 (UTC)[ответить]
  • Если флаг нужен исключительно для API запросов, то почему бы не выдать? Но бот не должен вносить никаких правок до повторной подачи заявки, а не «пока не собираюсь».--Сергей Александрович обс 15:30, 8 января 2012 (UTC)[ответить]
    • «После обретения и проверки функциональности, необходимой для непосредственного автоматизированного изменения содержимого страниц Википедии, будет сделан отдельный запрос на флаг». Во-вторых, бот будет делать правки в моём личном пространстве. Иначе способа его проверять на работоспособность с учётом того, что testwiki не работает, я не вижу. KPu3uC B Poccuu 15:41, 8 января 2012 (UTC)[ответить]
  • Если нужна только статистика, почему бы не скачать дамп и не работать с ним? И нагрузка на сервер меньше, и быстродействие быстрее (и флаг не нужен). Vlsergey 14:58, 12 января 2012 (UTC)[ответить]
    • MySQL не увлекаюсь, простите, скачивать и разбирать немаленькие дампы не имею желания, да и некоторые запросы требуют самых точных, последних данных. Неужели Википедия обвалится от выдачи мне этого флага? KPu3uC B Poccuu 15:11, 12 января 2012 (UTC)[ответить]
  • Приведите, пожалуйста, примеры запросов, для которых Вам не хватает стандартных API-лимитов. Напомню, ограничений на количество запросов нет, просто batch будет меньшего размера, и, соответственно, самих запросов немного больше. Мне хочется понять, зачем Вам флаг, сам по себе, или для чего-то реального. Vlsergey 15:23, 12 января 2012 (UTC)[ответить]
    • Да, я неверно выразился, не общее количество запросов ограничено, а именно количество элементов в ответе. Я желаю обрабатывать за раз наибольшее количество информации, так как ответы кеширую после разбора каждого пакета результатов, и тратить время на файловые операции затратно по времени, ну и просто непрерывное жужжание жесткого диска надоедает. И не «немного меньше», а, если мне не изменяет память, в 10 раз, разница огромна. KPu3uC B Poccuu 15:40, 12 января 2012 (UTC)[ответить]
      • С технической точки зрения приведённая Вами аргументация является смешной. Вам никто не запрещает сделать несколько запросов, сгруппировать их в один файл (даже в памяти), после чего обрабатывать. Кроме того, Вы не привели конкретные примеры задач и запросов, которые Вы обрабатываете. Кроме того, увеличение разрешённых лимитов приведёт к большей нагрузке на Вашу клиентскую систему. Vlsergey 18:06, 12 января 2012 (UTC)[ответить]
        • Усложнять систему, большая часть которой была написана не мной, и с которой я ещё не совсем освоился, по крайне мере пока не представляется возможной. Пример я привёл, читайте внимательно. Но другими своими планами могу поделиться и сейчас: это поиск перенаправлений в никуда, поиск перенаправлений из пространства шаблонов в другие, поиск подстраниц переименованных страниц. Что-то было ещё. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)[ответить]
          • Для таких задач нужно как-раз скачивать дамп. Однако и без дампа, если Вы не собираетесь получать списки и содержание ВСЕХ перенаправлений, то флаг бота не нужен. А если собираетесь — то лучше отправить Вас к разработчикам, пусть они Вам объяснят, почему так делать не нужно. Vlsergey 07:11, 13 января 2012 (UTC)[ответить]
  • Насколько я знаю, без флагов администратора или бота невозможно получить выборку страниц по какому-то признаку (включения шаблона, попадание в категорию, WhatLinksHere и т.д.) размером более 25 000 страниц; в практике нередко нужно больше. Так что я не против выдачи флага даже для этого; не думаю, что проблемы от вышеописанного режима работы возникнут. MaxBioHazard 16:04, 12 января 2012 (UTC)[ответить]
    • Если это правда, то тем более, у меня почти все задуманные запросы на эту тему. KPu3uC B Poccuu 16:15, 12 января 2012 (UTC)[ответить]
    • Таких лимитов нет, либо они мне не известны. Что самое главное — эти лимиты неизвестны номинатору, то есть он в них ещё не «упёрся». Vlsergey 18:09, 12 января 2012 (UTC)[ответить]
    • Насколько я понял из Гугла, речь идёт об ограничении в 25 тыс. страниц в качестве результата, который может использовать AWB. Это скорее не ограничение, а защита от перегрузки серверов из-за неумелого использования AWB. В самой MediaWiki ограничения на количество результатов вообще нет (только ограничение на количество результатов в одном батче). Vlsergey 18:15, 12 января 2012 (UTC)[ответить]
      • См. mw:API:Query#Specifying titles, mw:API:Lists#Limits. В первом ограничение на количество указанных имён страниц, во втором на число элементов в ответе на каждый список. Если второе ещё как-то можно отбросить, если считать, что я обязан перерыть свой и чужой код, то первое нет, так как это ограничение я сегодня повстречал при попытке найти все переименованные страницы и их подстраницы, точнее, при запросе на получение информации об найденных мной переименованных страницах (размер, кто переименовал, куда, время, вернули ли её обратно), в котором я как раз передавал имена найденных страниц. KPu3uC B Poccuu 23:25, 12 января 2012 (UTC)[ответить]
        • Повторюсь, никто не мешает делать несколько запросов. Эти несколько запросов обязаны делать как боты, так и участники без ботов, просто у вторых их больше (зато возвращаемые порции меньше). Если Ваш код (а код Вашего бота считается Вашим, и Вы за него отвечаете, а не какой-то дяденька) не умеет делить запросы на куски и потом их объединять — Вы всё равно «упрётесь» в ограничения API, будет у Вас флаг бота или не будет. Vlsergey 07:11, 13 января 2012 (UTC)[ответить]
  • По какой причине заявитель не воспользуется стандартными фрейворками? Для каких задач требуется собственный фрейворк? Апрувить бота на основании самописного фрейворка это всегда риск для бюрократа. Заявитель должен иметь это ввиду и быть готов продемонстрировать вменяемость, высокую техническую подкованность и компетентность выше среднего. --Dnikitin 13:22, 12 марта 2012 (UTC)[ответить]
    • По той, что их надо изучать, надо изучать вдобавок другие языки программирования, я не могу быть уверен без хорошей документации в том, что знаю, как программа поведёт себя в той или иной ситуации, исправления какого-нибудь бага, возможно, придётся ждать месяцами, ну и недостаточно — для меня — контроля над роботом; последнее для меня критично, я хочу быть уверен, что на все сто процентов контролирую его работу и могу поменять малейшую деталь в ней. Зато при написании своего робота самим всех этих сложностей избежать. Если Вам интересно, то единственная причина, по которой я не делаю правок, это работа над гибким форматом правил для работы, по сути это скрипт на встроенном скриптовом языке, чтобы каждый раз незаморачиваться над перепрограммированием робота. KPu3uC B Poccuu 13:58, 12 марта 2012 (UTC)[ответить]
      • Ясно. В общем я задавался тем же вопросом, но потом решил, что в краудсорсинговом проекте нужно полагаться на мощь комьюнити и использовать «стандарт-дефакто» pywikipedia (хотя с питоном был не знаком). И с тех пор много раз хвалил себя, что сделал правильным выбор и не стал использовать бота на Java, на языке который мне ближе. Главная проблема с собственным фреймворком в том, что даже если вы будете контролировать и работать быстрее чем целое комьюни, то этого все равно недостаточно. Нужно убедить еще в этом окружающих (эту самую комьюнити), а это самое сложное. --Dnikitin 18:21, 12 марта 2012 (UTC)[ответить]

Итог/Summary[править код]

Многочисленные возражения и сомнения мне не позволяют присвоить флаг бота. --Obersachse 06:52, 17 марта 2012 (UTC)[ответить]