Википедия:Вымирание ссылок

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
↱ ВП:404
ВП:Мёртвые ссылки
ВП:Link rot

Как и большинство крупных сайтов, Википедия страдает от вымирания ссылок (англ. link rot): ссылки на источники постепенно перестают работать (такие ссылки называются мёртвыми) или ведут на не соответствующие запросу веб-страницы, так как сайты, на которых они расположены, исчезают, меняют структуру, обновляют содержание. Это явление представляет серьёзную угрозу политикам проверяемости и цитирования источников, которых придерживается Википедия.

Предотвращение вымирания ссылок требует гораздо меньше усилий, чем их восстановление или замена. Профилактические меры, таким образом, улучшают энциклопедию. В данном эссе изложены стратегии по предотвращению вымирания ссылок, прежде чем оно произойдёт.

Существует несколько способов профилактики, в том числе:

Редакторам статей рекомендуется добавлять архивную ссылку для каждой сноски, или, как минимум, выполнить саму архивацию URL источника[комм. 1], одновременно с добавлением или же обновлением источника.

Однако предотвратить вымирание ссылки можно не всегда. Данное руководство рассказывает, как можно смягчить ущерб от вымирания ссылок с помощью поиска существующих архивных версий источника или аналогичных материалов.

Не удаляйте сноску c источником только потому, что его URL более недоступен. Правило проверяемости не требует, чтобы каждая сноска вела на доступный источник, да и вообще не говорит о доступности источника в Интернете.

За исключением ссылок в разделе «Ссылки», которые не используются для подтверждения какого-либо материала статьи, не удаляйте ссылку исключительно потому, что её адрес больше не работает. Существуют возможности и инструменты для восстановления и исправления мёртвых ссылок.

Как предотвратить появление мёртвых ссылок[править вики-текст]

↱ ВП:ПМС

Есть несколько способов предупредить появление мёртвых ссылок. Первый способ: при редактировании статьи добавлять ссылку на источник с дополнительными сведениями: заголовок материала, авторство, издателя и дату публикации, а не просто голый URL. Дополнительно можно указать дату последней проверки (|accessdate=) веб-страницы. Если страница исчезнет, дополнительные сведения позволят будущему редактору или читателю Википедии найти альтернативный источник оригинального текста, в сети или в отпечатанном виде. Некоторые городские библиотеки также имеют подписки на цифровые базы данных или межбиблиотечные соглашения, что делает более легким получение и поиск труднодоступных источников. При наличии только мёртвого URL это вряд ли будет возможно.

При редактировании, если встретите голый URL в списке источников, добавьте к нему дополнительные сведения или, по крайней мере, обозначьте шаблоном {{пмс}} («потенциально мёртвая ссылка») для напоминания, что необходимо добавить дополнительные сведения об источнике.

Сервисы веб-архивирования[править вики-текст]

Второй способ предотвратить смерть ссылки — это использовать службы веб-архивирования. Два наиболее популярных сервиса — это Wayback Machine (англ.), которая автоматически сканирует и архивирует множество веб-страниц, а также имеет форму для ручного архивирования определённого URL-адреса[комм. 1], и WebCite, который предусматривает веб-архивацию «по требованию». Эти сервисы собирают и сохраняют веб-страницы для использования в будущем, даже если исходная веб-страница перемещается, изменяется, удаляется или размещена на сайте с платным доступом. Веб-архивирование особенно важно при цитировании с нестабильных или склонных к изменениям веб-страниц, таких, как чувствительные ко времени новостные статьи или страницы, размещённые на сайте, не поддерживаемом организацией со стабильным финансированием. Если у вас есть URL для архивной версии веб-страницы, используйте параметры |archiveurl= и |archivedate= в используемом вами шаблоне для источников. Шаблон автоматически добавит заархивированную ссылку в примечания.

Тем не менее не все веб-страницы могут быть заархивированы. Веб-мастера и владельцы сайтов могут использовать стандарт исключений для роботов на своем сайте, чтобы отключить архивацию, или использовать сложный JavaScript, Flash или другой код, который не сможет быть легко скопирован. В этих случаях могут быть доступны альтернативные методы для сохранения данных.

Robots.txt[править вики-текст]

Причуда в работе Wayback Machine в том, что архивные копии страниц иногда становятся недоступными, например, блог Freakonomics, ранее размещенный на freakonomics.blogs.nytimes.com. Но затем эти URL-адреса были исключены из архивации с помощью файла robots.txt, который настроил себе New York Times. Это имело неблагоприятный эффект — ранее архивированный контент оказался недоступен. Но вновь внесенные изменения в robots.txt могут отобразить то, что уже скрыли предыдущие его изменения, поэтому не удаляйте архивный URL только потому, что архивный контент в настоящее время недоступен. К счастью, в приведённом примере не только можно найти содержание на новом сайте, который до сих пор открыт для архивирования, но и robots.txt сайта впоследствии был изменён, что разрешило архивацию, и поэтому старые архивы вновь отображаются (пример).

Альтернативные методы[править вики-текст]

Некоторые шаблоны для источников имеют параметр |quote=, который может быть использован для хранения текстовых цитат с исходного материала. Данный параметр может быть использован для хранения ограниченного количества текста из источника в шаблоне цитирования. Это особенно полезно для источников, которые не могут быть заархивированы сервисами веб-архивирования. Параметр также может обеспечить «страховку» при отключении или временной недоступности выбранного сервиса веб-архивирования.

При использовании параметра |quote=, выбирайте наиболее краткий и соответствующий материал, который по возможности сохранит контекст самого примечания. Хранение полного текста с источника не согласуется с политикой защиты авторских прав, так что выбирайте только самые важные части текста, которые максимально поддерживают утверждения в статье Википедии.

Цитата также поможет в поиске других онлайн-версий источника, в том случае, если оригинал более недоступен.

В случае необходимости, материалы в общественном достоянии могут быть скопированы в Викитеку.

Восстановление мёртвых ссылок[править вики-текст]

Есть несколько способов попытаться восстановить мёртвую ссылку, они подробно описаны ниже.

Поиск по сайту[править вики-текст]

Часто веб-страницы просто перемещаются в связи с миграцией на новый сервер или в процессе общего обслуживания сайта. «Каталог сайта», «карта сайта» или какая-нибудь специфическая функция поиска по сайту могут помочь найти перемещённую страницу.

Поисковая система[править вики-текст]

Запрос в поисковой системе с использованием заголовка страницы, возможно, с ограничением поиска по тому же сайту, также может помочь найти страницу. Используя дальнейшие примеры, поисковой запрос (например, в Google, Yahoo и др.) может выглядеть так:

site:freakonomics.blogs.nytimes.com/ "Wall Street Journal Paywall Sturdier Than Suspected"
site:nytimes.com/ "Wall Street Journal Paywall Sturdier Than Suspected"
"Wall Street Journal Paywall Sturdier Than Suspected"

Кроме того, часто плодотворен поиск по некоторым частям мёртвой ссылки с удаленной пунктуацией; например такой поиск через Google

groups.csail.mit.edu sFFT paper pdf

приводит к странице, позволяющей исправить это. Также поиск по необычной или уникального вида части URL (например, просто имя файла, указанное в конце URL), часто бывает плодотворен.

Архивы Интернета[править вики-текст]

Проверьте заархивированные версии страницы на сервисах архивирования. Если вы нашли архивную версию мёртвой ссылки, дважды убедитесь, что источник по-прежнему подтверждает текст статьи. Также неплохая идея — это ознакомиться с датой доступности источника (если она была указана, или поискать по истории, когда ссылка была добавлена), чтобы сравнить актуальность по времени архивной версии ссылки и версии, когда ссылка была добавлена.

Надёжными считаются следующие сервисы архивирования:

Интерфейс Mementos позволяет осуществить поиск архивных версий некоторых страниц на сразу нескольких сервисах архивирования одним запросом с использованием протокола Memento (англ.). К сожалению, интерфейс на веб-странице Mementos удаляет любые параметры, которые включены в URL. Если URL-адрес содержит «?», то он вряд ли будет работать должным образом при введении вручную, без изменений. При вводе URL в интерфейс Mementos вручную, наиболее распространённое изменение — необходимость изменить «?» на «%3F». Хотя только этого изменения не будет достаточно во всех случаях, в большинстве случаев работать оно будет. Букмарклет в таблице ниже позволяет правильно кодировать URL-адреса таким образом, чтобы поиск работал. Mementos выглядит, или, по крайней мере, будет очень удобным. Однако, если архивы не найдены на Mementos, это не должно быть для Вас истиной в последней инстанции. Mementos иногда не возвращает никаких результатов, даже если архивы существуют на сайтах, которые он обычно обрабатывает. Пример этого — попытка найти архивы страницы «Битва за Атлантику» в английской Википедии. На апрель 2014 года Archive.org сообщает, что в нём есть 63 или 64 копии этой страницы (https, http). В отчетах же Mementos 0 архивов (https и http). Mementos обычно находит архивы на Archive.org, но иногда он не показывает их даже тогда, когда они существуют. Если вы используете Mementos впервые, то не думайте, что архивов на самом деле не существует, если он сообщает, что их нет.

Когда доступны несколько архивов по различным датам, попробуйте использовать тот, который, скорее всего, сохранил в себе самое похожее содержание страницы, которую видел редактор, проставивший параметр |accessdate=. Если этот параметр не задан, то можно выполнить поиск по истории изменений, чтобы определить дату, когда ссылка была добавлена в статью.

Просмотрите архив, чтобы убедиться, что он содержит достоверную информацию со страницы. Иногда архивы фактически содержат только подтверждение того факта, что ссылка умерла либо архивирование не удалось по другой причине. Если это так, попытайтесь использовать архив с другой датой. Обычно следует выбирать даты ближе к тому времени, когда ссылка была размещена на странице Википедии, или ранее, она скорее всего покажет действительную информацию. Просмотрите также различные сайты веб-архивирования.

В ряде шаблонов для источников, архивные версии указываются с помощью параметров |archiveurl=, |archivedate= и |deadurl=. Если проставлен параметр |deadurl=yes, первичная ссылка автоматически заменяется на архивную. Это сохраняет исходный адрес ссылки источника.

Букмарклеты, проверяющие часто используемые сайты-архивы на наличие архивов для текущей страницы
(все открываются в новой вкладке или странице)
Сайт-архиватор Букмарклет
Archive.org
javascript:void(window.open('https://web.archive.org/web/*/'+location.href))
UKGWA
javascript:void(window.open('http://webarchive.nationalarchives.gov.uk/*/'+location.href))
WebCite
javascript:void(window.open('http://www.webcitation.org/query.php?url='+location.href))
Wikiwix
javascript:void(window.open('http://archive.wikiwix.com/cache/?url='+location.href))
Интерфейс Mementos
javascript:void(window.open('http://www.webarchive.org.uk/mementos/search/'+encodeURIComponent(location.href)+'?referrer='+encodeURIComponent(document.referrer)))

Альтернативы мёртвой ссылке[править вики-текст]

Может случиться, что все попытки восстановить ссылку окажутся неудачными. В этом случае, рассмотрите возможность нахождения альтернативного источника, так, чтобы потеря оригинала не навредила проверяемости статьи. Альтернативные источники о широких темах, как правило, легко найти. Простой запрос в поисковой системе может помочь найти подходящую альтернативу, но будьте предельно осторожны, чтобы не процитировать зеркала и форки самой Википедии, которые бы нарушали Википедия:Проверяемость.

Иногда найти подходящий источник не представляется возможным или требует более обширных методов исследования, таких, как посещение библиотеки или использование базы данных на основе подписки. Если это так, попробуйте проконсультироваться с редакторами Википедии на страницах Проект:Библиотека или Википедия:Форум/Вопросы. Кроме того, можете попытаться наладить контакты с экспертами или же другими заинтересованными редакторами в соответствующих Вики-проектах.

Сохраняйте мёртвые ссылки[править вики-текст]

Неработающий, неархивированный URL-источник по-прежнему может быть полезным. Мёртвая ссылка указывает на то, что в прошлом информация была (вероятно) не голословна, и ссылка может предоставить другому участнику, с бо́льшими ресурсами или опытом, достаточное количество информации, чтобы найти ссылку. Кроме того, ссылка может внезапно «воскреснуть из мёртвых». По мёртвой ссылке можно определить, была ли она процитирована в другом месте, или, например, можно связаться с лицом, ответственным за первоначальный источник. Например, можно обратиться на компьютерный факультет Йеля, если http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf(недоступная ссылка) станет недоступной, умрёт. Шаблон {{dead link}}, если это возможно, вставляйте после мёртвого URL и непосредственно перед тегом </ref>, оставив первоначальную ссылку нетронутой.

Простановка {{dead link}} автоматически категоризирует статью в категорию проекта Статьи с нерабочими ссылками, а также в определённые категории по месяцам на основе параметра |date=. Не удаляйте URL-адрес только потому, что он в течение длительного времени был помечен шаблоном {{dead link}}.

Автоматические инструменты[править вики-текст]

Существовали боты, которые активно и в автоматическом режиме архивировали внешние URL-адреса, используемые в статьях Википедии. В настоящее время они не работают.

LinkChecker — это инструмент с открытым исходным кодом, который может сканировать любой сайт на наличие сломанных ссылок, в том числе и Википедию.

Вымирание ссылок на Википедию на внешних сайтах[править вики-текст]

Внешние сайты также восприимчивы к вымиранию ссылок. После переименования или удаления страниц, ссылки на страницы Википедии с других сайтов могут сломаться. В большинстве случаев переименования страницы на старой странице будет оставлен редирект — это не вызовет проблем. Но если страница была полностью удалена или узурпирована (то есть заменена другим содержимым), то ссылка вымрет на всех внешние сайтах, которые ссылались на неё.

Замена содержимого страницы на содержимое страницы значений все ещё может привести к вымиранию ссылки, но это менее вредно, поскольку страница значений является по существу типом мягкого перенаправления и в итоге позволит привести читателя к необходимой теме. Если страница узурпирована другой темой, которая имеет такое же название, можно разместить специальный шаблон в верхней части страницы со ссылкой, которая направит читателей к необходимому исходному содержанию, но уже на новой странице — это опять-таки является типом мягкого перенаправления, но менее очевидным. В этих случаях, читатели, которые приходят в Википедию благодаря внешней поломанной ссылке, должны быть в состоянии найти то, что они ищут, но таких ситуаций лучше избегать, из-за того что им приходится «проходить» через дополнительную страницу. Это потенциально создаёт плохое впечатление как о Википедии, так и о ссылающемся на неё сайте.

Невозможно сказать, сколько, если таковые имеются, внешних веб-страниц будет затронуто в результате перемещения или удаления страницы, но риск появления мёртвой ссылки, вероятно, будет самым большим при работе со старыми, статусными и популярными страницами. На самом деле, здесь мало что можно сделать; обслуживание внешних сайтов не входит в обязанности участников, в большинстве случаев из-за предела наших возможностей (хотя, если что-то может быть исправлено, было бы полезно сделать это). Тем не менее, это может быть хорошей практикой — думать о потенциальном воздействии на другие сайты, когда удаляются или перемещаются страницы Википедии, особенно если не останется перенаправления или шаблона значений. Если перемещение или удаление страницы, как ожидается, нанесет существенный ущерб, то это может быть одним из доводов для обсуждения на ВП:КПМ или ВП:КУ, хотя другие доводы могут иметь больший вес.

См. также[править вики-текст]

Примечания[править вики-текст]

  1. 1 2 На странице https://archive.org/web/ следует ввести URL и нажать кнопку «Browse history». Если веб-страница по данному URL уже заархивирована, то в результате отобразится календарь со ссылками на архивные копии содержимого по этому URL. Если веб-страница по данному URL не существует, вместо этого отобразится надпись «Wayback Machine doesn’t have that page archived». Если веб-страница по данному URL существует, но ещё не заархивирована, то отобразится приглашение её заархивировать «This page is available on the web! Help make the Wayback Machine more complete! Save this url in the Wayback Machine».

Ссылки[править вики-текст]

  • weblinkchecker.py — скрипт от Python Wikipedia Bot коллекционирует найденные сломанные ссылки.
  • UndeadLinks.org — позволяет осуществлять поиск нового адреса мёртвой ссылки.
  • Resurrect Pages — плагин для Firefox, содержит 7 ссылок на кэшированные/архивные вебсайты встретившейся мертвой ссылки.
  • 404-Error? — плагин для Firefox, автоматически приводит вас к версии archive.org для встретившейся мертвой ссылки.
  • PageHistory — плагин для Safari.
  • Webcache — плагин для Opera.
  • Web Cache — плагин для Chrome.
  • Internet Archive
  • BrokenWikiLinks Twitter bot — твитит о страницах со сломанными ссылками