Вымирание ссылок

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Вымира́ние ссы́лок (англ. link rot, дословно — гниение ссылок) — процесс, в результате которого используемые URL-адреса больше не направляют на первоначальный источник. Такие ссылки называют битыми или мёртвыми. Под вымиранием или гниением понимают два основных процесса: reference rot (вымирание сносок) и link rot (вымирание ссылок). В первом случае URL-адрес остаётся рабочим, но ведёт на неправильную или видоизменённую страницу. Это явление также носит название дрейф контента. Дрейф обнаружить сложнее, но он влечёт более существенные последствия, так как способствует распространению дезинформации или подмене понятий. В случае с link rot недоступной является ссылка, из-за чего пользователи теряют доступ к веб-странице.

Ссылки могут перестать работать по множеству причин. Иногда для этого требуется изменение только одного символа в URL. К примеру, многие сайты перестали использовать приставку «www», и даже если их содержание осталось прежним, исходные ссылки прекратили работать. То же самое может произойти с внедрением шифрования и переходом от «http:» к «https:». Также владельцы сайтов переименовывают каталоги, меняют доменные имена и структуру порталов, а также забывают обновлять регистрацию домена — всё это приводит к появлению битых ссылок.

Вымирание ссылок прогрессирует со временем. Так, с 1996 по 2021 год перестала работать четверть ссылок на сторонние ресурсы в статьях издания The New York Times (NYT). Данные получены на основе анализа свыше 550 тысяч публикаций сотрудниками юридического факультета Гарвардского университета совместно с журналистами NYT[1][2][3].

Характеристика[править | править код]

Гиперссылки широко используются не только в повседневной коммуникации, но и в журнальных статьях, научных докладах и других видах публикаций. Их популярность объясняется удобством и доступностью. Так, например, согласно профессору права Гарвардского университета Лоуренсу Лессигу, цитируемые онлайн-статьи потенциально достигают большего количества читателей, так как к ним можно получить доступ «просто перейдя по ссылке». Одновременно с этим всё больше газет и журналов переходит в онлайн-формат. Анализ более чем 100 000 статей показал, что среднее количество цитирований печатных работ составило 2,74, а онлайн версий — 7,03[4]. Процент статей, цитирующих хотя бы один URL-адрес, увеличился с 24 % в 2006 году до 48,5 % в 2013-м[5][6][7].

Под вымиранием ссылок (англ. link rot, дословно – гниение ссылок) понимают два основных процесса: вымирание сносок (англ. reference rot) и вымирание ссылок (англ. link rot). В первом случае URL-адрес остаётся рабочим, но ведёт на неправильную или видоизменённую страницу. Это явление также носит название дрейф контента (англ. content drift). В отличие от печатных источников, содержание веб-страницы может меняться без какого-либо специального обозначения. Дрейф обнаружить сложнее, но он влечёт более существенные последствия, так как способствует распространению дезинформации или подмене понятий[8]. Случай, когда URL недоступен и выдаёт ошибку называется link rot[9][10][11][8][12][13][14].

Причины[править | править код]

Главной причиной вымирания ссылок является децентрализация всемирной паутины — дизайн сети не подразумевает централизованного сохранения контента. Продолжительность работоспособности ссылок определяется владельцами доменного имени[15], которые зачастую забывают обновить регистрацию домена, отслеживать контент и появление битых ссылок. Кроме того, сайты регулярно изменяются — на веб-страницах меняют информацию и структуру самих сайтов, переименовывают файлы и каталоги, перемещают контент[16][2]. Частота и степень изменений веб-страницы зависит и от размера документа. Большие документы меняются чаще, чем меньшие по размеру[17]. Всё это приводит к вымиранию ссылок[4][8][18][16]. В 2009 году Yahoo! отключили сервера бесплатного веб-хостинга GeoCities, что привело к потере данных о 7 млн веб-сайтов[19]. Помимо этого вымирание может быть вызвано сменой настроек доступа, например, при вводе регистрации или внедрении подписки на ранее открытый контент [4]. Ссылки могут исчезнуть и в результате преднамеренных действий. Так, после изменения политики редакции BuzzFeed в 2015 году были удалены более 1000 постов, в том числе те, на которые ранее жаловались рекламодатели портала или сотрудники партнёрских компаний[20][21][22][23].

Чтобы ссылка стала нерабочей, достаточно изменения одного символа в URL-адресе. Например, многие сайты перестали использовать префикс «www», и, даже несмотря на то, что их содержание не изменилось, исходные ссылки перестали работать. То же самое может произойти с внедрением шифрования трафика: некорректная настройка при переходе от «http:» к «https:» влечёт "поломку" ссылки[24]. Если ссылка оказывается битой, то пользователи могут столкнуться с нескольким видом ошибок[16][25][16][26][4]:

  • ошибка 404 или страница не найдена выпадает в случае, если файл был удалён с сервера или реорганизован;
  • ошибка 400 (Bad request) всплывает когда запрос не может быть обработан сервером из-за ошибки пользователя — например, неверного запроса;
  • ошибка 401 HTTP выдаётся при ограничении доступа к ресурсу — когда материалы расположены в защищённом паролем каталоге.;
  • внутренние ошибки сервера отображаются ошибкой 504 Gateway или ошибкой 502 Bad Gateway;
  • неизвестные ошибки (код HTTP 901) связаны с проблемами DNS, такими как сбой поиска имени домена[4].

Постоянство работоспособности ссылок обеспечивают три основных фактора: год публикации, иерархия URL-адресов и домен верхнего уровня[27][11]. Чем старше ссылка, тем больше вероятность, что она будет недоступна. Сноски с указанием даты доступа к информации вероятнее всего будут обладать большей стабильностью — даже если веб-страница окажется недоступной, зная дату доступа, пользователи смогут воспользоваться сервисами архивирования, вроде Wayback Machine. Также домены верхнего уровня считаются более стабильными[28]. Сайты под руководством частных лиц, как правило, исчезают чаще, чем правительственные и образовательные ресурсы[29]. Исследование 2003 года показало, что чаще всего вымирали ссылки, оканчивающиеся на «.com» (46 % потеряно через 27 месяцев), затем — «.edu» (30 %), другие — (20 %), «.gov» (10 %) и «.org» (5 %)[30].

[...] Оказалось, что вымирание ссылок и дрейф контента – неотъемлемая часть интернета, что неудивительно и шокирующе рискованно для библиотеки, в которой есть «миллиарды книг и нет центральной файловой системы». Представьте себе мир, в котором библиотек не существует, а вместо них действует "экономика совместного пользования" физических копий книг – люди могут зарегистрировать те книги, которые лежат у них дома, а другие могут прийти и посмотреть их. Конечно, не удивительно, что такая система может устареть, когда книги больше не будут находиться там, где их изначально обозначали – особенно если кто-то отметил, что книга находилась в чужом доме в 2015 году, а потом другой заинтересованный читатель увидел бы отчёт за 2015 и попытался бы посетить первоначальный дом в 2021 году. Это та ситуация, которая складывается в данный момент в интернете.

Распространённость[править | править код]

Заглавная страница The Million Dollar Homepage на февраль 2009 года

Первые масштабные исследования распространённости вымирания ссылок начали проводиться ещё в конце 1990-х годов. Одним из первых исследователей был Якоб Нильсен – специалист в области эксплуатационных характеристик веб-узлов. В 1998-м он сообщил о результатах исследования, проведённого All Things Web, согласно которому около 6 % ссылок в интернете являлись нерабочими[31][9]. Впоследствии профессор Университета Теннесси Салли МакМиллан проанализировала выборку сайтов за 1997—2000 годы и обнаружила, что 27 % URL исчезали через три года после создания[29]. Последующий анализ доказал, что количество мёртвых ссылок увеличивается линейно с течением времени. Так, в 2008 году мёртвые ссылки присутствовали в 8,3 % URL-адресов ресурсов из статистически значимой выборки в 579 заголовков. В 2009 году нерабочие ссылки были обнаружены в 13,7 % URL-адресов из выборки в 680 сайтов, а в 2010-м вымершие ссылки составили 22,4 % от всех URL-адресов из выборки в 736 ссылок[11][9]. В 2021 году команда сотрудников юридического факультета Гарвардского университета совместно с журналистами The New York Times (NYT) провели исследование жизнеспособности цитирований на основе выпущенных NYT онлайн-версий статей. Всего было изучено свыше 550 тысяч публикаций за период с 1996 года, которые содержали около 2,2 млн ссылок на сторонние сайты. Исследование показало, что почти четверть всех используемых при цитировании ссылок перестала работать[1][2][3][1][2][3].

Вопросу вымирания ссылок посвящён ряд исследований. В них были проанализированы научные статьи, в которых авторы опирались на интернет-источники. Исследование от 2003 года показало, что около 13 % URL ссылок, опубликованных в трёх ведущих научных журналах, перестали работать в течение двадцати семи месяцев после публикации статьи. В 2008 году исследование исторических журналов обнаружило, что 38 % процитированных URL-адресов стали недоступны в течение семи лет после публикации статьи, 10 % — потеряли работоспособность в течение нескольких месяцев. В выборке новозеландских научных журналов 2002-2005 годов 30 % веб-цитирований перестали работать к 2006 году[11]. В 2013-м BMC Bioinformatics[en] провела анализ продолжительности жизни ссылок в научной литературе. Учёные Джейсон Хеннесси и Стивен Ксиджин Ге из Университета Южной Дакоты проанализировали около 15 000 ссылок в отрывках из индекса цитирования Web of Science. Они обнаружили, что средняя продолжительность жизни веб-страниц составляла 9,3 года и только 62 % ссылок были заархивированы[24]. Это привело исследователей к заключению, что скорость распада для недавних URL-адресов выше, чем старых[32][16][33][7]. Учёные также обнаружили, что в ряде юридических журналов, опубликованных в период с 1999 по 2011 год, более 70 % ссылок больше не функционировали[24][9].

В 2008 году ежеквартальный анализ четырёхлетних публикаций ведущих изданий показал сохранение только 61% из 416 онлайн-цитирований. 19 % онлайн-сносок содержали ошибку в URL-адресе, а 63 % не указывали дату доступа в опубликованной цитате. Из тех ссылок, которые все еще были активны, только 58 % соответствовали цитируемому контенту[34][35][2]. В 2015 году специалист по информации из Национальной исследовательской библиотеки Лос-Аламосской лаборатории в Нью-Мексико Герберт Ван де Сомпель проанализировал более 1 млн веб-ссылок на сайты из примерно 3,5 млн работ, опубликованных в период с 1997 по 2012 год. В статьях 2012 года 13 % гиперссылок в статьях arXiv.org и 22 % гиперссылок в статьях из журналов Elsevier были мёртвыми. Около 75 % ссылок не были архивированы ни на одном портале в течение двух недель после даты публикации статьи. Это означает, что их содержание может больше не отражать первоначальное[36][37].

Ярким примером масштаба вымирания ссылок является проект Алекса Тью The Million Dollar Homepage. Портал был запущен в 2005 году для того, чтобы Тью собрал деньги на университетское образование. Для этого он придумал сайт с сеткой 1000 на 1000 пикселей, на котором можно было бы приобрести место для ссылки на свой сайт по доллару за одну штуку. Покупатели могли расположить небольшие изображения своих сайтов, к которым был привязан URL и слоган, отображаемый при наведении курсора. Все пиксели были проданы спустя 138 дней после запуска портала. К 2014 году 22 % пикселей главной страницы не загружали веб-страницу[38][39].

Последствия[править | править код]

Судебная система[править | править код]

В Верховном суде США сложилась практика цитирования постоянных источников — как правило, это были книги. Такие цитаты позволяли юристам и ученым найти, понять и оценить доказательства и доводы суда. Однако начиная с 1996 года судьи всё чаще используют ссылки и гиперссылки при описании судебных решений[40][12][41]. Согласно исследованию профессора гарвардской школы права Джонатана Зиттрейна, проведённому в 2013 году, около 49 % гиперссылок в решениях Верховного суда не работали[42][43][44]. Суд занимает верхнюю позицию в иерархии федеральных судов, определяя законы страны и даже влияя на законы в международных юрисдикциях, поэтому мёртвые ссылки в решениях могут оказать особенно разрушительный эффект[45]. Так, когда в 2011-м судья Сэмуэль Алито в деле о насилии в видеоиграх сослался на URL-адрес, владельцы домена отказались от веб-сайта и оставили на нём такое сообщение, чтобы подчеркнуть эфемерность размещаемой в интернете информации[46]:

Разве вы не рады, что не процитировали эту веб-страницу в отчёте Верховного суда по делу Браун против Interactive Entertainment Merchants Association[en], 131 S.Ct. 2729, 2749 n.14 (2011). Если вы сделали это, как это сделал судья Алито, исходный контент давно бы исчез, и кто-то другой мог бы прийти и купить домен, чтобы прокомментировать быстроту связанной информации в эпоху Интернета.

Для решения этой проблемы все цитируемые в судебных решениях веб-материалы стали архивировать в бумажном виде. Помимо этого был создан специализированный портал, на котором сохраняют архивированные копии сайтов[47].

Подобные проблемы могут возникнуть и при составлении протоколов — полиция может опираться на опубликованную в интернете запись с видеорегистраторов, которая впоследствии может быть удалена владельцем. Другой вопрос связан с тем, как долго хранить данные в системе — у большинства полицейских управлений нет достаточных технических возможностей, чтобы справляться с объёмом поступающих данных[46].

Наука[править | править код]

Вымирание ссылок нарушает и подрывает целостность и доказательную базу научных исследований во всех областях[48][33][49][50]. Уже в 1996 году треть цитирований в рецензируемых электронных журналах была недоступна, а многие рабочие ссылки не содержали полную информацию — отсутствовала дата извлечения, а метаданные были неправильно оформлены[51]. Согласно проведённому в 2016 году исследованию, 75 % ссылок на научный контент больше не указывают на информацию, цитируемую в тексте[52]. При этом количество научных работ, ссылающихся на интернет-ресурсы, неуклонно растёт[32]. Отдельные журналы, такие как Cancer Research[en], стали запрещать использование URL-адресов в примечаниях. Однако такая практика скорее является исключением[30].

Повсеместное вымирание ссылок привело и к изменению практик библиотек в архивировании материалов[9]. Если раньше основным способом хранения информации считались бумажные копии, а их онлайн-версии были дополнительной опцией, то теперь библиотеки и издательства переходят на цифровой формат, считая печатный устаревшим[15]. Многие библиотеки начали создавать собственные онлайн-архивы с постоянным доступом к хранимым материалам[53][54].

Цифровой тёмный век[править | править код]

Вымирание ссылок является неотъемлемой частью прогнозируемого сценария цифрового тёмного века — ситуации, когда произойдет потеря электронных данных при полном отсутствии их бумажных эквивалентов. Сторонники этой теории считают, что из-за неадекватных практик электронного архивирования и растущей децентрализации интернета существует риск потери информации о нашей эпохе в будущем[55][56]. Термин цифровой тёмный век (англ. digital dark age) был впервые предложен в 1997 году на международной конференции Международной федерации библиотечных ассоциаций и учреждений. Определение отсылает к эпохе средних веков, характеризуемой практически полным отсутствием письменных свидетельств[57][58][59]. Одним из самых распространённых примеров проявления «цифрового тёмного века» — потеря доступа к старым накопителям и носителям информации, включая дискеты, Zip-накопители и компакт-диски[60][61][62][63][64][65].

Предотвращение[править | править код]

Веб-архивирование[править | править код]

Создатель «Архива Интернета» Брюстер Кейл в 2009 году
Логотип Wayback Machine, 2010 год

Электронное архивирование является одной из основных стратегий борьбы с вымиранием ссылок[10]. В этой сфере действуют сразу несколько крупных проектов. В 1996 году американский программист Брюстер Кейл основал «Архив Интернета» — некоммерческую организацию, поставившую перед собой цель сохранить всю размещённую в интернете информацию, которой в первые годы существования сети было не так много. Коллекция «Архива» состоит из подколлекций архивированных веб-сайтов, оцифрованных книг, аудио и видео файлов, игр, программного обеспечения. В 2001 году был запущен сервис Wayback Machine, который через работу веб-краулеров архивирует и предоставляет доступ к бо́льшей части открытого интернета. Помимо этого сервис позволяет пользователям сравнивать разные версии правок. На октябрь 2021 года WB предоставлял доступ к более чем 580 млрд сохранённым веб-страницам[66][67][68][66][69]. Хранение данных осуществляется через систему зеркальных сайтов, расположенных в географически отдалённых друг от друга местах[70] - в Сан-Франциско, Ричмонде, Александрии, Амстердаме. Для эффективного хранения файлов «Архив» использует формат файла архива (ARC), позволяющий сохранить файлы, полученные по любому типу сетевого протокола. Архивные снимки отображаются в формате HTML, JavaScript и CSS[70][24][9][32].

Также по инициативе «Архива» был создан сервис Archive It — служба веб-архивирования, позволяющая частным лицам и отдельным организаторам самостоятельно собирать, создавать и сохранять коллекции электронных материалов. На октябрь 2021 года пользователи могут получить доступ к более чем 200 коллекциям по истории, культуре, науке, правам человека и другим общественно важным темам[70][24][9][32].

Аналогичным проекту Wayback Machine является Perma.cc — служба архивирования, созданная Библиотекой Гарвардской школы права в Кембридже (штат Массачусетс). В Perma.cc можно ввести URL-адрес и система автоматически его заархивирует, создав новую гиперссылку для постоянного хранения материала[36][9]. Чаще всего Perma используют в правовой сфере для сохранения цитируемых источников[71]. Распространённый в США стилистический справочник Bluebook[en] поощряет архивирование ссылок[72][73]. Однако отдельные исследователи указывают на потенциальную уязвимость портала, поскольку настоящее законодательство об авторском праве уделяет недостаточное внимание вопросу существования и деятельности веб-архивов[74].

Проект c открытым исходным кодом Amber, созданный Berkman Klein Center for Internet & Society[en], позволяет сделать снимки каждой связанной с архивированным веб-сайтом страницы и сохранить их локально или на централизованную платформу, такую как «Архив Интернета» или Perma.cc. Если при введении материала в Amber проект обнаруживает, что ссылка не работает или работает некорректно, Amber предлагает архивацию[9][75].

Цифровой идентификатор объекта (DOI)[править | править код]

Для борьбы с вымиранием ссылок в научной сфере используют цифровой идентификатор объекта (DOI), разработанный Международной организацией по стандартизации в 2000 году. DOI — это постоянный идентификатор, функционирующий как ссылка на конкретный объект, будь то статья, аудио или видеоматериал[30][32]. После присвоения DOI объект получает «вечную» закреплённую ссылку, которая, в отличие от URL-адресов, не может быть перемещена или удалена. Многие издательства адаптировали систему[76]. DOI хранится в специализированных реестрах вместе с метаданными о каждом отдельном элементе. Цитирование работ осуществляется через числовой идентификатор, а не через гиперссылку. Подобная система позволяет создать стабильность в сфере научного цитирования — даже если материал будет перенесён на новый URL, он всё равно будет доступен[77]. По разным оценкам, с помощью повсеместного внедрения DOI можно предотвратить вымирание 30-60 % ссылок в научных работах[32][78][24][77]. Однако у DOI существует существенный недостаток — из-за необходимости вносить плату за регистрацию работ, многие небольшие издательства не могут себе позволить внедрение системы[30].

Примечания[править | править код]

  1. 1 2 3 Исследователи указали на проблему "вымирания" ссылок в интернете. Вести (21 мая 2021). Дата обращения: 28 сентября 2021. Архивировано 23 ноября 2021 года.
  2. 1 2 3 4 5 Bowers, 2021.
  3. 1 2 3 Mitchell Clark. New research shows how many important links on the web get lost to time. The Verge (21 мая 2021). Дата обращения: 10 октября 2021. Архивировано 20 июня 2021 года.
  4. 1 2 3 4 5 Goh, 2006.
  5. Klein, 2014.
  6. Lawrence, 2001, с. 26—31.
  7. 1 2 Taylor, 2000.
  8. 1 2 3 Margolis, 2019, с. 61—79.
  9. 1 2 3 4 5 6 7 8 9 White, 2019, с. 29—43.
  10. 1 2 Burnhill, 2015, с. 55—61.
  11. 1 2 3 4 Rhodes, 2010, с. 581=597.
  12. 1 2 Jay Jackson. Linkrot is degrading legal research and case cites. AbaJournal (1 декабря 2013). Дата обращения: 3 октября 2021. Архивировано 22 ноября 2021 года.
  13. Richard Gall. How To Stop The Internet From Disappearing. Logically (24 августа 2021). Дата обращения: 10 октября 2021. Архивировано 22 ноября 2021 года.
  14. Reference rot in web-based scholarly communication and link decoration as a path to mitigation. LSE. Дата обращения: 10 октября 2021. Архивировано 22 ноября 2021 года.
  15. 1 2 3 Jonathan Zittrain. The Internet Is Rotting. Atlantic. Дата обращения: 10 октября 2021. Архивировано 11 октября 2021 года.
  16. 1 2 3 4 5 Król, 2019, с. 68—79.
  17. A Large-Scale Study of the Evolution of Web Pages. WWW2003. Дата обращения: 28 сентября 2021. Архивировано 9 июля 2011 года.
  18. Cool URIs don't change. W3. Дата обращения: 8 октября 2021. Архивировано 2 марта 2000 года.
  19. Dan Fletcher. Internet Atrocity! GeoCities' Demise Erases Web History. Time (9 ноября 2009). Дата обращения: 5 октября 2021. Архивировано 7 мая 2021 года.
  20. Liam Stack. BuzzFeed Says Posts Were Deleted Because of Advertising Pressure. New York Times (19 апреля 2015). Дата обращения: 10 октября 2021. Архивировано 29 октября 2021 года.
  21. Nick Routley. Error 404: A Look At Digital Decay. Visual Capitalist (7 августа 2017). Дата обращения: 10 октября 2021. Архивировано 22 ноября 2021 года.
  22. Tom Kludt. BuzzFeed admits it bowed to business pressure by deleting posts. CNN Business (20 апреля 2015). Дата обращения: 10 октября 2021. Архивировано 23 ноября 2021 года.
  23. The Arweave Project. Link Rot: The Web is Decaying. Arweave Medium. Дата обращения: 11 октября 2021. Архивировано 4 ноября 2021 года.
  24. 1 2 3 4 5 6 Leighton Walter Kille. The growing problem of Internet “link rot” and best practices for media and online publishers. The Journalist's Resource. Дата обращения: 23 сентября 2021. Архивировано 10 октября 2021 года.
  25. Diomidis Spinellis. he Decay and Failures of Web References. Communications of the ACM. Дата обращения: 29 сентября 2021. Архивировано 22 ноября 2021 года.
  26. Basyuk, 2017.
  27. Dimitrova, 2010.
  28. Dimitrova, 2010, с. 34.
  29. 1 2 McMillan, 2001.
  30. 1 2 3 4 Graber, 2003.
  31. Fighting Linkrot. Nielsen Norman Group (13 июня 1998). Дата обращения: 7 октября 2021. Архивировано 23 ноября 2021 года.
  32. 1 2 3 4 5 6 Hennessey, 2013.
  33. 1 2 Habibzadeh, 2013.
  34. Dimitrova, 2008, с. 115—123.
  35. Scott Carlson. Here Today, Gone Tomorrow: Studying How Online Footnotes Vanish. The Chronicle of Higher Education (30 апреля 2004). Дата обращения: 28 сентября 2021. Архивировано 23 ноября 2021 года.
  36. 1 2 Perkel, 2015, с. 111—112.
  37. Perkel, 2015, с. 111.
  38. After nine years, the Million Dollar homepage is 22% dead. The Guardian (27 марта 2014). Дата обращения: 28 сентября 2021. Архивировано 6 октября 2021 года.
  39. David Yanofsky. The Million Dollar Homepage still exists, but 22% of it has rotted away. Quartz (25 марта 2014). Дата обращения: 10 октября 2021. Архивировано 17 октября 2021 года.
  40. Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere. New York Times (23 сентября 2013). Дата обращения: 11 октября 2021. Архивировано 23 ноября 2021 года.
  41. Torres, 2012.
  42. Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere. The NEw York Times (23 сентября 2013). Дата обращения: 29 сентября 2021. Архивировано 20 октября 2021 года.
  43. Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere. The New York Times (23 сентября 2013). Дата обращения: 10 октября 2021. Архивировано 20 октября 2021 года.
  44. Jacob Kastrenakes. Supreme Court citations are falling apart as web links begin to change and disappear. The Verge (23 сентября 2013). Дата обращения: 5 октября 2021. Архивировано 23 ноября 2021 года.
  45. Liebler, 2013.
  46. 1 2 Suzette Lohmeyer. Link rot: What happens when the internet isn’t forever. GCN (27 июля 2016). Дата обращения: 11 октября 2021. Архивировано 23 ноября 2021 года.
  47. Supreme Court addresses link rot problem.. Counsel Press. Дата обращения: 11 октября 2021. Архивировано 23 ноября 2021 года.
  48. Content referenced in scholarly articles is drifting, with negative effects on the integrity of the scholarly record. LSE Blog (23 февраля 2017). Дата обращения: 8 октября 2021. Архивировано 18 ноября 2021 года.
  49. Dimitrova, 2010, с. 52.
  50. Markwell, 2002.
  51. Dimitrova, 2010, с. 29—30.
  52. Chris Sutcliffe. Degeneracy: the brand safety impact of link rot. The Drum (4 августа 2021). Дата обращения: 29 сентября 2021. Архивировано 18 августа 2021 года.
  53. Bugeja, 2007, с. 1—20.
  54. Something's rotten in the state of the internet, and archivists are worried. CBC (11 июня 2021). Дата обращения: 10 октября 2021. Архивировано 21 октября 2021 года.
  55. Kuny, 1997.
  56. Digital Domesday Book lasts 15 years not 1000. The Guardian (3 марта 2002). Дата обращения: 27 сентября 2021. Архивировано 20 января 2013 года.
  57. Giaretta, 2011.
  58. Panos, 2003.
  59. Adam Wernick. Scientists warn we may be creating a 'digital dark age'. The World (1 января 2018). Дата обращения: 26 сентября 2021. Архивировано 16 августа 2021 года.
  60. Veronique Greenwood. The digital Dark Ages. Yale Alumni Magazine (June 2020). Дата обращения: 27 сентября 2021. Архивировано 15 октября 2021 года.
  61. Dan Greene. The erosion of personal ownership. Vox (21 апреля 2021). Дата обращения: 28 сентября 2021. Архивировано 26 сентября 2021 года.
  62. To avoid a digital dark age, all stakeholders must put their heads together. The Times of India (17 сентября 2020). Дата обращения: 27 сентября 2021. Архивировано 8 сентября 2021 года.
  63. Lauren Maffeo. Google's Vint Cerf on how to prevent a digital dark age. The Guardian (29 мая 2015). Дата обращения: 27 сентября 2021. Архивировано 19 ноября 2021 года.
  64. Dave Smith. Father of the internet: 'If we don’t move now, we risk losing all the data we’ve created in the 21st century'. Business Insider (20 февраля 2015). Дата обращения: 28 сентября 2021. Архивировано 19 ноября 2021 года.
  65. Николай Удинцев. Цитата дня: почему может начаться «цифровой Тёмный век». Look at Me (13 февраля 2015). Дата обращения: 28 сентября 2021. Архивировано 19 ноября 2021 года.
  66. 1 2 Wayback Machine. Wayback Machine. Дата обращения: 7 июня 2021.
  67. Lerner, 2017, с. 1741—1755.
  68. Michael Bryant. What is the Wayback Machine and Why is it Useful?. Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. Архивировано 18 мая 2021 года.
  69. Fernando, 2016, с. 109—112.
  70. 1 2 3 Rackley, 2010, с. 2966—2976.
  71. Keele, 2014.
  72. Perma.cc for Journal Members. Stanford Law School. Дата обращения: 10 октября 2021. Архивировано 24 ноября 2021 года.
  73. Aaron Gustafson. Avoiding Link Rot in Print with the Help of Perma.cc. Medium. Дата обращения: 10 октября 2021. Архивировано 24 ноября 2021 года.
  74. Callister, 2021.
  75. Amber. Drupal. Дата обращения: 10 октября 2021. Архивировано 24 ноября 2021 года.
  76. Алексей Стригин. Как остановить рост числа нерабочих ссылок в интернете. Российская газета (3 августа 2021). Дата обращения: 29 сентября 2021. Архивировано 24 ноября 2021 года.
  77. 1 2 Szydlowski, 2014, с. 711—718.
  78. Ruth Bird. Dealing With Link Rot – Are DOIs the Cure?. Slaw. Canda's legal magazine (11 апреля 2014). Дата обращения: 10 октября 2021. Архивировано 24 ноября 2021 года.

Литература[править | править код]

  • Basyuk T. Innerlinking website pages and weight of links // CSIT 2017. — 2017. — С. 12—17.
  • Bugeja M., Dimitrova D. The Half-Life Phenomenon // The Serials Librarian. — 2008. — Т. 49, вып. 3. — С. 115—123. — doi:10.1300/J123v49n03_10.
  • Burnhill P., Mewissen M., Wincewicz R. Reference rot in scholarly statement: threat and remedy // Insights. — 2015. — Т. 28, вып. 2. — С. 55—61. — doi:10.1629/uksg.237.
  • Callister P. Perma.cc and Archival Dissonance with Copyright Law // Copyright and Web archiving. — 2021.
  • Dimitrova I., Daniela V. Vanishing act : the erosion of online footnotes and implications for scholarship in the digital age. — Litwin Books. — Dimitrova, 2010. — ISBN 978-1-936117-14-7.
  • Dimitrova D., Bugeja M. Raising the Dead: Recovery of Decayed Online Citations // American Communication Journal. — 2007. — Т. 9, вып. 2. — С. 1—20.
  • Germain C. URLs: Uniform Resource Locators or Unreliable Resource Locators. // College & Research Libraries. — 2000. — Т. 61, вып. 4. — С. 359—365.
  • Giaretta D. Avoiding a Digital Dark Age for data: why publishers shoudl care about digital preservation // Learned Publishing. — 2011. — С. 1—18.
  • Dellavalle R., Hesterlauren J., Heiligamanda F., Drakejeff L., Kuntzmanmarla W., Graber L., Schilling M. Going, Going, Gone: Lost Internet References // Science. — 2003. — Т. 302, вып. 5646. — С. 787—788. — doi:10.1126/science.1088234.
  • Goh D.,Kin Ng P. Link decay in leading information science journals. — 2006. — Т. 58, вып. 1. — С. 15—24. — doi:10.1002/asi.20513.
  • Gould T. Creating the Academic Commons: Guidelines for Learning, Teaching, and Research. — Scarecrow Press. — 2011.
  • Fernando Z., Marenzi I., Nejdl W., Kalyani R. ArchiveWeb: Collaboratively Extending and Exploring Web Archive Collections // Research and Advanced Technology for Digital Libraries. — 2016. — С. 107—121.
  • Habibzadeh P. Decay of References to Web sites in Articles Published in General Medical Journals: Mainstream vs Small Journals // Applied Clinical Informatics. — 2013. — Т. 4, вып. 4. — С. 455—464. — doi:10.4338/ACI-2013-07-RA-0055.
  • Hennessey J., Ge S. A cross disciplinary study of link decay and the effectiveness of mitigation techniques // BMC Bioinformatics volume. — 2013. — doi:10.1186/1471-2105-14-S14-S5.
  • Hughes B. Link? Rot. URI Citation Durability in 10 Years of AusWeb Proceedings // Semantic Scholar. — 2006.
  • Keele B. Perma: A Tool for Addressing Link Rot in Published Scholarship // InULA Notes. — 2014. — Т. 26, вып. 1. — С. 9—10.
  • Klein M., Sompel H., Sanderson R., Shankar H., Balakireva L., Zhou K., Tobin R. Scholarly Context Not Found: One in Five Articles Suffers from Reference Rot // Plos One. — 2014. — doi:10.1371/journal.pone.0115253.
  • Koehler W. A longitudinal study of Web pages continued: a consideration of document persistence // Information Research. — 2004. — Т. 9, вып. 2.
  • Kuny T. A Digital Dark Ages? Challenges in the Preservation of Electronic Information // 63RD IFLA Council and General Conference. — 1997.
  • Król K. The link rot phenomenon and its influence on the quality of the websites of rural tourism facilities in Poland // Economic and regional studies. — 2019. — Т. 12, вып. 1. — С. 68—79.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
  • Lawrence S., Pennock D., Flake G., Krovetz R. Persistence of Web References in Scientific Research // Computing Practices. — 2001. — С. 26—31.
  • Liebler R., Liebert J. Something rotten in the state of legal citation: the life span of a United States Supreme Court Citation Containing an Internet Link // Yale Journal of Law and Technology. — 2013. — Т. 15, вып. 2.
  • Margolis E. Link rot, reference rot and the thorny problems of legal citation // Partners for preservation. — 2019. — С. 69—81.
  • Markwell J., Brooks D. “Link Rot” Limits the Usefulness of Web-based Educational Materials in Biochemistry and Molecular Biology // Biochemistry and molecular biology education. — 2002. — Т. 31, вып. 1. — С. 69—72.
  • McMillan S. Survival of the Fittest Online: A Longitudinal Study of Health-Related Web Sites // Journal of Computer-Mediated Communication. — 2001. — Т. 6, вып. 3.
  • Nelson M., Allen B.D. Object Persistence and Availability in Digital Libraries // D-Lib. — 2002. — Т. 8, вып. 2.
  • Panos P. The Internet Archive: An End to the Digital Dark Age // Journal of Social Work Education. — 2003. — Т. 39, вып. 2. — С. 343—347. — doi:10.1080/10437797.2003.10779139.
  • Perkel J. The trouble with reference rot // Nature. — 2015. — Т. 521. — С. 111—112.
  • Rackley M. Internet Archive // Encyclopedia of Library and Information Sciences. — 2010. — Т. 1, вып. 1. — С. 2966—2976.
  • Rhodes S. Breaking Down Link Rot: The Chesapeake Project Legal Information Archive's Examination of URL Stability // Law Library Journal. — 2010. — Т. 102, вып. 4. — С. 581—597.
  • Szydlowski N. A Dead Link or a Final Resting Place: Link Rot in Legal Citations // AALL Spectrum. — 2014. — Т. 18, № 6. — С. 711—718.
  • Taylor M., Hudson D. "Linkrot" and the Usefulness of Web Site Bibliographies // Reference & User Services Quarterly. — 2000. — С. 237—277.
  • Torres A. Is link rot destroying stare decisis as we know it? The Internet-citation practices of the Texas Appellate courts // The Journal of appellate practices and process. — 2012. — Т. 13, вып. 2.
  • Zittrain J., Kendra Albert, Lawrence Lessig. Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations // Harvard Law Review. — 2004.
  • Zittrain J., Bowers J., Stanton C. The Paper of Record Meets an Ephemeral Web: An Examination of Linkrot and Content Drift within The New York Times // Library Innovation Lab. — 2021.
  • White J. Link Rot, Reference Rot, and Link Resolves // New Top Technologies Every Librarian Needs to Know. — 2019. — С. 29—43.

Ссылки[править | править код]