Архив Интернета

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Internet Archive
Internet Archive logo and wordmark.png
Главная страница сайта
URL

archive.org

Коммерческий

нет

Тип сайта

универсальная электронная библиотека

Язык(-и)

английский

Расположение сервера

СШАFlag of the United States.svg США
ЕгипетFlag of Egypt.svg Египет
НидерландыFlag of the Netherlands.svg Нидерланды

Владелец

Internet Archive

Автор

Брюстер Кейл[1]

Начало работы

24 января 1996

Текущий статус

работает

Commons-logo.svg Архив Интернета на Викискладе

Архив Интернета (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско Брюстером Кейлом. Архив собирает копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка электронной библиотеки. По состоянию на октябрь 2012 года размер Архива — 10 петабайт[2]. По состоянию на август 2016 года содержит 502 миллиарда копий веб-страниц. Сервер Архива расположен в Сан-Франциско, зеркала — в Новой Александрийской библиотеке и в Амстердаме. С 2007 года Архив имеет юридический статус библиотеки[3].

История[править | править вики-текст]

Архив был создан Брюстером Кейлом в 1996 году примерно в то же время, когда он основал компанию Alexa Internet, занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[4]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время помимо копий веб-сайтов включает тексты, видео, звукозаписи, программное обеспечение и изображения.

Проекты[править | править вики-текст]

Wayback Machine[править | править вики-текст]

Логотип Wayback Machine

The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью бота, или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.

Легальность[править | править вики-текст]

На сервис не раз подавались судебные иски, в связи с тем, что публикация контента может быть нелегальной[5]. Поэтому сервис удаляет материалы из публичного доступа по требованию их правообладателей, или если доступ к страницам сайтов не разрешён в файле robots.txt владельцами этих сайтов.

В 2002 году часть архивных копий веб-страниц, содержащих критику саентологии, была удалена из архива[6] с пояснением, что это было сделано по «просьбе владельцев сайта»[7]. В дальнейшем выяснилось, что этого потребовали юристы Церкви саентологии, тогда как настоящие владельцы сайта не желали удаления своих материалов[8]. Некоторые пользователи сочли это проявлением интернет-цензуры.

Книжный сканер Архива
Книга, изготовленная в течение 20 минут в рамках проекта Book-on-demand, на основе электронной книги из Архива

Open Library[править | править вики-текст]

Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год Архиву принадлежит 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 петабайт, включая изображения и документы в формате PDF[9]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.

Scan-on-demand — бесплатная оцифровка желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».

Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или защищены лицензией Creative Commons.

Награды[править | править вики-текст]

23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии Free Software Awards, организованной некоммерческим фондом Free Software Foundation (FSF)[10][11].

Блокировка Архива Интернета в России[править | править вики-текст]

Images.png Внешние изображения
Image-silk.png Страница сайта Роскомнадзора с сообщением о блокировке страницы «Одиночный джихад»

В октябре 2014 года Роскомнадзор заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «Звон мечей» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «Исламское государство»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[12][13][14].

16 июня 2015 года на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации» генпрокуратура РФ приняла решение о блокировке страницы «Одиночный джихад в России», содержащей по её мнению «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[14][15][16], в действительности на территории России был заблокирован доступ ко всему сайту, кроме The Wayback Machine.

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. https://archive.org/about/bios.php
  2. 10,000,000,000,000,000 bytes archived!. Архивировано из первоисточника 28 ноября 2012.
  3. Internet Archive officially a library. Internet Archive (7 мая 2007). Проверено 31 августа 2016.
  4. Internet Archive: In the Collections. Wayback Machine(недоступная ссылка — история) (6 июня 2000). Проверено 1 сентября 2016. Архивировано из первоисточника 6 июня 2000.
  5. Статья о сервисе в англ. Википедии(англ.)
  6. Bowman, Lisa M. Net archive silences Scientology critic, CNET News.com (24 сентября 2002 г). Архивировано из первоисточника 16 июля 2012. Проверено 4 января 2007.
  7. Jeff. exclusions from the Wayback Machine (Blog). Wayback Machine Forum. Internet Archive (23 сентября 2002 г.). Проверено 4 января 2007. Архивировано из первоисточника 25 августа 2011. Author and Date indicate initiation of forum thread
  8. Miller, Ernest Sherman, Set the Wayback Machine for Scientology (Blog). LawMeme. Yale Law School (24 сентября). Проверено 4 января 2007. Архивировано из первоисточника 25 августа 2011. The posting is billed as a 'feature' and lacks an associated year designation; comments by other contributors appear after the 'feature'
  9. Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 ноября 2008.. Архивировано из первоисточника 28 ноября 2012.
  10. Free Software Awards Announced. Архивировано из первоисточника 28 ноября 2012.
  11. Стали известны номинанты ежегодной награды Free Software Awards. Архивировано из первоисточника 28 ноября 2012.
  12. Производится блокировка экстремистского видео террористической организации «Исламское государство Ирака и Леванта» в сети Интернет. Роскомнадзор (24 октября 2014).
  13. Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов.
  14. 1 2 Роскомнадзор заблокировал архив интернета // РБК. 25 июня 2015 года.
  15. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм // Lenta.ru. 25 июня 2015 года.
  16. Роскомнадзор заблокировал архив интернета из-за «Одиночного джихада» // Московский комсомолец. 25 июня 2015 года.

Литература[править | править вики-текст]

Ссылки[править | править вики-текст]

Зеркала