Электронное архивирование

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Электро́нное архиви́рование (цифровое сохранение) — ряд практик, стратегий и рабочих процессов по защите электронных документов от устаревания и потери информации. Деятельность по архивации цифровых данных направлена на создание, обслуживание и сохранение целостности цифровой информации. Для обозначения практик электронного архивирования используют несколько терминов — digital preservation (дословно — электронное или цифровое сохранение), digital archiving (электронное или цифровое архивирование) или digital management (управление цифровыми данными). Зачастую эти понятия употребляют как взаимозаменяемые, однако использование отдельных терминов зависит от страны.

Практики электронного архивирования начали появляться с середины 1990-х годов, когда с развитием информационных технологий и новых видов цифровых носителей всё чаще стал подниматься вопрос о необходимости долгосрочного хранения цифровых объектов. Потребность в этом возникла из-за относительно короткого срока службы цифровых носителей — например, надёжность хранения информации на дискетах и картах памяти составляет лишь несколько лет, а в случае оптических дисков — от 3 до 20 лет. Наиболее устойчивыми способами хранения информации считаются магнитные ленты, на которых данные могут надёжно храниться от 15 до 30 лет. Вплоть до начала 1990-х цифровая информация дублировалась в бумажных копиях. Однако таким образом архивировались далеко не все материалы — будучи закрытыми для общественности, множество электронных документов не подлежало архивации.

Деятельность в сфере электронного архивирования регулируется через серию принятых международных стандартов и отчётов рабочих групп, включая модель Open Archival Information System[en] (OAIS), Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project[en], PRONOM[en] и другие. Процесс архивирования цифровых материалов осуществляется через стратегии консервации (работа с материалами в оригинальных форматах и на оригинальных носителях, благодаря использованию исходной технологии или ранее применявшихся аппаратно-программных средств), эмуляции (воспроизведение функциональности устаревшей системы для обеспечения работы с устаревшими форматами данных), инкапсуляции (включение технического описания документа в состав самого цифрового объекта, таким образом уменьшая его зависимость от внешней среды, так как данная информация позволяет либо воспроизвести исходную среду, либо перенести документ в новую), миграции (перенос электронных документов на другие носители или же в другую операционную систему — например, с магнитной ленты на компакт-диск), цифровой археологии (метод архивирования материалов, который состоит в спасении тех цифровых объектов, которые стали недоступными из-за технологического устаревания и/или физической деградации), стратегии обновления (перенос информации с одного долговременного носителя на другой) или веб-архивирования​​ (процесс сбора, сохранения и извлечения сайтов и материалов из интернета с целью их размещения в электронном архиве для предоставления доступа следующим поколениям).

Предыстория[править | править код]

Первые попытки по автоматизации действий прослеживаются вплоть до XIV века, когда были изобретены карильоны — механические звонницы, управляемые педальным механизмом, который приводил рычаги в нужную последовательность по мере вращения за счёт скрепления с металлическим цилиндром со штифтами[1]. Этот принцип барабанной автоматизации был впоследствии внедрён и в текстильной промышленности — в XVIII веке была создана первая перфокарта или бумажная лента с отверстиями, через которую проходили челноки[2]. Вскоре перфокарты начали применять для автоматизации вычислений, они легли в основу аналитической машины Чарльза Бэббиджа[3], а позднее — табуляторов и компьютеров первого поколения[4][5].

Перфокарта, формат IBM

Вплоть до 1970-х годов перфокарты широко применялись для хранения и ввода данных — на них могло быть закодировано вплоть до 80 символов. Однако быстрое развитие вычислительных машин привело к появлению альтернативных способов хранения и автоматизации данных[6]. В 1954 году был создан первый магнитный носитель IBM 350[en], а в 1956-м — жёсткий диск[7]. Уже в 1960-х годах на смену перфокарте пришла магнитная лента, ставшая ведущим способом записи и автоматизированной обработки информации[8][9]. С развитием и внедрением магнитных дисков и флеш-памяти для хранения и записи информации значительно повысилась их ёмкость и производительность. Однако появилась проблема недолговечности носителей информации, что негативно влияло на сохранность данных. Так, надёжность хранения информации на магнитных дисках и флеш-картах составляет лишь несколько лет — эти носители неустойчивы как к температуре выше 100 ℃, так и к сильным электромагнитным полям. Информация на оптических дисках постепенно стирается под воздействием 50—70 ℃, они способны хранить данные от 3 до 20 лет. Самыми надёжными способами хранения информации считаются магнитные ленты, на которых данные могут храниться от 15 до 30 лет[10].

Создатель Архива Интернета Брюстер Кейл в 2009 году

С развитием информационных технологий и новых видов цифровых носителей стал более актуальным вопрос о долгосрочном хранении электронной информации. Вплоть до начала 1990-х годов большинство цифровой информации дублировали на бумажных копиях. Однако таким образом архивировались далеко не все материалы и множество электронных документов не подлежало бумажному архивированию по причине закрытости для общественности[11][12]. Первые проекты по электронному архивированию начали появляться во второй половине 1990-х годов. Так, в 1996 году австралийский проект Preserving Access to Digital Information (PADI) получил государственное финансирование. Его выполнение было поручено Национальной библиотеке Австралии. В рамках PADI публиковались отчёты по проектам и журнальные статьи по широкому кругу тем, а также происходило формирование профессионального сообщества в сфере сохранения цифровой информации[13]. В этом же году были запущены основанный Брюстером Кейлом проект по архивированию веб-страниц Архив Интернета[14], проекты Национальной библиотеки Швеции (Kulturarw Heritage Project) и Национальной библиотеки Австралии (PANDORA Project)[15]. В 1998 году ряд европейских национальных библиотек образовал Networked European Deposit Library (NEDLIB) для сохранения электронных объектов в библиотечной системе[16]. Одновременно с этим начали развиваться и проекты по разработке эффективных стратегий архивирования — Arts and Humanities Data Service[en] (1999) и Project CAMiLEON (1999). Уже начиная с 2000-х годов практики по сохранению электронных данных начинают внедрять повсеместно. Так, в 2000-м Библиотека Конгресса инициировала проект Minerva Initiative[en] по сбору и архивированию электронной информации, а нидерландский проект Digital Preservation Testbed стал частью национальной программы по сохранению цифровой информации. В 2001 году была создана Digital Preservation Coalition[en] — коалиция организаций по внедрению практик электронного архивирования в Великобритании и других странах. В 2006 году был основан аналогичный проект — Digital Preservation Europe[17][18].

Повсеместно внедряемые стратегии по электронному архивированию изменили роли библиотек, архивов и издательств, традиционно отвечающих за архивацию информации. Начиная с 2000-х годов сохранением электронных записей также занимаются частные организации, центры научных данных, некоммерческие организации[19].

В 2003-м ЮНЕСКО предприняло попытки объединить международные усилия по созданию систематизированного подхода к электронному архивированию, опубликовав Хартию «О сохранении цифрового наследия», призывающую мировое сообщество к внедрению стратегий по сохранению находящихся в опасности электронных объектов. В 2012 году на конференции программы ЮНЕСКО «Память мира» было вновь заявлено о необходимости создания унифицированной международной попытки по сохранению и предоставлению доступа к электронному наследию. В результате в 2013 году была создана программа PERSIST, направленная на сохранение мирового документального наследия[20][21].

Целью сохранения цифрового наследия является обеспечение его доступности для населения. Поэтому доступ к материалам цифрового наследия, особенно являющегося общественным достоянием, должен быть свободным от необоснованных ограничений. В то же время должна быть обеспечена защита от любых форм посягательств на безопасность информации конфиденциального и частного характера.[...]

Существует угроза того, что цифровое наследие мира может быть безвозвратно утрачено для последующих поколений. К факторам, способствующим этому, относится устаревание оборудования и программ, обеспечивающих доступ к цифровым материалам, неопределенность в вопросах ресурсного обеспечения, ответственности и методик обеспечения сохранности и сохранения, отсутствие соответствующих законодательных актов.[...]

В случае непринятия мер, направленных на предотвращение превалирующих угроз, произойдет быстрая и неизбежная утрата цифрового наследия. Принятие мер правового, экономического и технического характера, направленных на сохранение наследия, принесет пользу государствам-членам. Крайне необходимо повысить уровень осознания этого и активизировать информационно-разъяснительную работу, привлечь внимание лиц, ответственных за принятие политических решений, и стимулировать интерес широкой публики как к потенциальным возможностям цифровых средств информации, так и к практическим вопросам сохранения цифрового наследия.

Хартия ЮНЕСКО «О сохранении цифрового наследия»[22].

Основные положения[править | править код]

Определение[править | править код]

Для обозначения практик по электронному архивированию используют несколько терминов — digital preservation (с англ. — «электронное/цифровое сохранение»), digital archiving (с англ. — «электронное/цифровое архивирование») или digital management (с англ. — «управление электронными/цифровыми данными»). Зачастую эти понятия употребляют как взаимозаменяемые, однако использование отдельных терминов зависит от страны. Так, например, в США термин «цифровое сохранение» (digital preservation) используется чаще и, как правило, охватывает все действия по управлению электронными архивами с момента их создания. Впервые термин «digital preservation» был использован в 1992 году в статье журнала Theater Crafts, посвящённой новым видам цифрового сохранения материалов. В Великобритании, наоборот, термин «управление цифровыми данными» (digital management) используется для обозначения практик по управлению жизненным циклом электронных документов, а digital preservation — для тех действий, которые направлены на обеспечение их доступности в будущем. При этом термин preservation или «сохранение» в английском языке используется чаще, чем термин archiving или «архивирование», поскольку последний подразумевает сохранение физических документов в существующих материальных хранилищах. По этой причине preservation чаще относят к электронным объектам[23][24][25].

Созданная в 2007 году рабочая группа Американской библиотечной ассоциации определила электронное архивирование как сочетание стратегий, принципов и практик, направленных на точное воспроизведение аутентифицированного контента с течением времени, независимо от проблем, связанных с носителем и изменениями в технологиях хранения. Понятие применяется как к изначально созданным в электронном формате документам, так и к оцифрованным материалам[26]. Другими словами, это деятельность по отбору, хранению, и сохранению информации для обеспечения к ней доступа для будущих поколений[27][28]. Библиотека Корнеллского университета[en] определяет электронное архивирование как осуществляющее широкий спектр видов деятельностей действие, направленное на продление срока службы машиночитаемых компьютерных файлов и защиту их от отказа носителя, физической потери и устаревания[27][29].

Цели и принципы[править | править код]

Электронное архивирование стремится защитить и сохранить информацию для будущих поколений[30][31][29]. Деятельность по сохранению электронных данных направлена на создание, обслуживание и сохранение целостности цифровой информации. Создание подразумевает указание полных и чётких технических характеристик файлов, изготовление надёжных мастер-файлов и достаточных описательных, административных и структурных метаданных для обеспечения доступа в будущем. Под обслуживанием понимают документирование всех действий, совершаемых с файлами и полное отслеживание изменений. Сохранение информации подразумевает создание надёжной вычислительной и сетевой инфраструктуры, позволяющей сохранять и синхронизировать материалы на нескольких сайтах, а также непрерывный мониторинг и разработку стратегий по предотвращению потери данных[26][32].

В зависимости от поставленной цели электронное архивирование может быть долгосрочным (доступ предоставляется на неопределённый срок), среднесрочным (доступ в течение определённого периода времени) и краткосрочным (доступ к цифровым материалам в течение определённого периода времени и/или до тех пор, пока он не станет недоступным — например, из-за изменений в технологиях)[28][33]. Выделяют три основных инфраструктурных компонента электронного архивирования[24]:

  • организационный (политика, стратегии, практики, акторы);
  • технологический (необходимое оборудование, программное обеспечение, безопасная среда);
  • структурный (финансирование запуска, продолжения и поддержки программ электронного архивирования).

При этом технологические аспекты электронного архивирования могут быть разделены на следующие группы[34]:

  • физические (носители информации, репликация)
  • логические (форматы файлов, структурированные данные; сохранение и организация битов)
  • интеллектуальные (сохранение удобства использования/доступности, в первую очередь через метаданные)

Оценка архивных документов[править | править код]

Решения о необходимости архивирования цифровых объектов принимаются на основе оценивания их непреходящей ценности. Оценивание является лишь одной из стратегий, архивисты также используют методы статистической выборки и анализа рисков для выбора материалов для сохранения. Статистическая выборка полагается на статистические методы для создания репрезентативной выборки и соответствующего отбора бумажных и цифровых документов для сохранения или оцифровки. Метод анализа рисков заключается в оценке потенциальных трудностей, которые могут возникнуть при работе с цифровыми ресурсами, а также их потенциальных последствий – например, риск устаревания формата файлов и носителей, риск потерь, связанных с несохранением цифровых ресурсов и так далее. Как правило, анализ рисков осуществляется вместе с другими критериями отбора, такими как оценка затрат[35].

К 1980-м годам всё больше архивистов начали обращать внимание на то, что создание цифровых объектов и любых электронных записей проводилось без учёта требований к их длительному сохранению. В начале 1990-х годов стала очевидна проблема устаревания программного обеспечения и, соответственно, невозможности надёжного архивирования созданной с его помощью информации. С внедрением электронного архивирования появились и первые попытки по регламентации процесса. Так, была создана рабочая группа проекта InterPARES, которая занялась разработкой модели по отбору подлежащих архивированию электронных объектов[36][37].

Выделяют макро- и микро-оценивание. Под макро-оценкой понимают отбор документов для архивирования по принципу важности контекста – все ресурсы, созданные определёнными организациями, акторами, или в заданный промежуток времени, будут считаться важными и ценными[35]. Согласно разработанной InterPARES модели, оценка контекстов электронных записей состоит из четырёх основных ступеней:

  • Составление и анализ информации о записях и их контекстах.

Решение об архивировании файлов может приниматься на основе юридическо-административного контекста (правовой и административной системе, в которой были созданы материалы), финансового контекста (создающий орган, его полномочия, структура и функции), процедурного контекста (деловой процедуре, в ходе которой создаются записи), документального контекста (структура и взаимосвязи с другими документами) или технологического контекста (технические компоненты электронных систем, в которых создаются цифровые объекты)[36].

  • Оценка важности.

Архивисты также собирают данные о непреходящей ценности и аутентичности электронных материалов. Непреходящая ценность объекта определяется исходя от способности записей служить интересам или потребностям создателей и общества. Она может быть поставлена под сомнение в тех случаях, когда сохранность материалов могла быть нарушена. Если у оценщика есть веская причина подозревать, что записи потеряли аутентичность и отличаются от своей оригинальной версии, то их архивирование ставится под вопрос[36].

  • Определение возможности сохранения.

Согласно рекомендациям рабочей группы InterPARES, определение возможности сохранения осуществляется в несколько этапов. Сначала эксперт определяет содержание материалов и те технические элементы, которые необходимо сохранить в соответствии с требованиям к подлинности. Затем оценщик согласовывает эти требования по сохранению с возможностями организациями, ответственной за постоянное сохранение архивируемых записей[36].

  • Принятие решения об оценке.

На основе предыдущих оценок критериев применяется решение о сохранении документа[36].

Микро-оценка заключается в определении ценности отдельных документов. Самым главным её критерием является соответствие документа политике сбора хранителя – из-за несоответствия этим критериям запрос на электронное архивирование может быть отклонён, даже в случае ценных ресурсов. Например, Earth Resources Observation and Science (EROS) отказались от доступа к набору данных космической программы Аполлон, состоящего из тысячи кадров, снятых НАСА во время миссии. Несмотря на то, что кадры имеют неоспоримую ценность для США, EROS отказался от них, так как большинство фильмов были сняты с космического корабля или поверхности Луны, тогда как миссия организации заключается в сохранении фильмов и фотографий, сделанных с Земли. Второй по важности критерий оценки – ценность цифровых ресурсов, которая также может быть первичной и вторичной. Под первичной ценностью понимают административную, фискальную и юридическую ценности. Вторичная ценность заключается в полезности, удобстве использования и доступности материалов. Третий критерий оценки – стоимость, которая может стать решающим фактором в выборе нескольких версий одного и того же материала. Также архивисты принимают во внимание и осуществимость архивирования, поскольку некоторые хранители отказываются принимать цифровые ресурсы в определённых форматах файлов или носителях, поскольку не могут обеспечить долгосрочную сохранность отдельных материалов[35].

Виды цифровых объектов[править | править код]

Электронное архивирование применяют в основном к объектам, созданным в цифровой среде или оцифрованным. К первой категории относят данные, созданные с использованием какой-либо цифровой технологии. Под оцифрованными материалами понимают данные, преобразованные из аналоговой формы в цифровую с помощью сканирования или изменения формата[38]. Чаще всего электронное архивирование применяется по отношению к[27]:

  • оцифрованным версиям документов;
  • цифровым материалам, не имеющим печатного аналога;
  • отдельным объектам, таким как тексты, изображения, аудиозаписи;
  • коллективным ресурсам, таким как веб-сайты, блоги, электронные журналы;
  • наборам данных, состоящих из множества отдельных научных, компьютерных и других материалов;
  • записям сообщений, таким как электронные письма, сообщениям в мессенджерах, твитам, публикациям в Facebook, и другим аналогичным публикациям в интернете;
  • метаданным, которые способствуют долгосрочному хранению файлов и извлечению необходимых данных, благодаря включению в файл дополнительной информации об объекте (описание формата файла, программное обеспечение, история изменений).

Репозитории[править | править код]

Схема распространения и долговременного хранения научной информации в сети внутренних электронных ресурсов Карельского научного центра РАН (отмечены знаком «+») и внешних (отмечены знаком «-»), 2016 год

Электронные репозитории или хранилища данных являются одним из центральных элементов электронного архивирования. В репозиториях сохраняются все виды цифровых объектов вместе с соответствующими описательными и административными метаданными. В качестве цифровых объектов могут выступать статьи в электронном журнале, оцифрованные изображения фотографий, числовые данные, цифровые видео, полные версии книг[32]. В рамках движения за открытый доступ репозитории связывают с «зелёным» путём или практикой самоархивирования — авторы научных материалов могут самостоятельно размещать статьи в подходящий раздел электронного архива и снабдить её кратким описанием[39][40]. Один из первых крупных тематических репозиториев arXiv.org появился в 1991 году. Он предоставляет доступ к научным работам по математике, физике, информатике, количественной биологии. Репозитории позволяют не только получить доступ к коллекциям электронных копий работ, но и автоматически добавлять публикации в базу Citebase, которая обеспечивает мониторинг индекса цитирования[41].

Репозитории могут быть институциональными, дисциплинарными (или тематическими), а также национальными. Тематические репозитории предоставляют доступ к литературе в одной или нескольких областях, а институциональные хранят работы, выпущенные в рамках одного учреждения — как правило, это технические отчёты, диссертации, базы данных, статьи, печатные издания. Примером институциональных репозиториев является DSpace Массачусетского технологического института[42]. Отдельные репозитории были созданы в результате сотрудничества с крупнейшими научными изданиями — например, Springer Nature поддерживает работу сервиса In Review, а Elsevier — ChemRN. Также под эгидой некоммерческого Центра открытой науки действуют ряд национальных репзиториев, включая Arabirxiv (препринты из арабских стран), Frenxiv (французский сервер), INArxiv (индонезийский), Indiarxiv (индийский). Также препринты стран Латинской Америки публикуются в репозитории SciELO[en][43][44].

Для создания и внедрения институциональных репозиториев организации используют пакеты программного обеспечения с открытым исходным кодом. В их число входят Eprints и DSpace. Выпущенное в 2002 году приложение DSpace представляет собой универсальное приложение-репозиторий с открытым исходным кодом, разработанное совместно HP Labs[en] и Massachusetts Institute of Technology Libraries[en] и предназначенное для многопрофильных исследовательских организаций. DSpace использует соответствующий стандарт метаданных «Дублинское ядро» для описания цифровых объектов, а также поддерживает Open Archives Initiative Protocol for Metadata Harvesting[en][44]. Среди других крупных тематических репозиториев выделяют основанный в 1996 году PubMed, где публикуются работы по медицине и биологии, PhilSci-Archive с работами по философии, а также Social Science Research Network (SSRN), в котором с 1994 года выкладывают работы по социальным и гуманитарным наукам[40]. Одним из крупнейших архивов открытого доступа является Archive of European Integration[en], созданный в 2003 году. На сайте осуществляется публикация документов Европейского союза, которые предназначены для публичного распространения. На январь 2016 года в архиве содержалось более 41 800 документов ЕС и около 7 300 частных работ[45]. В ряде стран были осуществлены национальные инициативы по обеспечению инфраструктурной поддержки репозиториев — например, проект SHERPA[en] в Великобритании, DARE в Нидерландах и проекты правительства Австралии на сумму $12 млн по продвижению репозиториев. Отдельные организации также могут приобретать сервисы, которые будут предоставлять доступ к единым облачным ресурсам. Так, Amazon предлагает сразу несколько облачных серверов, включая Amazon S3 по файловому хостингу[46].

Одновременно с этим разрабатываются системы, которые осуществляют поиск в нескольких репозиториях одновременно. Примером подобной системы является OAIster[en], через который можно просмотреть информацию по более чем 200 репозиториям[47][48][42]. OpenDOAR[en] осуществляет поиск по содержанию почти 3000 перечисленных в открытом доступе репозиториев со всего мира[49].

Одним из главных стандартов, регулирующих метаданные, является Дублинское ядро (Dublin Core, DCMES), основной набор который состоит из 15 характеристик[50]:

  • Title — название;
  • Creator — создатель;
  • Subject — тема;
  • Description — описание;
  • Publisher — издатель;
  • Contributor — внёсший вклад;
  • Date — дата;
  • Type — тип;
  • Format — формат документа;
  • Identifier — идентификатор;
  • Source — источник;
  • Language — язык;
  • Relation — отношения;
  • Coverage — покрытие;
  • Rights — авторские права.

Дублинское ядро является общим стандартом общим стандартом каталогизации объекта. Однако из-за общего характера DCMES может быть трудно описать сложные объекты коллекции. По этой причине в большинстве случаев Дублинское ядро комбинируют с другими стандартами[51].

Целостность и устойчивость[править | править код]

Целостность и устойчивость являются важнейшими характеристиками архивированных цифровых объектов. Под целостностью понимают сохранение точности и достоверности данных в течение их жизненного цикла. Она может быть нарушена при передаче или репликации данных. Сохранение целостности – одна из важнейших задач электронного архивирования[52][53]. Устойчивость подразумевает неизменность файла в процессе электронного архивирования и его сохранение в том виде, в каком он был создан[54].

Метаданные[править | править код]

Международный стандарт PREMIS определяет метаданные как «информацию, которую репозиторий использует для поддержки процесса цифрового сохранения». Метаданные — информация о данных, включающая например, описание формата файла, программного обеспечения, а также историю изменений. В идеале метаданные должны собираться и обновляться на протяжении всего жизненного цикла цифрового объекта[55]. Основная роль метаданных заключается в идентификации, описании и обеспечении интеллектуального доступа к содержимому цифровой коллекции. Различные типы метаданных необходимы для описания ресурсов, обнаружения, извлечения, использования, представления и сохранения цифровых объектов. Наиболее важны метаданные для систематизации коллекций с визуальными, звуковыми и анимационными материалами, которые трудно опознать без текстового описания. Выделяют несколько видов метаданных[24]:

  • административные — предоставляют информацию, связанную с управлением и организацией информационных ресурсов;
  • описательные — предоставляют информацию о контенте информационных ресурсов;
  • данные об архивировании — содержат информацию о сохранении информационных ресурсов;
  • технические — иллюстрируют информацию, относящуюся к системным функциям и поведению метаданных.

Одним из главных стандартов, регулирующих метаданные, является Дублинское ядро (Dublin Core, DCMES), основной набор который состоит из 15 характеристик[50]:

  • Title — название;
  • Creator — создатель;
  • Subject — тема;
  • Description — описание;
  • Publisher — издатель;
  • Contributor — внёсший вклад;
  • Date — дата;
  • Type — тип;
  • Format — формат документа;
  • Identifier — идентификатор;
  • Source — источник;
  • Language — язык;
  • Relation — отношения;
  • Coverage — покрытие;
  • Rights — авторские права.

Дублинское ядро является общим стандартом общим стандартом каталогизации объекта. Однако из-за общего характера DCMES может быть трудно описать сложные объекты коллекции. По этой причине в большинстве случаев Дублинское ядро комбинируют с другими стандартами[51].

Другим основополагающим стандартом является VRA Core. В отличие от DCMES, VRA Core позволяет классифицировать произведения искусства (или оригинальные объекты) и их суррогаты (цифровые изображения) в разные категории. Это решение позволяет создавать более точное описание объектов и, например, обозначить дату создания обоих работ — оригинального произведения и его фотографии[51].

Preservation Metadata: Implementation Strategies[en] или PREMIS был разработан рабочей группой OCLC и RLG в 2005 году. Стандарт определяет единицы метаданных, необходимых для сохранения файлов в репозиториях. На 2021 год обслуживанием и спонсированием PREMIS занимается Библиотека Конгресса. Стандарт состоит из двух основных частей — модели данных и словаря. PREMIS определяет несколько типов метаданных, включая описательные, структурные, технические и административные. Словарь уделяет большое внимание документированию цифрового происхождения (истории объекта) и взаимосвязей, особенно между различными цифровыми объектами в репозиториях[24]. Согласно стандарту PREMIS, репозитории должны автоматически регулировать метаданные для каждого отдельного электронного объект и сохранять историю изменений в файле[56][57].

Стандарты и основополагающие проекты[править | править код]

Основные принципы электронного архивирования данных были сформулированы в ряде стандартов и инициатив конца 1990-х — начала 2000-х годов.

Commission on Preservation and Access и Research Libraries Group[править | править код]

В 1994 году некоммерческая организация Commission on Preservation and Access (CPA) совместно с библиотечным консорциумом Research Libraries Group[en] инициировала специальную комиссию, деятельность которой была направлена на выявление практик по долгосрочному архивированию электронных документов и выработке соответствующих рекомендаций. Другой целью рабочей комиссии стала разработка альтернативных практик архивирования — вместо принятого на тот момент переноса данных в новые версии тех же носителей, сотрудники комиссии предложили использовать способ миграции и перемещать электронные объекты на новые жёсткие диски и программное обеспечение. В мае 1996 года группа из 21 члена под председательством Дональда Уотерса и Джона Гарретта выпустила финальный отчёт под названием Preserving Digital Information (дословно — «Сохраняя электронную информацию»). Отчёт содержал две главные рекомендации — вовлечение и обозначение создателей материалов в практики электронного архивирования и обозначение необходимости в создании сети надёжных и сертифицированных электронных архивов[58]. Данный документ стал основополагающим для последующих практических рекомендаций по теме[59][34]. В 1997 году по результатам кооперации CPA и RLG был создан Council on Library and Information Resources[en][60].

Для внедрения основных принципов отчёта в жизнь RLG реализовала несколько практических инициатив. Одной из них стал Studies in Scarlet — проект, осуществлённый совместно с библиотекой Юридического факультета Гарварда по сохранению дел из Америки, Великобритании и Ирландии с 1815 по 1914 год по домашнему насилию, двоежёнству, нарушению обещания вступить в брак, опеке и попечительству, изнасилованиям и убийствам[61]. Другим крупным проектом стал the Global Immigration Project, в рамках которого были оцифрованы дела по вопросам иммиграции. Оба проекта были посвящены оцифровке и сохранению данных, однако логика сохранения в обоих случаях отличалась. Так, архивация документов для проекта Studies in Scarlet происходила из потребности осуществить на практике основные принципы RLG по инфраструктуре репозиториев, а в случае the Global Immigration Project — из необходимости оцифровать и предоставить доступ к коллекциям по теме иммиграции, качество которых стремительно ухудшалось. Отличались и организационные модели проектов. Studies in Scarlet имел централизованную модель — все материалы были представлены вместе, а архив проекта по иммиграции состоял из ряда разобщённых коллекций, хранящихся в 11 участвующих учреждениях США, Великобритании и Канады. Одновременно с этим RLG запустила проект Arches, сосредоточенный на создании онлайн-хранилища цифровых ресурсов и программной среды для международного доступа к архивным материалам[62]. Arches представляет собой открытую программную платформу, разработанную совместно с Getty Conservation Institute[en] и World Monuments Fund для использования учреждениями, занимающимися сохранением культурного наследия по всему миру. Arches предоставляет информацию по археологическим памятникам, зданиям и сооружениям, культурным ландшафтам, городским ансамблям[63][64].

Международный стандарт OAIS[править | править код]

Современные подходы и решения в области электронного архивирования основаны на понятиях и функциональных модулях, сформулированных в международном стандарте OAIS[65]. В 1990 году по запросу Международной организации по стандартизации (ISO), Международный Консультативный Комитет по космическим системам передачи данных начал разработку официальных стандартов для долгосрочного электронного архивирования информации, созданной во время космических миссий. В 1995 году была проведена серия международных семинаров, по результатам которой был выпущен стандарт Open Archival Information System[en] (OAIS) Reference Model. Первый вариант был опубликован в 1997 году, а финальный — в 2002 году (с обновлением в 2012-м). OAIS стала первой системой, описавшей понятие архивного пакета и цифровых объектов. Впоследствии стандарт стал прототипом для будущих проектов по созданию электронных репозиториев, доступу к существующим базам данных и метаданным[58]. В 2003 году OAIS утвердили в качестве международного стандарта ISO 14721:2003 «Системы передачи данных и информации о космическом пространстве. Открытая архивная информационная система. Эталонная модель» (SPace data and information transfer systems — Open archival information system — Reference model (OAIS))[66]. В стандарте был впервые представлен нейтральный словарь для описания ролей и обязанностей акторов по содержанию репозиториев и регулированию доступа пользователей[34]. Таким образом, стандарт OAIS определил и информировал разработку программы устойчивого цифрового сохранения через предоставление общего вокабуляра, информационной модели и высокоуровневой архитектуры цифрового сохранения[67]. В основе OAIS лежит три основных концепции — «окружающая среда OAIS», «информация OAIS», «внешние взаимодействия OAIS». Первая категория состоит из «Производителей», «Потребителей» и «Менеджеров» в среде, окружающей архив OAIS. Производителями могут выступать как отдельные люди, предоставляющие данные для загрузки в систему, так и системы. Менеджерами являются те акторы, которые не участвуют в повседневной работе архива, но оказывают влияние на общую политику OAIS. Другие архивы OAIS, или не совместимые с OAIS системы, могут взаимодействовать с архивом OAIS как «производители» или «потребители»[68].

Согласно OAIS, информационный пакет архивированного объекта должен включать следующую информацию[69][66]:

  • о содержимом: объект данных и информация о его представлении;
  • о сохранении: происхождение материала, уникальные идентификаторы, другие аутентификационные данные;
  • об упаковке: компоненты информационного пакета;
  • описательная информация: метаданные об объекте, которые позволяют определить местонахождение материалов через поисковую систему.

Также в эталонной модели OAIS описаны три типа информационных пакетов[69][66]:

  • Сдаточный информационный пакет (Submission Information Package, SIP-пакет) — формат, при котором источник комплектования отправляет документы и метаданные в архив. Затем эти данные используются для формирования одного или нескольких архивных информационных пакетов.
  • Архивный информационный пакет (Archival Information Package, AIP-пакет) — формат, который используется для долговременного хранения информации в архивной системе. В состав пакета входит информация, необходимая для организации долговременного хранения документов.
  • Дистрибутивный информационный пакет (Dissemination Information Package, DIP-пакет) — в этом формате данные предоставляются пользователю в ответ на его запрос. DIP-пакет формируется на основе одного или нескольких АIP-пакетов.

Trusted Digital Repository[править | править код]

В 2000 году RLG и Online Computer Library Center (OCLC) начали сотрудничество по созданию Trusted Digital Repository (TDR или Надёжных электронных репозиториев) на основе международного стандарта OAIS. Отчёт по проекту был выпущен в августе 2001 года. Согласно документу, рабочая группа RLG и OCLC предлагает создание национальных и международных систем электронных репозиториев, которые будут отвечать за предоставление доступа к общественному, социальному, экономическому, культурному и интеллектуальному наследию. Согласно рекомендациям отчёта, деятельность RLG, OCLC и других организаций должна быть направлена на разработку сертификации электронных репозиториев, изучение и создание инструментов для выявления важных атрибутов цифровых материалов на сохранение; исследование и разработку моделей для совместных сетей и служб репозиториев[58][70]. Вместе с этим определением были даны основные характеристики TDR — административная ответственность, организационная жизнеспособность, финансовая стабильность, технологическая и процедурная совместимость, а также безопасность системы[58].

Надёжный цифровой репозиторий — это тот, чья миссия — обеспечить надежный долгосрочный доступ к управляемым цифровым ресурсы для указанного сообщества сейчас и в будущем[34].

В 2003 году Research Library Group создала совместную рабочую группу с Национальным управлением архивов и документации США по разработке отдельных критериев по сертификации электронных репозиториев. В 2005 году RLG и Center for Research Libraries начали тестировать основные положения на практике, а спустя два года по результатам исследований выпустили документ Trustworthy Repositories Audit & Certification[en], лёгший в основу ISO Standard 16363 и определивший основные принципы по созданию и управлению хранилищами цифровых документов[71].

Digital Preservation Network (DPN)[править | править код]

В 2012 году в США было создано сообщество Digital Preservation Network (DPN), куда вошло около 60 организаций, объединившихся для совместного использования технологий, экспертизы и финансовых ресурсов по созданию прозрачного и долгосрочного сервиса электронного архивирования. Членство в некоммерческой организации DPN было доступно только американским организациям, заинтересованным в долгосрочном хранении электронной информации[71]. Когда они вступали в DPN, их включали в общую сеть хранения, действующую через пять основных репозиториев: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust, Stanford Digital Repository (SDR) и University of Texas Digital Repository (UTDR). Каждый репозиторий считался «узлом» сети организаций DPN, располагался в разных частях США и имел собственную архитектуру, аппаратную платформу и организационную/финансовую структуру. Деятельность DPN была направлена на создание устойчивой системы хранения материалов[72]. В 2018 году DPN была расформирована[73].

InterPARES[править | править код]

InterPARES Project[en] — серия международных коллабораций, осуществляемых начиная с 1994 года под названием UBC Project. Проект был инициирован Университетом Британской Колумбии совместно с Министерством обороны США и Национальным управлением архивов и документации США в 1994-1997 годах. Главной его целью являлась разработка методологии электронного архивирования, которая позволит сохранять материалы в аутентичном виде в течение долгого времени[74]. В 1999 году на основе UBC Project был создан InterPARES, который возглавили исследователи Луциана Дуранти[en] и Терри Иствуд[en]. Первая стадия проекта (1999—2001 год) была посвящена долгосрочному сохранению записей, созданных и поддерживаемых в базах данных и системах управления документами. На второй стадии проекта (2002—2007 год) исследователи анализировали записи, созданные в ходе научной, художественной и правительственной деятельности. На третьем этапе проекта (2007—2012 год) полученные практические знания тестировали в малых и средних архивных учреждениях. Последний этап (2013—2018 год) посвящался электронным записям, загруженным в интернет самими пользователями[75][76]. По итогам проекта был создан DOD стандарт 5015.2 для системы сохранения записей[71][74].

PRONOM[править | править код]

В 2002 году Департамент цифрового сохранения (Digital Preservation Department) Национального архива Великобритании[en] создал PRONOM[en] — технический реестр, содержащий информацию о форматах файлов, программном обеспечении и технических компонентах репозиториев. Реестр постоянно обновляется, заявки могут подать в том числе и исследователи, работающие с редкими и проприетарными форматами файлов. Изначально PRONOM считался внутренним ресурсом Национального архива Великобритании, однако впоследствии его переиначили в открытый международный портал[56][77].

Preserving Access to Digital Information (PADI)[править | править код]

С 1996-го по 2010 год Национальная библиотека Австралии реализовывала проект Preserving Access to Digital Information (PADI), целью которого стало продвижение стратегий и руководств по архивированию и получению доступа к электронным объектам всех институтов культурного наследия в Австралии. По итогам проекта был создан общий тематический портал, через который институты могли свободно обмениваться информацией, а также получать доступ к необходимым электронным ресурсам[56].

National Digital Information Infrastructure and Preservation Program (NDIIPP)[править | править код]

В декабре 2000 года Конгресс США выделил $100 млн на создание National Digital Information Infrastructure and Preservation Program[en] (NDIIPP), осуществление которой было передано Библиотеке Конгресса. Деньги выделялись на национальные усилия по планированию долгосрочного архивирования электронной документации и сотрудничество с представителями других федеральных, исследовательских, библиотечных и деловых организаций[78].

Московская декларация о сохранении цифровой информации[править | править код]

В октябре 2011 года в рамках международной конференции «Сохранение электронной информации в информационном обществе: проблемы и перспективы» в Москве была принята декларация о сохранении цифровой информации, впоследствии ставшая одним из основополагающих документов в сфере электронного архивирования[79]. Декларация обозначила приоритетные области по сохранению цифровой информации и выпустила ряд предложений для ЮНЕСКО, национальных государств и правительственных структур по внедрению практик по оцифровке документов[80].

Методы[править | править код]

Технические стратегии[править | править код]

Консервация[править | править код]

Метод консервации цифровых данных заключается в работе с материалами в оригинальных форматах и на оригинальных носителях, благодаря использованию исходной технологии или ранее применявшихся аппаратно-программных средств. В таком случае создаются так называемые «компьютерные музеи», где поддерживается визуализация и содержание материалов в первозданном формате и с оригинальным функционалом. Консервацию относят к временной стратегии электронного архивирования, несмотря на то, что для некоторых цифровых данных способ – лучшее решение из-за его способности сохранять изначальные инструменты доступа, такие как программное обеспечение[65][81][82]. В долгосрочной перспективе стратегия является проблематичной из-за потенциальных проблем с техническим обслуживанием и затратами на поддержание доступности определённых типов файлов. Консервация также ограничивает переносимость ресурса, которая в этом случае напрямую зависит от оборудования, хранящегося в определённых местах[81].

Эмуляция[править | править код]

Схема архитектуры Java Virtual Machine, 2011 год

Под эмуляцией понимают воспроизведение функциональности системы для обеспечения работы с устаревшими форматами данных. Эмуляция подразумевает создание на компьютере виртуальной машины, позволяющей воспроизводить функциональность исходной аппаратно-программной среды[65]. По некоторым свойствам эмуляция схожа со стратегией консервации, поскольку предполагает сохранение исходной прикладной программы. Цель эмуляции — сохранить внешний вид цифрового объекта, а также его функциональность через копирование технического содержания ресурса и использование исходного объекта или обновлённой копии исходного объекта в будущем[81]. Программное обеспечение для эмуляции разрабатывалось энтузиастами для компьютерных игр с начала 1990-х годов, но с начала 2000-х годов оно также вызывало интерес в сообществе специалистов по сохранению цифровых данных. Несмотря на то, что изначально эмуляция рассматривалась как технологически сложная система, к тому же трудная для воспроизводства, постепенно метод стал одним из основных в сфере электронного архивирования — новые разработки, включая внедрения эмулятора прямо в плагин браузера, значительно упростили использование. Эмулятор запрограммирован на имитацию поведения старых аппаратных платформ и программного обеспечения операционной системы, например, игр и файлов. Однако эта стратегия не предполагает сохранение устаревшего оборудования и оригинального программного обеспечения. Примером может служить Java Virtual Machine[81][83]. Эмуляцию применяют как в отношении приложений и операционных систем, так и к аппаратным платформам[84].

Использование эмуляции для доступа к форматам файлов и устаревшему программному обеспечению даёт ряд преимуществ. К ним относят возможность получить доступ к сложным цифровым объектам, в том числе к играм, виртуальной реальности и приложениям. Позволяя пользователям взаимодействовать с цифровыми объектами в их исходной среде, эмуляция предоставляет исследователям ценный контекст об окружающей среде, в которой в то время работал создатель. При масштабном использовании он может обеспечить доступ к большим частям коллекции[83]. Однако использование эмуляции осложнено потенциальными юридическими проблемами — условия лицензирования устаревшего программного обеспечения и операционных систем не всегда разрешают эмуляцию, поскольку этот метод подразумевает копирование. Выбор эмуляции как стратегии электронного архивирования также может привести к зависимости от морального устаревания эмуляторов и со временем предполагает ограничения из-за потери мощности оборудования[82].

Инкапсуляция[править | править код]

Метод инкапсуляции подразумевает включение технического описания документа в состав самого цифрового объекта, таким образом уменьшая его зависимость от внешней среды, так как данная информация позволяет либо воспроизвести исходную среду, либо перенести документ в новую[65][85]. В большинстве используемых методов хранения информации различные компоненты электронных данных хранятся в разных местах (например, в базе данных или файловой системе) в составе разных цифровых объектов. Взаимоотношения между разными компонентами осуществляются через ссылки, указатели и имена файлов. Однако быстрое развитие информационных технологий требует, чтобы отношения между цифровыми объектами были более стабильными — хранение компонентов электронной записи по отдельности всегда сопряжено с риском, и как только взаимоотношения нарушены и не подлежат восстановлению, запись считается утерянной. Архивист может избежать этого риска, включив метаданные в компьютерные файлы, содержащие документы. При объединении двух компонентов в одном физическом объекте, связь между записью и метаданными не может быть потеряна[86]. Инкапсуляция может применяться по отношению к цифровым ресурсам, формат которых точно установлен и широко применяется[81]. Также данная стратегия позволяет преодолевать проблему технологического устаревания форматов файлов, поскольку метаданные включают способ создания исходного приложения для осуществления доступа к нему на более совершенных компьютерных платформах[87][81].

Международный стандарт OAIS также описывает типы вспомогательной информации, которая должна быть включена в инкапсулированный файл — о происхождении (для описания источника объекта), контексте (для описания того, как объект соотносится с другой информацией за пределами «контейнера»), ссылку на один или несколько идентификаторов (для уникальной идентификации объекта)[81].

Миграция[править | править код]

Метод миграции заключается в переносе электронных документов на другие носители или же в другую операционную систему — например, с магнитной ленты на компакт-диск. Эта стратегия является одной из самых популярных практик в сфере электронного архивирования, поскольку позволяет сохранить целостность цифрового материала и способность пользователей находить и использовать информацию и не зависить от устаревания технологий[81][88][82].

Международный стандарт OAIS выделяет четыре основных вида миграции: обновление, тиражирование, переупаковку и преобразование. Обновление гарантирует, что надёжная копия битового потока сохраняется, в то время как репликация и переупаковка гарантируют доступность управляемого пакета объекта[81]. Данная стратегия направлена на сохранение содержания переносимого объекта, в то время как отдельные технологические свойства могут быть утеряны[81][89][90].

Цифровая археология[править | править код]

Цифровая археология — дорогостоящий метод архивирования материалов, который состоит в спасении тех цифровых объектов, которые стали недоступными из-за технологического устаревания и/или физической деградации. Ввиду высокой стоимости и отсутствию гарантий на восстановление всей полноты данных использование подобной стратегии считается вынужденной мерой[82][65].

Обновление[править | править код]

Стратегия обновления подразумевает перенос информации с одного долговременного носителя на другой — например, с распадающейся 4-х мм DAT-ленты на новую 4-мм DAT-ленту, или со старого CD-RW на новый CD-RW. Обновление является необходимым компонентом любой успешной программы электронного архивирование, но само по себе не является отдельной стратегией. Метод решает проблему износа и устаревания носителя, но не считается устойчивым долговременным способом архивирования[82][91][27].

Архивирование веб-сайтов[править | править код]

Веб-архивирование — процесс сбора, сохранения и извлечения сайтов и материалов из интернета с целью их размещения в электронном архиве для предоставления доступа следующим поколениям. Эта стратегия направлена на преодоление проблемы потери информации в интернете из-за динамики развития сети и изменений в условиях лицензирования. Одной из самых крупных и знаменитых инициатив по веб-архивированию стала созданная в 1996 году некоммерческая организация «Архив Интернета». Коллекция Архива состоит из множества подколлекций архивированных веб-сайтов, оцифрованных книг, аудио и видео файлов, игр, программного обеспечения. В 2001 году Архивом был запущен сервис Wayback Machine, занимающийся сохранением бо́льшей части «открытого» интернета. Пользователи Wayback Machine могут отследить происходящие на выбранных сайтах изменения и сравнивать разные версии правок. На август 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц[92][93][82][94].

Организации могут использовать программы по выборочному веб-архивированию. К крупнейшим из подобных сервисов относят систему PANDAS (PANDORA Digital Archiving System), впервые внедрённую Австралийской национальной библиотекой. PANDAS — это веб-приложение, написанное на Java и Perl, предоставляющее интерфейс для управления процессом веб-архивирования. Аналогичную роль выполняет The Web Creator Tool — инструмент рабочего процесса с открытым исходным кодом для управления процессом выборочного веб-архивирования, разработанный совместно Национальной библиотекой Новой Зеландии и Британской библиотекой с Oakleigh Consulting[95].

Достоинства и недостатки методов электронного архивирования[править | править код]

Достоинства и недостатки методов электронного архивирования
Стратегия Достоинства Недостатки Применение
Консервация Сохраняет внешний вид. Позволяет работать с оригинальными форматами и программными обеспечениями. Высокая стоимость поддержания работы файла. Сохранность зависит от оборудования. Файлы с устаревшими форматами, программное обеспечение, ресурсы, внешний вид которых имеет значение.
Эмуляция Сохраняет внешний вид. Сложность создания эмулятора. Большой объем информации, которую необходимо сохранить. Для доступа к информации требуется архаичное программное обеспечение. Программное обеспечение; сложные цифровые ресурсы (например, содержащие исполняемые файлы); ресурсы, ценность которых неизвестна и использование которых в будущем маловероятно; ресурсы, внешний вид которых имеет значение.
Инкапсуляция Сохраняет информацию о файле и способах его воспроизведения. Сохраняются знания о файле и системе его воспроизведения. Малодоступные ресурсы и ресурсы с известными форматами.
Миграция Не требует сохранения оригинальных приложений. Поддерживает активный доступ и управление. Высокая стоимость для длительной сохранности. Отсутствие возможности сохранения метаданных. Необходимость постоянного обновления и работы со стороны архивистов. Ресурсы, к которым активно осуществляется доступ и которыми управляют, например, научные данные или базы данных. Ресурсы с широко применяемыми форматами.
Цифровая археология Позволяет реконструировать электронные объекты, доступ к которым был потерян. Высокая стоимость и отсутствие гарантий на восстановление файлов. Файлы, доступ к которым был потерян.
Обновление Решает проблему износа и устаревания носителя. Метод эффективен только в качестве кратковременного решения. Ресурсы, носители которых находятся под риском устаревания.
Веб-архивирование Решает проблему потери информации в интернете из-за динамики развития сети и изменений в условиях лицензирования. Потенциальные юридические сложности, связанные с законом об авторском праве. Все файлы и сайты, находящиеся в интернете и признанные сохраняющим актором как достойные архивирования.

Структурные стратегии[править | править код]

Для эффективного внедрения практик электронного архивирования организациям рекомендуют внедрять и структурные изменения. Так, чтобы сократить негативный эффект технологического устаревания на цифровые носители, необходимо принимать и соблюдать международные стандарты, регулирующие вопросы, связанные с принятием программного обеспечения и снижения зависимости от обновлений разработчиков ПО. Открытые стандарты для цифрового хранения и архивирования устанавливаются официальными органами по стандартизации и международными консорциумами, включая National Digital Stewardship Alliance (NDSA), Консорциумом Всемирной паутины (W3C), Международной организацией по стандартизации и International Internet Preservation Consortium[en] (IIPC). NDSA был основан в 2010 году и представляет собой консорциум организаций, нацеленных на долгосрочное хранение цифровой информации. Консорциум Всемирной паутины действует с 1994 года и является международным сообществом, организации-члены которого работают над разработкой веб-стандартов. В основанной в 2003 году в Национальной библиотеке Франции IIPC принимают участие несколько организаций, включая Национальную библиотеку Чили и Библиотеку Конгресса, разрабатывающие стандарты и инструменты для веб-архивирования[82].

Сохранение цифровых материалов требует значительных инвестиций в технологическую инфраструктуру, которая позволит поддерживать деятельность по архивированию цифровых данных. Для обеспечения долгосрочного сохранения информации необходимо правильно подбирать используемые носители данных, которые позволят обеспечивать доступ к информации на длительный срок. Так, например, начиная с 2000-х годов использование магнитных и оптических носителей не считается оправданным. Критерии отбора носителей должны включать анализ по таким вопросам как скорость морального устаревания, стандартизацию, стоимость. С 2010-х годов популярностью пользуются устойчивые локальные или облачные системы хранения[82].

Для успешного и долгосрочного внедрения практик электронного архивирования необходимо улучшение сотрудничества между организациями, командами профессионалов и создателями цифровых объектов. Для этого существуют международные консорциумы, тематические сети организаций и открытые программные обеспечения — например, Open Journal Systems и DSpace[82].

Архивирование электронных писем[править | править код]

С точки зрения сохранения цифровых материалов каждое электронное письмо, состоящее из заголовка, тела сообщения и вложений, представляет собой сложный коммуникационный пакет, содержащий уникальный исходный материал, зачастую имеющий потенциальную историческую, юридическую и административную ценность[96]. Обмен электронными письмами составляет существенную часть интернет-трафика, однако относительно редко становится частью программ по электронному архивированию. Например, Библиотека Конгресса США собирает архив публичных твитов по всему миру, UK Web Archive, Архив Интернета и Internet Memory Foundation[en] занимались сохранением веб-страниц и сбором информации с сайтов; однако ни один из проектов не занимается сбором передаваемой через электронную почту информации[97]. Главными причинами этого являются потенциальная конфиденциальность писем, различие в форматах почтовых клиентов и отсутствие стандартизированного формата для хранения сообщений[97][98][96].

Существует ряд проектов по архивации электронных писем:

  • Carcanet Press Email Preservation Project

Начиная с 2012 года в архиве Carcanet Press[en], принадлежащему Библиотеке Манчестерского университета, начали сохранять электронную переписку со знаменитыми поэтами, критиками, редакторами, переводчиками и художниками. В проекте Carcanet Press Email Preservation Project использовались как традиционные методы архивирования, так и новые стандарты сохранения цифрового материала:

  • программный код для извлечения метаданных и автоматической проверки экспериментов по миграции;
  • полный профиль метаданных и модель данных для архивных информационных пакетов;
  • новая кураторская документация;
  • специализированное оборудование для хранения цифровых данных и безопасная сеть накопитель для первичной обработки цифровых архивов[99].
  • CERP (Collaborative Electronic Records Project)
  • DAVID (Digital Archiving in Flemish Institutions and Administrations)

С 1999 по 2003 год в результате сотрудничества между Городским архивом Антверпена и Междисциплинарным центром права и информатики Лёвенского католического университета действовал проект DAVID. Целью этого проекта являлось создание руководства по электронному архивированию. Сотрудники изучили судебные и архивные требования по архивации электронной почты и указали на некоторые возможные стратегии архивирования. Помимо своей теоретической ценности, отчёт был важен тем, что после него началось внедрение практик по управлению записями и ведению учёта электронных писем и связанных с ними электронных документов[99].

  • Collaborative Electronic Records Project

Архивы Смитсоновского института были среди первых организаций, начавших разрабатывать практики по сохранению электронных писем. В своих коллекциях Архив хранит записи электронной почты, относящиеся к 1980-м годам и созданные с помощью ELM. С тех пор Смитсоновский институт использовал различные приложения и форматы электронной почты, включая PINE, cc:Mail[en], Lotus Notes, GroupWise и другие приложения. Сотрудникам Смитсоновского института было приказано распечатать электронную почту для ведения документации, как это было принято в то время в других организациях и предприятиях. Поскольку в то время практически не было организаций, которые работали бы в сфере сохранения данных электронной почты, в 2005 году был создан специализированный проект совместно с Rockefeller Archive Center[en] — Collaborative Electronic Records Project (CERP). Проект продлился три года, по его результатам были созданы стандарты и разработаны практики по архивированию электронных сообщений[100][99].

  • EAS

С начала 2008 года при Гарвардском университете действовала рабочая группа, занимающаяся определением стратегий по сохранению электронных сообщений. В 2015 году на её основе был запущен EAS — партнёрский проект между Библиотечным офисом Гарвардского университета по информационным системам (OIS) и рядом кураторских организаций из библиотечных подразделений Гарварда[101]. EAS сотрудничает с системой Wordshack по автоматизации процесса сохранения данных. Так, сообщения электронной почты и вложения, выбранные для долгосрочного хранения, автоматически отправляются в DRS — службу электронного репозитория Гарвардского университета[101].

  • Xml Electronic Normalising for Archives (XENA)

XENA — бесплатное программное обеспечение с открытым исходным кодом, разработанное Национальным архивом Австралии для долгосрочного хранения электронных документов. Основная функция XENA — определение формата файла цифровых записей и преобразование его в соответствующий формат для сохранения, основанного на открытых стандартах. Программное обеспечение Xena способствует сохранению цифровых данных, выполняя две важные задачи: определение форматов файлов цифровых объектов и преобразование их в открытые форматы для сохранения[102].

Архивирование игр[править | править код]

Сохранение видеоигр осуществляется через архивирование разработок исходного кода, цифровых копий видеоигр, эмуляцию игровой приставки, обслуживание и сохранение специализированного оборудования для видеоигр, а также оцифровку печатных журналов и книг по видеоиграм, изданным до цифровой революции. Сохранение видеоигр позволяет не только исследовать историю индустрии, но и анализировать технические и творческие аспекты производства той или иной игры[103].

Используемые для создания игр технологии значительно изменились с начала 1990-х годов, и во многих случаях оригинальные игры того времени не могут быть воспроизведены из-за проблемы устаревания форматов[104]. При этом игры, как правило, выпускались под конкретную консоль, что значительно осложняло их последующую сохранность[105]. Поэтому в этот период стали появляться инициативы по сохранению наследия видеоигр. Были созданы игровые музеи, такие как The Strong[en] в Нью-Йорке[106], Museum of Art and Digital Entertainment[en] в Окленде[107], Берлинский музей компьютерных игр[108], Музей советских игровых автоматов в Москве и Санкт-Петербурге[109]. Также был основан Фонд истории видеоигр в США, занимающийся сохранением не только игр, но и журналов, руководств и рекламных материалов по теме. Среди других крупных инициатив – сервис цифрового распространения GOG.com и коллекция браузерных эмуляторов аркад в Архиве Интернета[105]. Начиная с 2015 года Организация Объединённых Наций поддерживает проект Open Digital Library on Traditional Games, направленный на электронное архивирование и защиту традиционных игр коренных народов через каталогизирование и построение общей базы данных, на основе которой впоследствии будут создавать видеоигры[110][111].

Архивирование научных работ[править | править код]

Начиная с середины 1990-х годов в научном мире стало развиваться движение за открытую науку – всё больше исследователей выступали против пейволлов и излишне высокой стоимости доступа к академической литературе на фоне сокращения финансирования библиотек. Одним из требований сторонников движения стало открытие доступа к научным публикациям, преимущественно – через публикацию в интернете[112][113]. Вскоре появились первые онлайн-репозитории и электронные библиотеки. В их число вошли такие крупные проекты, как arXiv.org, JSTOR, Public Library of Science (PLoS), BioMed Central[en][114]. По состоянию на август 2021 года Справочник журналов открытого доступа[en] насчитывает более 15 900 журналов открытого доступа и более 5 млн статей[115]. При этом логика архивирования научных публикаций в каждом из проектов может сильно отличаться. Например, цифровая база данных JSTOR была создана в 1995 году для сохранения цифровых копий печатных журналов. В базу попадают только те научные журналы, публикация в которых осуществляется через систему рецензирования. Также значение имеет количество организаций, которые выписывают данный журнал и индекс цитирования. Архивирование происходит по принципу «движимой стены» (Moving Wall) – выпуски размещаются в системе с момента создания издания и до 3–5 лет до настоящего времени. Размещаемые в JSTOR материалы не всегда находятся в открытом доступе и могут быть спрятаны за пейволлами. Доступ к таким материалам осуществляется через систему институциональных подписок[116][117][118]. Созданный Национальной библиотекой медицины США архив биомедицинской литературы PubMed Central был запущен в феврале 2000 года. Доступ к материалам, размещённым на сайте, свободный и неограниченный[119]. В свою очередь, на запущенном в 1991 году портале arXiv.org исследователи самостоятельно размещают препринты или свободно распространяемые копии своих опубликованных работ по физике, математике, астрономии, информатике и другим точным наукам. Перед публикацией статьи не рецензируются, однако проходят первичную проверку модераторов[120].

С появлением электронных библиотек возникла и проблема долгосрочного хранения цифровых коллекций научной литературы – обеспечение доступности ресурсов для будущих поколений требует специальных усилий и постоянных инвестиций[121][122]. Материалы открытого доступа, как правило, не нарушают авторские и имущественные права – для их сохранения библиотекам не требуется специальных разрешений. Для долгосрочного сохранения литературы в открытом доступе организациям рекомендуют следовать открытым международным стандартам и внедрять открытые форматы, включая odt и xml[113].

Проблемы[править | править код]

Одной из самых главных проблем электронного архивирования считается устаревание технологий — из-за быстрого изменения и развития оборудования и программных форматов возможна потеря доступа к электронным репозиториям[27]. В среднем носители информации морально устаревают раз в десятилетие, а на смену им приходят новые, более эффективные способы хранения данных и, соответственно, новые аппаратно-программные средства. В это же время выпуск средств для работы с устаревшими носителями прекращается. Помимо этого, носители информации подвержены ошибкам и сбоям, вирусным атакам, а также физической деградации[65]. Для электронной архивации организациям рекомендовано использовать незапатентованные устойчивые форматы, которые не зависят от сторонннего программного обеспечения[123][124].

Отсутствие единого законодательства, политики, стратегий и осведомлённости в сфере электронного архивирования также усложняет практики сохранения информации. Так, законодатели могут быть не осведомлены о требованиях к электронному архивированию, в результате чего законодательство может игнорировать, либо не полностью регулировать сохранение цифровых данных. Это создаёт дополнительные проблемы с точки зрения авторского права[27]. Права интеллектуальной собственности и другие юридические обязательства могут мешать копированию, хранению, изменению и использованию содержимого цифровых ресурсов для долгосрочного хранения[82]. Вопрос с авторским правом и правом интеллектуальной собственности для цифровых материалов гораздо сложнее, чем для традиционных физических материалов. В сфере традиционного архивирования вместе с материальной копией библиотека или архив автоматически приобретали право на копирование и сохранение[19]. Однако для большинства методов электронного архивирования необходимо наличие и осуществление исключительных прав на работу, включая право на воспроизведение[125]. Более того, издательства могут запрещать копирование публикаций с помощью технических средств — что разрешено и закреплено в законодательстве об авторском праве, как на территории США, так и на территории Европейского союза. Также у отдельных материалов может быть несколько правообладателей (включая других издателей, авторов, художников, производителей стороннего программного обеспечения), из-за чего издателям может быть сложно предоставить библиотекам и другим акторам права на сохранение материалов. При этом если «внешний вид» или функциональность публикации изменится в результате копирования, авторы и создатели могут почувствовать, что их права были нарушены, может быть трудно доказать, что сохраняемые копии публикаций являются просто копиями, а не полностью новыми версиями[126]. Среди возможных решений этой проблемы исследователи называют потенциальное внедрение лицензионных соглашений, в которых отдельно прописываются условия о сохранении[127].

Также к трудностям относят человеческий фактор, компьютерные вирусы, природные катастрофы, сбои в работе носителей и программном обеспечении[128][27].

Примеры инициатив[править | править код]

Оцифровка рукописи из Дуньхуана. Великобритания, 2006 год
Логотип Wayback Machine, 2010 год
  • Digital Preservation Coalition[en] (Британская коалиция по электронному сохранению) — основанная в 2001 году некоммерческая организация, деятельность которой направлена на сохранение электронных ресурсов[129].
  • DSpace — открытое, свободное кроссплатформенное J2EE приложение, а также база долгосрочного хранения цифровых материалов, используемых в академических исследованиях. Система DSpace разрабатывалась Hewlett-Packard в сотрудничестве с библиотеками Массачусетского технологического института и была запущена 4 ноября 2002 года. Программное обеспечение было открыто под лицензией BSD[130]
  • International Dunhuang Project[en] — международный коллаборативный проект по каталогизации и оцифровке рукописей, печатных текстов, картин, тканей и артефактов из пещер Могао в западно-китайском городе Дуньхуан и других археологических памятников в восточной части Шёлкового пути. Проект был инициирован Британской библиотекой в 2004 году[131][132].
  • MetaArchive Cooperative[en] — это международная сеть для хранения цифровых данных, состоящая из библиотек, архивов и других учреждений, занимающихся культурным наследием. По состоянию на август 2011 года сеть хранения MetaArchive состоит из 24 защищённых серверов в четырёх странах с общей ёмкостью более 300 ТБ[133][134].
  • National Digital Information Infrastructure and Preservation Program[en] — архивная программа США, выполняемая под руководством Библиотеки Конгресса. Программа была утверждена Конгрессом США в 2000 году, её завершение состоялось в 2018-м. В рамках проекта было реализовано несколько рабочих групп, управляла грантовыми проектами и распространяла информацию о проблемах сохранения цифровых данных[135].
  • PubMed Central — архив полнотекстовых биомедицинских публикаций со свободным доступом, созданный Национальной библиотекой медицины США. На август 2021 года в архиве хранится более 6 млн работ[136].
  • Wayback Machine — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS[137].
  • The New York Times Web Archive — проект The New York Times по сохранению онлайн-контента. На сайте размещена копия HTML-страниц страниц NYTimes.com с момента их первой публикации, с сохранением их дизайна и оригинальной презентации для потомков[138].
  • Memento Project[en] — проект, который стремится сделать веб-архивный контент более доступным. Вместо того, чтобы ожидать, что люди узнают о растущем количестве веб-архивов и будут угадывать, какой архив может содержать более старую версию ресурса, который они ищут, Memento предлагает сделать архивный контент доступным для поиска по исходному URL-адресу. Memento — попытка разрешить пользователям просматривать любую веб-страницу так, как она выглядела в заданную дату в прошлом. Проект осуществляется Old Dominion University[en] и Лос-Аламосской национальной лабораторией[139].
  • В 2010 году Библиотека Конгресса США подписала соглашение с «Твиттером» по архивированию публичных твитов, опубликованных с момента создания платформы в 2006 году, и о продолжении сохранения твитов, чтобы эти данные были доступны для анализа и исследований[140].
  • Арктический мировой архив — объект, созданный в 2017 году с целью сохранения данных, расположенный на архипелаге Шпицберген (Норвегия). Архив содержит данные из нескольких стран, представляющие исторический и культурный интерес, а также весь открытый исходный код американской транснациональной компании GitHub.

См. также[править | править код]

Ссылки[править | править код]

Примечания[править | править код]

  1. Бунькова, 2014.
  2. Дмитрий Гачко. История хранения данных: говорим о перфокартах. Vc.ru (12 января 2019). Дата обращения: 1 августа 2021. Архивировано 23 августа 2021 года.
  3. Михаил Кошкин. Аналитическая машина Чарльза Бэббиджа и первый программист леди Лавлейс. Свобода (22 апреля 2003). Дата обращения: 4 августа 2021. Архивировано 23 августа 2021 года.
  4. Леонид Черняк. Человек, придумавший дырку в куске картона. «Издательство «Открытые системы» (24 февраля 2004). Дата обращения: 4 августа 2021. Архивировано 7 мая 2021 года.
  5. Как программировали наши деды. РИА Новости (12 сентября 2016). Дата обращения: 5 августа 2021. Архивировано 23 августа 2021 года.
  6. Дмитрий Гачко. Справочная: как работают перфокарты. Vc.ru (8 декабря 2018). Дата обращения: 5 августа 2021. Архивировано 23 августа 2021 года.
  7. atomlib. 60 лет с жёсткими дисками. Хабр (3 ноября 2016). Дата обращения: 5 августа 2021. Архивировано 23 августа 2021 года.
  8. Елена Лиханова. История дискеты: от идеи до иконки. RB (21 июля 2021). Дата обращения: 5 августа 2021. Архивировано 21 июля 2021 года.
  9. Андрей Михайлов. Что такое перфокарта, зачем она была нужна и куда исчезла. Inform Buro (24 ноября 2018). Дата обращения: 5 августа 2021. Архивировано 23 августа 2021 года.
  10. В поисках вечной памяти: от клинописи на глине к наноструктурам в стекле. Коммерсантъ (20 июня 2017). Дата обращения: 4 августа 2021. Архивировано 23 августа 2021 года.
  11. Baucom, 2019, с. 5.
  12. Hoorens, 2007.
  13. Hanley, 2004.
  14. Алексей Кутовенко. Интернет-летописцы. Сервисы кэширования веб-ресурсов. Издательство «Открытые системы» (20 июня 2011). Дата обращения: 4 августа 2021. Архивировано 31 мая 2020 года.
  15. Gil Press. A Very Short History of Digitization. Forbes (27 декабря 2015). Дата обращения: 4 августа 2021. Архивировано 23 августа 2021 года.
  16. Objective. Networked European deposit library. Дата обращения: 4 августа 2021. Архивировано 23 августа 2021 года.
  17. Timeline: Digital Technology and Preservation. Wayback Machine. Дата обращения: 1 августа 2021.
  18. DigitalPreservationEurope. Digital Preservation Europe. Дата обращения: 3 августа 2021. Архивировано 13 августа 2021 года.
  19. 1 2 Moballeghi, 2009.
  20. Baucom, 2019, с. 9—15.
  21. About PERSIST. UNESCO. Дата обращения: 10 августа 2021. Архивировано 23 августа 2021 года.
  22. Хартия о сохранении цифрового наследия. ООН. Дата обращения: 3 августа 2021. Архивировано 23 августа 2021 года.
  23. Hirtle, 2008.
  24. 1 2 3 4 Xie, 2015.
  25. Moballeghi, 2009, с. 116.
  26. 1 2 Definitions of Digital Preservation. A Division of the American Library Association. Дата обращения: 31 июля 2021. Архивировано 29 июля 2021 года.
  27. 1 2 3 4 5 6 7 Hazarika, 2020, с. 220—226.
  28. 1 2 Introduction - Definitions and Concepts. Digital Preservation Coalition. Дата обращения: 31 июля 2021.
  29. 1 2 Lakshminarasimhappa, 2014.
  30. Akter, 2013.
  31. Jharotia, 2017.
  32. 1 2 Jantz, 2005.
  33. Pal, 2014, с. 28—42.
  34. 1 2 3 4 Owens, 2007.
  35. 1 2 3 Niu, 2014.
  36. 1 2 3 4 5 Eastwood, 2004.
  37. Appraise Records for Permanent Preservation. InterPARES2. Дата обращения: 15 августа 2021. Архивировано 24 сентября 2015 года.
  38. Velmurugan, 2013.
  39. Трищенко, 2017, с. 40—44.
  40. 1 2 Михеенков, 2018, с. 12.
  41. Li, 2015, с. 614—635.
  42. 1 2 Bailey, 2005, с. 1—19.
  43. Александр Кузнецов. Препринт обгоняет научную статью. Коммерсантъ (23 декабря 2019). Дата обращения: 23 февраля 2021. Архивировано 23 февраля 2021 года.
  44. 1 2 Denison, 2007.
  45. Крупнейшие архивы открытого доступа, функционирование пиратских площадок и будущее научной коммуникации.. Ноосфера (8 июля 2017). Дата обращения: 21 февраля 2021. Архивировано 18 августа 2021 года.
  46. Corrado, 2017, с. 145—154.
  47. Gaines, 2015, с. 5—11.
  48. Prosser, 2003.
  49. Corrado, 2017, с. 145—150.
  50. 1 2 Dublin Core. Президентская библиотека имени Б.Н.Ельцина. Дата обращения: 3 августа 2021. Архивировано 25 августа 2021 года.
  51. 1 2 3 Clobridge, 2010.
  52. A definition of data integrity. Digital Guardian. Дата обращения: 15 августа 2021. Архивировано 31 августа 2021 года.
  53. Introduction to Digital Preservation: Fixity. Bodleian libraries. Дата обращения: 16 августа 2021. Архивировано 25 августа 2021 года.
  54. Trevor Owens. Protect Your Data: File Fixity and Data Integrity. Library of Congress. Дата обращения: 16 августа 2021. Архивировано 18 июля 2021 года.
  55. Pringle, 2018.
  56. 1 2 3 Baucom, 2019, с. 9—10.
  57. PREMIS for Digital Preservation. Library of Congress. Дата обращения: 7 августа 2021. Архивировано 20 мая 2021 года.
  58. 1 2 3 4 Baucom, 2019, с. 6—7.
  59. IHSN, 2009.
  60. Council on Library Resources. CLIR. Дата обращения: 5 августа 2021. Архивировано 13 августа 2021 года.
  61. Studies in Scarlet Marriage and Sexuality in the U.S. & U.K., 1815-1914. Curiosity Collections. Дата обращения: 5 августа 2021. Архивировано 25 августа 2021 года.
  62. Arches—RLG's Archival Server Infrastructure. OCLC Research. Дата обращения: 5 августа 2021. Архивировано 25 августа 2021 года.
  63. Myers, 2016, с. 213—224.
  64. Soete, 1997.
  65. 1 2 3 4 5 6 Баласанян В.Э. Сохранность электронных документов: проблемы и решения. Отечественные архивы (2019). Дата обращения: 5 августа 2021. Архивировано 25 августа 2021 года.
  66. 1 2 3 Храмцовская, 2012, с. 68—78.
  67. Zierau, 2017.
  68. OAIS Reference Model. Impact Zone. Дата обращения: 1 августа 2021. Архивировано 25 августа 2021 года.
  69. 1 2 Perossini, 2020, с. 2—7.
  70. RLG Inc, 2002.
  71. 1 2 3 Baucom, 2019, с. 7—8.
  72. James Hilton, Tom Cramer, Sebastien Korner and David Minor. The Case for Building a Digital Preservation Network. Educause Review (5 августа 2013). Дата обращения: 5 августа 2021. Архивировано 25 августа 2021 года.
  73. Roger Schonfeld. Why Is the Digital Preservation Network Disbanding?. The Scholarly Kitchen (13 декабря 2018). Дата обращения: 4 августа 2021. Архивировано 25 августа 2021 года.
  74. 1 2 Duranti, 2008.
  75. Fan, 2018, с. 387—297.
  76. Project Background. InterPARES Project. Дата обращения: 7 августа 2021. Архивировано 12 мая 2021 года.
  77. ntroduction to Digital Preservation: Identification. Bodleian Libraries. Дата обращения: 7 августа 2021. Архивировано 25 августа 2021 года.
  78. Amy Friedlander. The National Digital Information Infrastructure Preservation Program. D-lib (2002). Дата обращения: 4 августа 2021. Архивировано 13 июля 2021 года.
  79. Сохранение электронного контента в России и за рубежом. Российская ассоциация электронных библиотек. Университетская книга (2012). Дата обращения: 3 августа 2021. Архивировано 25 августа 2021 года.
  80. Московская декларация о сохранении цифровой информации. United Nations, Educational, Scientific and Cultural Organization (03-10-2011). Дата обращения: 11 августа 2021. Архивировано 25 августа 2021 года.
  81. 1 2 3 4 5 6 7 8 9 10 Lee, 2002, с. 93—106.
  82. 1 2 3 4 5 6 7 8 9 10 Formenton, 2020, с. 1—26.
  83. 1 2 What is emulation?. Bodleian Libraries. Дата обращения: 2 августа 2021. Архивировано 8 августа 2021 года.
  84. Granger, 2000.
  85. Encapsulation. PADI. Дата обращения: 23 июля 2021. Архивировано 25 августа 2021 года.
  86. Boudrez, 2005, с. 1—42.
  87. Тихонов Владимир. Архивное хранение электронных документов: проблемы и решения. Журнал «Делопроизводство и документооборот на предприятии» (2006). Дата обращения: 23 июля 2021. Архивировано 25 августа 2021 года.
  88. Samiei, 2020.
  89. Алексей Марков. Концепция построения электронного архива. Открытые системы (16 января 1997). Дата обращения: 23 июля 2021. Архивировано 11 апреля 2021 года.
  90. Михаил Ларин. Обеспечение сохранности электронных документов. Управляем предприятием (14 августа 2012). Дата обращения: 6 августа 2021. Архивировано 25 августа 2021 года.
  91. Digital Preservation Strategies. Digital Preservation Management. Дата обращения: 23 июля 2021. Архивировано 25 августа 2021 года.
  92. Wayback Machine. Wayback Machine. Дата обращения: 7 августа 2021.
  93. Fernando, 2016, с. 109—112.
  94. Niu, 2012.
  95. Web-archiving. Digital Preservation Handbook. Дата обращения: 4 августа 2021. Архивировано 9 августа 2021 года.
  96. 1 2 Goethals, 2010, с. 1—6.
  97. 1 2 Prom, 2011.
  98. Preserving Email. Digital Preservation Coalition. Дата обращения: 1 августа 2021. Архивировано 21 апреля 2021 года.
  99. 1 2 3 Technical Approaches for Email Archives, 2018.
  100. Email Preservation - DArcMail. Smithsonian Institution Archives. Дата обращения: 4 августа 2021. Архивировано 27 августа 2021 года.
  101. 1 2 Harvard Library's Email Archiving System (EAS). Harvard Library. Дата обращения: 8 августа 2021. Архивировано 27 августа 2021 года.
  102. XENA. ICA. Дата обращения: 8 августа 2021. Архивировано 27 августа 2021 года.
  103. Leah Williams. The Tricky, Essential Art of Preserving Canceled Games Like Starfox 2. Kotaku (8 апреля 2021). Дата обращения: 17 августа 2021. Архивировано 13 августа 2021 года.
  104. Jonathan Ore. Preserving video game history is about more than nostalgia. CBC News (17 января 2017). Дата обращения: 17 августа 2021. Архивировано 27 августа 2021 года.
  105. 1 2 Tom Faber. Why is it so difficult to play old games?. Financial Times (27 апреля 2021). Дата обращения: 17 августа 2021. Архивировано 17 августа 2021 года.
  106. About. The Strong. The Strong. Дата обращения: 19 августа 2021. Архивировано 11 августа 2021 года.
  107. Museum of Art and Digital Entertainment will shut down and put its wares into storage. The Made. Дата обращения: 19 августа 2021. Архивировано 26 августа 2021 года.
  108. Синэмон Ниппард. В Берлине открылся Музей компьютерных игр. DW (26 января 2011). Дата обращения: 19 августа 2021. Архивировано 27 августа 2021 года.
  109. Константин Панфилов. «Конёк-Горбунок» и «Городки»: как игровые автоматы из СССР переносят на мобильные устройства. Vc.ru (10 декабря 2017). Дата обращения: 19 августа 2021. Архивировано 27 августа 2021 года.
  110. Matt Hongoltz-Hetling. Inside the ambitious video game project trying to preserve Indigenous sports. Popular Science (22 июля 2021). Дата обращения: 17 августа 2021. Архивировано 27 августа 2021 года.
  111. Consultative Meeting of the UNESCO Global Project Creation of an Open Digital Library on Traditional Games. UNESCO. Дата обращения: 18 августа 2021. Архивировано 27 августа 2021 года.
  112. Salager-Meyer, 2012, с. 55—74.
  113. 1 2 Jottkandt, 2010.
  114. Liesegang, 2013, с. 423—432.
  115. Find open access journals & articles. DOAJ. Дата обращения: 15 августа 2021. Архивировано 27 августа 2016 года.
  116. Laura McKenna. Locked in the Ivory Tower: Why JSTOR Imprisons Academic Research. The Atlantic (20 января 2012). Дата обращения: 14 августа 2021. Архивировано 27 августа 2021 года.
  117. What is JSTOR?. Connect Ebsco (1 мая 2020). Дата обращения: 19 августа 2021. Архивировано 27 августа 2021 года.
  118. About the Moving Wall. Jstor. Дата обращения: 18 августа 2021. Архивировано 27 августа 2021 года.
  119. What is the difference between PubMed and PubMed Central?. Elsevier. Дата обращения: 17 августа 2021. Архивировано 27 августа 2021 года.
  120. Boldt, 2011, с. 238—242.
  121. Rowe, 2001, с. 251-254.
  122. Flecker, 2001.
  123. Sustainability Factors. Digital Preservation. Дата обращения: 16 августа 2021. Архивировано 13 октября 2014 года.
  124. Recommended Preservation Formats for Electronic Records. Smithsonian Institution Archives. Дата обращения: 15 августа 2021. Архивировано 27 августа 2021 года.
  125. Besek, 2008, с. 103—111.
  126. Ayre, 2004.
  127. Muir, 2003.
  128. Ross, 2006.
  129. About the Digital Preservation Coalition. Digital Preservation Coalition. Дата обращения: 4 августа 2021. Архивировано 7 августа 2021 года.
  130. Smith, 2003.
  131. The International Dunhuang Project: The Silk Road Online. Harvard X. Дата обращения: 4 августа 2021. Архивировано 27 августа 2021 года.
  132. The International Dunhuang Project: Chinese Central Asia Online. The Silk Road Foundation. Дата обращения: 4 августа 2021. Архивировано 14 февраля 2021 года.
  133. Meta Archive. MetaArchive. Дата обращения: 4 августа 2021.
  134. Halbert, 2009.
  135. Digital Preservation. Library of Congress. Дата обращения: 4 августа 2021. Архивировано 4 августа 2021 года.
  136. PMC Overview. PMC. Дата обращения: 4 августа 2021. Архивировано 6 августа 2021 года.
  137. Lerner, 2017, с. 1741—1755.
  138. Shan Wang. The New York Times Archive. NiemanLab (12 апреля 2018). Дата обращения: 8 февраля 2021. Архивировано 22 января 2021 года.
  139. About the Memento Project. Memento. Дата обращения: 4 августа 2021. Архивировано 27 августа 2021 года.
  140. Lewis Dartnell. The digital black hole: will it delete your memories?. Guardian (16 февраля 2015). Дата обращения: 4 августа 2021. Архивировано 15 апреля 2021 года.

Литература[править | править код]

  • Akter T. Digital Preservation of Library Materials // International Research: Journal of Library & Information Science. — 2013. — Т. 3, вып. 1. — С. 20—30.
  • Ayre C., Muir A. The Right to Preserve. The Rights Issues of Digital Preservation // D-Lib Magazine. — 2004. — Т. 10, вып. 3.
  • Baucom E. A Brief History of Digital Preservation // University of Montana. — 2019. — С. 3—19.
  • Bailey C. Open Access Bibliography (англ.) // Association of Research Libraries. — 2005.
  • Besek J.N., Coates J., Fitzgerald B., Mossink W., LeFurgy W.G. Digital Preservation and Copyright: An International Study // The International Journal of Digital Curation. — 2008. — Т. 3, вып. 2. — С. 103—111.
  • Borghoff U., Rödig P., Scheffczyk J., Schmitz J. Long-Term Preservation of Digital Documents. Principles and Practices. — Springer. — 2003. — ISBN 3-540-33639-7.
  • Boldt A. Extending ArXiv.org to Achieve Open Peer Review and Publishing (англ.) // Journal of Scholarly Publishing. — 2011. — doi:10.3138/jsp.42.2.238.
  • Boss K., Broussard M. Challenges of archiving and preserving born-digital news applications // International Federation of Library Associations and Institutions. — 2017. — Т. 43, вып. 2. — С. 150—157.
  • Boudrez F. Digital containers for shipment into the future. — Expertisecentrum DAVID vzw. — Antwerpen, 2005. — 42 с.
  • Denison T. Library and information systems: a work in progress // Libraries in the Twenty-First Century. — 2007.
  • Halbert M. The MetaArchive Cooperative: A Collaborative Approach to Distributed Digital Preservation // Library trends. — 2009. — Т. 57, вып. 3. — doi:10.1353/lib.0.0042.
  • Gaines D., Fagan J. OAIster on EBSCO Discovery Service, FirstSearch, and OAIster.worldcat.org // Libraries. — 2015. — Вып. 54. — С. 5-12.
  • Hanley M. PADI (Preserving Access to Digital Information) and Safekeeping // HEP Libraries Webzine. — 2004.
  • Hazarika R. Digital Preservation in Academics Libraries // International Journal of Library and Information Studies. — 2020. — Т. 10, вып. 2. — С. 220—226.
  • Hangal S., Lam M., Heer J. MUSE: Reviving Memories Using Email Archives // ACM User Interface Software & Technology (UIST). — 2011.
  • Hirtle P. The History and Current State of Digital Preservation in the United States // Metadata and Digital Collections: A Festschrift in Honor of Tom Turner;. — 2008. — С. 121—140.
  • Hedstrom M. Digital Preservation: A Time Bomb for Digital Libraries // Computers and the Humanities. — 1997. — Т. 31, вып. 3. — С. 189—202.
  • Hoorens S., Rothenberg J., Orange C., Mandele M., Levitt R. Addressing the uncertain future of preserving the past. — Rand Europe. — 2007. — 141 с.
  • Fan G. Making Better out of Technologies: Responses of Interpares to Digital Records Management Challenges // FR-HT 2018 - Special Session on Managing Digital Data, Information and Records: Firm Responses to Hard Technologies. — 2018. — С. 387—397.
  • Fernando Z., Marenzi I., Nejdl W., Kalyani R. ArchiveWeb: Collaboratively Extending and Exploring Web Archive Collections // Research and Advanced Technology for Digital Libraries. — 2016. — С. 107—121.
  • Formenton D., Luciana de Souza Gracioso. Digital Preservation challenges, requirements, strategies and scientific output // Digital Journal of Library and Infromation Science. — 2020. — Т. 18. — doi:10.20396/rdbci.v018i0.8658868.
  • Clobridge A. Metadata // Building a Digital Repository Program with Limited Resources. — 2010.
  • Duranti L., Preston R. International Research on Permanent Authentic Records in Electronic Systems (InterPARES) 2: Experiential, Interactive and Dynamic Records. — Associazione Nazionale Archivistica Italiana. — Padova, Italy, 2008.
  • Terry Eastwood. Appraising Digital Records for long-term preservation // Data Science. — 2004. — Вып. 3. — С. 1-7.
  • Dale Flecker. Preserving Scholarly E-Journals // D-Lib Magazine. — 2001. — Т. 7, вып. 9. — ISSN 1082-9873.
  • Edward M. Corrado, Heather Moulaison Sandy. Digital Preservation for Libraries, Archives, and Museums. — Rowman & Littlefield. — 2017. — ISBN 978-1-4422-7871-4.
  • Granger S. Emulation as a Digital Preservation Strategy // D-lib Magazine. — 2000. — Т. 6, вып. 10. — ISSN 1082-9873.
  • Goethals A., Gogel W. Reshaping the repository: the challenge of email archving // Austrian Computer Society. — 2010.
  • Lakshminarasimhappa M., Veena M. R. Digital preservation in libraries: why and how? // International Journal of Digital Library Services. — 2014. — Т. 4, вып. 4.
  • Jantz R., Giarlo M. Digital Preservation. Architecture and Technology for Trusted Digital Repositories. — 2005. — Т. 11, вып. 6.
  • Jharotia A. Importance of digital preservation in digital era // NCITE. — 2017.
  • S. Jottkandt. Preserving Open Access Journals // Eprints Rclis. — 2010. — С. 1-24.
  • Lee K., Slattery O., Lu R., Tang X., McCrary V. The State of the Art and Practice in Digital Preservation // Journal of Research of the National Institute of Standards and Technology. — 2002. — Т. 107, вып. 1. — С. 93—106.
  • Li X. The role of arXiv, RePEc, SSRN and PMC in formal scholarly communication (англ.) // Aslib Journal of Information Management. — 2015. — Vol. 67, iss. 6. — P. 614—635. — doi:10.1108/AJIM-03-2015-0049.
  • Liesegang T. Perspectives. The continued movement for open access to peer-reviewed literature // American Journal of Ophtalmology. — 2013. — Т. 156, вып. 3. — С. 423—432. — doi:10.1016/j.ajo.2013.04.033.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
  • Myers D., Dalgity A. The Arches heritage inventory and management system: a platform for the heritage field // Heritage inventory and management system. — 2016. — С. 213—223.
  • Moghaddam G.,Moballeghi M. Trends in Preserving Scholarly Electronic Journals // InFuture. — 2009. — С. 115—125.
  • Moghaddam G. Preserve Scientific Electronic Journals: A Study of Archiving Initiatives // The Electronic Library. — 2008. — С. 1-22. — ISSN 0264-0473.
  • Muir A. Copyright and Licensing Issues for Digital Preservation and Possible Solutions // From information to knowledge: Proceedings of the 7th ICCC/IFIP International Conference on Electronic Publishing. — 2003.
  • Niu J. An Overview of Web Archiving // D-Lib Magazine. — 2012. — Т. 18, вып. 3/4. — doi:10.1045/march2012-niu1.
  • Niu J. Appraisal and Selection for Digital Curation // International Journal of Digital Curation. — 2014. — Т. 9, вып. 2. — С. 65–82. — doi:10.2218/ijdc.v9i2.272.
  • Owens E. Digital Preservation and Electronic Journals // Library and Information Services in Astronomy. — 2007. — С. 277—285.
  • Pal A. Preservation and Management of Digital Resources: Strategies and Issues // Digital Libraries: Reshaping Traditional Libraries into Next Generation. — 2014. — С. 28—42.
  • David Pearson, Colin Webb. Defining File Format Obsolescence: A Risky Journey // The International Journal of Digital Curation. — 2008. — Т. 3, вып. 1. — С. 89-106.
  • Perossini F. Digital Preservation (challenges, preparedness and reaction) // IOP Conference Series: Materials Science and Engineering. — 2020. — Вып. 949. — С. 2—7. — doi:10.1088/1757-899X/949/1/012112.
  • Principles and Good Practice for Preserving Data. — IHSN Working Paper. — 2009.
  • Prosser, D. The Next Information Revolution - How Open Access repositories and Journals will Transform Scholarly Communications // LIBER Quarterly. — 2003. — Т. 14, вып. 1. — doi:10.18352/lq.7755.
  • Prom C. Preserving Email // DPC Technology Watch Report 11-01 December 2011. — 2011. — doi:10.7207/twr11-01.
  • Salager-Meyer F. The open access movement or “edemocracy”: its birth, rise, problems and solutions (англ.) // Ibérica. — 2012. — No. 24. — P. 55—74.
  • Smith M., Bass M., McClellan G., Tansley R., Barton M., Branschofsky M. DSpace. An Open Source Dynamic Digital Repository // D-Lib Magazine. — 2003. — Т. 9, вып. 1. — ISSN 1082-9873.
  • RLG Inc. Trusted Digital Repositories: Attributes and Responsibilities. — Mountain View, CA, 2002.
  • The Future of Email Archives. A Report from the Task Force on Technical Approaches for Email Archives. — Council on Library and Information Resources. — 2018.
  • Pringle A. The Role of Metadata in Digital Preservation // The University of Iowa. — 2018.
  • Ross S. Approaching Digital Preservation Holistically // Information Management andPreservation. — 2006. — С. 1—19.
  • Richard R. Rowe. Holding moonbeams: the challenge of preserving scientific knoweledge // Serials. — 2001. — Т. 14, № 3.
  • Samiei M. Digital preservation: Concepts and strategies // Journal of Advanced Pharmacy Education and Research. — 2020. — Т. 10, вып. S4. — С. 127—135.
  • Soete, George J. Systems and Procedures Exchange Center // Transforming libraries. — 1997. — ISSN 3582 0160 3582.
  • Velmurugan C. Digital Preservation: Issues and Challenges on libraries and information resource centres in India. — 2013. — Т. 1, вып. 8.
  • Zierau E. OAIS and Distributed Digital Preservation in Practice // Archive CSEAS. — 2017.
  • Xie I. Discover Digital Libraries. Theory and practice. — Elsevier. — 2015.
  • Бунькова А.Д., Мещеряков С.Н. Студийная звукозапись и основы звукорежиссуры. — Уральский государственный педагогический университет. — 2014. — 174 с.
  • Михеенков А. В. Самоархивирование и открытые репозитории. — Ваше цифровое издательство. — Москва, 2018. — 28 с. — ISBN 978-5-6040408-1-2.
  • Трищенко Н. Открытый доступ к науке. Анализ преимуществ и пути перехода к новой модели обмена знаниями. — Ассоциация интернет-издателей Издательство «Кабинетный учёный». — 2017. — 200 с. — ISBN 978-5-7584-0154-5.
  • Храмцовская Н. Разработка концепции электронного архива // Делопроизводство и документооборот на предприятии. — 2012. — Вып. 4. — С. 68—78.