Эта статья входит в число хороших статей

Open Library

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Open Library
Изображение логотипа
URL openlibrary.org
Коммерческий Нет
Тип сайта Цифровая библиотека
Регистрация бесплатно
Язык (-и) Английский
Язык программирования Python
Владелец Internet Archive
Создатель Аарон Шварц
Начало работы октябрь 2005 года
Текущий статус работает
Слоган One web page for every book ever published
Страна
Логотип Викисклада Медиафайлы на Викискладе

Open Library (с англ. — «Открытая библиотека», OL) — проект виртуальной библиотеки, созданный в 2006 году некоммерческой организацией «Архив Интернета». OL ставит перед собой две главные цели — предоставить пользователю максимальное количество информации о запрашиваемом издании, через pdf-версию или ссылку для его приобретения, а также собрать информацию о каждой когда-либо выпущенной книге. Над проектом работали, среди прочих, создатель «Архива» Брюстер Кейл и американский интернет-активист Аарон Шварц. Финансирование осуществлялось за счёт грантов библиотеки штата Калифорния[англ.] и Kahle/Austin Foundation (с англ. — «Фонд Кейла/Остин»).

Open Library функционирует одновременно как репозиторий и электронная библиотека. В качестве репозитория OL предоставляет доступ к свободным библиографическим материалам и отсканированным книгам из коллекций «Архива» и партнёрских организаций. Работы доступны для пользователей в форматах pdf, ePub, а также для чтения на сайте. Помимо этого, пользователи могут отправить электронные книги на Kindle. В качестве виртуальной библиотеки OL предоставляет во временное пользование до пяти электронных книг, максимальным сроком до двух недель. Материалы также доступны через партнёрские организации «Архива», в число которых входят свыше тысячи библиотек со всего мира. Доступ осуществляется благодаря «контролируемой цифровой выдаче» (CDL) – удалённой системе выдачи электронных книг. Согласно этому принципу, библиотека может распространять в электронном виде точное количество копий определённого произведения, которыми она владеет. Система является цифровым эквивалентом получения книги в «обычной» библиотеке. Если пользователь хочет прочитать книгу, но все доступные экземпляры уже были взяты, то он автоматически попадает в лист ожидания.

На июнь 2022 года «Архив» содержал данные о более чем 34 млн текстов, начиная с художественной и научно-популярной литературы и заканчивая работами по истории литературы, музыке, военной истории, биографиями. Более 2 млн текстов доступны для скачивания или взятия на время.

Создатель Архива Интернета Брюстер Кейл в 2009 году
Один из создателей OL Аарон Шварц на мероприятии Creative Commons, 13 декабря 2008 года

В 2006 году некоммерческая организация «Архив Интернета» запустила проект виртуальной библиотеки под названием Open Library (с англ. — «Открытая библиотека»). «Архив» был основан в 1996 году американским программистом Брюстером Кейлом, одним из первых обративших внимание на необходимость архивации цифровых данных. Кейл поставил перед собой цель сохранить бо́льшую часть информации, опубликованной на тот момент в интернете. Уже к началу 2000-х годов коллекция «Архива» состояла из значительного количества графических работ, архивированных веб-страниц, а также аудио- и видео-материалов. В 2005 году по инициативе «Архива Интернета» был создан консорциум Open Content Alliance (ОСА). Входящие в состав OCA организации занимались оцифровкой библиотечных фондов и размещением материалов в открытом доступе. Среди прочих к консорциуму присоединились Yahoo, Калифорнийский университет, Торонтский университет, Национальные архивы Великобритании[англ.], а также другие организации[1]. Также в состав OCA входил Microsoft[2]. В 2008 году компания заявила о прекращении инвестиций в проект, однако все договорные ограничения на книги в открытом доступе остались в силе, кроме того, «Архиву» было передано всё необходимое для оцифровки оборудование[3][4][5]. Open Content Alliance был основан в качестве альтернативы конкурирующему проекту Google Книги, однако в отличие от последнего, OCA архивировал только те материалы, на которые было получено предварительное разрешение от издателей[6][7].

На основе оцифрованных в рамках OCA материалов в 2006 году был создан проект виртуальной библиотеки Open Library[8][9], которую создатели задумывали как портал, содержащий информацию о каждой когда-либо опубликованной книге и, по возможности, предоставляющий к ней доступ[10][11]. Руководителем технической группы, занимающейся разработкой и инженерной составляющей портала, был американский программист и хактивист Аарон Шварц[12][13]. По его задумке, Open Library должна была стать основным открытым источником информации о книгах и их коммерческих издателях, рецензентах, пользователях и местах хранения[14][15]. Каждая книга имеет свою страницу на портале, которая, как и в Википедии, доступна для общего редактирования[16]. Программное обеспечение, на котором работает Open Library, выложено на GitHub на условиях открытых лицензий[17].

Существует множество книг и тонны информации об этих книгах. Даже большая группа библиотекарей не сможет собрать всё это. Мы думаем об этом [Проект Open Library] как об аналоге Википедии. Есть несколько отличных энциклопедий, написанных небольшими группами экспертов, но чтобы получить что-то столь же обширное и разнообразное, как Википедия, вам нужно каждому предоставить доступ.Аарон Шварц[15]

Изначально финансирование портала осуществлялось за счёт грантов библиотеки штата Калифорния[англ.] и Фонда Кейла/Остин (Kahle/Austin Foundation)[14]. В 2019 году было объявлено о запуске целевой программы спонсорства, в рамках которой пользователи могли пожертвовать на покупку и/или оцифровку любой книги. Таким образом, они первыми получали право на её прочтение, после чего работа становилась доступной и для других читателей[18].

В 2010 году сайт был значительно переработан[19].

Принцип работы

[править | править код]

Open Library функционирует одновременно как репозиторий и электронная библиотека. В качестве репозитория OL предоставляет доступ к открытым библиографическим материалам и отсканированным книгам, доступным через собственную коллекцию «Архива» и через собрания партнёрских организаций[20]. Так, среди прочих Открытая библиотека сотрудничает с Библиотекой Конгресса, Проектом «Гутенберг», Нью-Йоркской публичной библиотеки и Ведомством по патентам и товарным знакам США. В результате кооперации были оцифрованы разные типы носителей, в том числе микрофильмы, журналы и серийные публикации, в основном на английском, нидерландском, немецком, французском, арабском, итальянском и других языках. Книги, изданные более 95 лет назад, доступны для скачивания[21][14][22][23][24]. Работа по сканированию и оцифровке материалов продолжается до сих пор. Так, на 2019 год по всему миру действовало более 23 центров, в которых оцифровывались в среднем 1000 книг в сутки[25][26]. Электронные книги Open Library сканируются с физических копий, а не приобретаются в цифровой форме, поэтому проект не заключает лицензионных соглашений с издателем[27]. Open Library создаёт сеть публичных учреждений, через которую пользователи могут арендовать для чтения практически любую книгу. В качестве виртуальной библиотеки OL предоставляет во временное пользование до пяти электронных книг, максимальным сроком до двух недель.

Книги также доступны через партнёрские организации «Архива», в число которых входит более чем тысяча библиотек со всего мира. Доступ осуществляется благодаря удалённой системе лендинга электронных книг — «контролируемой цифровой выдаче» (CDL). Согласно этому принципу, библиотека распространяет в электронном виде точное количество копий определённого произведения, которым она владеет. Система является цифровым эквивалентом получения книги в местном библиотечном отделении. Если пользователь хочет прочитать книгу, но все доступные экземпляры уже были взяты, то он автоматически попадает в лист ожидания[20][26][9][28][29]. Одним из значительных преимуществ CDL является решение «проблемы двадцатого века», когда старые книги всё ещё защищены авторским правом, но вряд ли когда-либо будут предлагаться в цифровом виде коммерческими службами[30]. При этом критики Open Library считают, что CDL является пиратством, поскольку позволяет распространение файлов книг, без надлежащего лицензирования и выплаты авторам компенсации[31][27]. Реализация CDL в США возможна благодаря доктрине добросовестного использования и Digital Millennium Copyright Act — если у правообладателей возникают какие-то вопросы к правомерности размещения контента, «Архив» с высокой степенью вероятности его удалит[17].

Скриншот книги с портала Open Library, 2008 год

Через портал пользователи могут осуществлять поиск необходимой литературы по авторам, названиям работ, издательствам, ключевым словам, а также году выпуска[14]. Работы представлены в форматах pdf, ePub, а также доступны через чтение на сайте. Помимо этого читатели могут отправить версии электронных книг на свои устройства Kindle[23][24][32]. В случае если электронная версия книги недоступна, пользователи могут просмотреть метаданные издания (генерируются через сайты Библиотеки Конгресса, Amazon или другие источники), а также ссылки на цифровые/электронные версии книг или другую информацию[25][10] — это соответствует одной из целей библиотеки по «построению полного каталога всей литературы»[20]. На главной странице раздела книги также перечислены коллекции, которые сортированы по просмотрам, названию, дате публикации и автору[24].

Язык Количество текстов
Английский 25 170 833
Французский 721 497
Нидерландский 716 895
Немецкий 704 692
Арабский 466 901
Китайский 337 780
Испанский 298 225
Японский 150 510
Урду 94 246
Русский 71 710
Португальский 68 952
Количество текстов по десятилетиям (на 22 ноября 2021)[33]
Десятилетия Текстов
1800-е 88 220
1810-е 108 491
1820-е 172 099
1830-е 225 026
1840-е 262 313
1850-е 326 815
1860-е 34 451
1870-е 367 148
1880-е 486 069
1890-е 620 378
1900-е 906 812
1910-е 918 168
1920-е 577 916
1930-е 477 119
1940-е 527 947
1950-е 652 179
1960-е 785 713
1970-е 2 631 404
1980-е 1 228 509
1990-е 1 507 405
2000-е 2 119 690
2010-е 3 403 522

На июнь 2022 года «Архив» содержит данные о более чем 34 млн текстов[34], начиная от художественной и научно-популярной литературы и заканчивая работами по истории литературы, музыки, истории, биографическими работами[20]. С 2007 года «Архив» сохраняет в своей базе общедоступные книги из Google Book Search, уже к 2013 году в коллекции насчитывалось более 900 тысяч сохранённых таким образом книг[35].

National Emergency Library

[править | править код]

С началом пандемии COVID-19 и последующей серии карантинов множество студентов остались без доступа к библиотечным материалам. Для решения этой проблемы Open Library объявила о создании временной программы National Emergency Library (с англ. — «Национальная библиотека на случай чрезвычайной ситуации»). В рамках программы было убрано существующее ограничение на количество пользователей, которые могли бы взять ту или иную книгу — таким образом, распространение книг стало неограниченным. На момент старта программы Open Library предоставляла доступ к более чем 4 млн цифровым публикациям, 2,5 млн из которых находились в общественном достоянии, а 1,4 млн — были ограничены авторским правом и подлежали ограничениям на выдачу. Для избежания нарушения авторских прав «Архив» предоставил авторам форму, которую они могли заполнить для исключения книг из программы[36].

Более 100 библиотек, архивов и других учреждений подписали заявление о поддержке National Emergency Library, включая Массачусетский технологический институт, Пенсильванский университет, Университет Эмори, Бостонская публичная библиотека, Миддлберийский колледж, Амхерст-колледж, Университет Джорджа Вашингтона и Клермонтские колледжи[37]. В июне 2020 года «Архив Интернета» объявил о досрочном закрытии программы за две недели до изначально назначенной даты 30 июня[38][39]. Причиной для этого послужил поданный 1 июня 2020 года иск Общества авторов, включающего Hachette Book Group[англ.], Random House, HarperCollins и другие издательства. Иск был направлен против «Архива», который обвинялся в способствовании пиратству. Общество авторов требовало возмещение ущерба издателям за распространение «Архивом» 127 защищённых авторским правом работ в размере $ 150 000, а также запрет на оцифровку материалов. В жалобе утверждается, что CDL и Национальная библиотека по чрезвычайным ситуациям нарушают баланс, создаваемый законом об авторском праве между создателем и публичным доступом к информации[40][31][26].

В ответ «Архив» объявил о преждевременном завершении проекта, попросив издателей «прекратить дорогостоящее нападение». В августе 2021 года «Архив» заявил о необходимости предоставить для суда данные о продажах работ, которые распространялись через издательства Общества авторов. Чтобы показать, что National emergency library не причинила вреда, «Архив Интернета» утверждал, что хочет сравнить коммерческую эффективность книг, которые были доступны для цифровой загрузки, с книгами, которые не были доступны для цифровой выдачи. Однако издатели не были готовы предоставить данные, по крайней мере, в том объёме, который запрашивал «Архив»[41][42]. Если суд удовлетворит иск, то максимальная сумма, которую должен будет выплатить «Архив Интернета», составит 19 млн долларов — эквивалент годового бюджета «Архива Интернета»[31][26][43][44].

Слушание по делу состоялось 25 марта 2023 года. Согласно решению суда, Архив Интернета нарушил авторские права четырёх издателей, не получив разрешение на распространение литературы от правообладателей книг. Архив Интернета заявил о решении подать апелляцию на решение суда[45][46][47][48].

Примечания

[править | править код]
  1. Katie Hafner. In Challenge to Google, Yahoo Will Scan Books (англ.). The New York Times (3 октября 2005). Дата обращения: 19 августа 2021. Архивировано 1 сентября 2021 года.
  2. Microsoft to Offer Online Book-Content Searches (англ.). The New York Times (26 октября 2005). Дата обращения: 19 августа 2021. Архивировано 1 сентября 2021 года.
  3. Books Scanning to be Publicly Funded (англ.). Internet Archive. Дата обращения: 19 августа 2021.
  4. Nate Anderson. Why killing Live Book Search is good for the future of books (англ.). Ars Technica (26 мая 2008). Дата обращения: 19 августа 2021. Архивировано 1 сентября 2021 года.
  5. Miguel Helft. Microsoft Will Shut Down Book Search Program (англ.). The New York Times (24 мая 2008). Дата обращения: 17 августа 2021. Архивировано 12 декабря 2020 года.
  6. Eric Bangeman. Internet Archive wants book copyright indemnity like Google (англ.). ArsTechnica (20 апреля 2009). Дата обращения: 22 августа 2021. Архивировано 1 сентября 2021 года.
  7. Katie Hafner. In Challenge to Google, Yahoo Will Scan Books (англ.). The New York Times (3 октября 2005). Дата обращения: 16 августа 2021. Архивировано 1 сентября 2021 года.
  8. Nate Anderson. Open Library goes online with public domain book collection (англ.). ArsTechnica (20 июля 2007). Дата обращения: 22 августа 2021. Архивировано 1 сентября 2021 года.
  9. 1 2 Западные книжные издательства сживают со света «машину времени» интернета (англ.). C News (2 июня 2020). Дата обращения: 20 августа 2021. Архивировано 1 сентября 2021 года.
  10. 1 2 Bobbie Johnson. The library that never closes (англ.). The Guardian (1 июля 2009). Дата обращения: 19 августа 2021. Архивировано 1 сентября 2021 года.
  11. Archiving every book ever published (англ.). Los Angeles Times (5 августа 2011). Дата обращения: 20 августа 2021. Архивировано 24 мая 2019 года.
  12. Lawrence Lessig. Why They Mattered: Aaron Swartz (англ.). Politico (22 декабря 2013). Дата обращения: 19 августа 2021. Архивировано 1 сентября 2021 года.
  13. Peter Eckersley. Farewell to Aaron Swartz, an Extraordinary Hacker and Activist (англ.). Electronic Frontier Foundation (12 января 2013). Дата обращения: 20 августа 2021. Архивировано 25 ноября 2018 года.
  14. 1 2 3 4 Савицкая, 2017.
  15. 1 2 Giles Turnbull. A library bigger than any building (англ.). Giles Turnbull (31 июля 2007). Дата обращения: 19 августа 2021. Архивировано 27 ноября 2009 года.
  16. About us (англ.). Open Library. Дата обращения: 23 августа 2021. Архивировано 27 июня 2015 года.
  17. 1 2 Наталья Трищенко. Цифровой ренессанс библиотек (англ.). Частный Корреспондент (4 февраля 2019). Дата обращения: 20 августа 2021. Архивировано 1 сентября 2021 года.
  18. Mek. Scan On Demand: Building the World’s Open Library, Together (англ.). The Open Library Blog (23 октября 2019). Дата обращения: 22 августа 2021. Архивировано 29 августа 2021 года.
  19. Announcing the Open Library redesign (англ.). Open Library (17 марта 2010). Дата обращения: 22 августа 2021. Архивировано 21 августа 2021 года.
  20. 1 2 3 4 Ismail, 2019, pp. 38—49.
  21. Michael Bryant. What is the Internet Archive and What Can I Find on It? (англ.). G Post (22 апреля 2021). Дата обращения: 15 июня 2021. Архивировано 16 июня 2021 года.
  22. Kate Knibbs. Internet Archive Is a Beautiful Storage Bin for Our Online Memories (англ.). The Ringer (27 июня 2016). Дата обращения: 19 августа 2021. Архивировано 2 сентября 2021 года.
  23. 1 2 Ismail, 2019.
  24. 1 2 3 Brewster Kahle. Transforming Our Libraries from Analog to Digital: A 2020 Vision (англ.). Educause review (13 марта 2017). Дата обращения: 15 июня 2021. Архивировано 2 августа 2021 года.
  25. 1 2 Nancy K. Herther. Internet Archive Turns Up the Speed With BitTorrent (англ.). Information Today (23 августа 2012). Дата обращения: 19 августа 2021. Архивировано 2 сентября 2021 года.
  26. 1 2 3 4 Alison Flood. Internet Archive's ebook loans face UK copyright challenge (англ.). The Guardian (22 января 2019). Дата обращения: 17 августа 2021. Архивировано 12 февраля 2019 года.
  27. 1 2 Russell Brandom. Publishers sue Internet Archive over Open Library ebook lending (англ.). The Verge (1 июня 2020). Дата обращения: 19 августа 2021. Архивировано 1 июня 2020 года.
  28. Adi Robertson. The National Emergency Library is offering free ebooks — but is it lending or piracy? (англ.). The Verge (31 марта 2020). Дата обращения: 22 августа 2021. Архивировано 2 сентября 2021 года.
  29. Timothy Lee. Internet Archive offers 1.4 million copyrighted books for free online (англ.). Ars Technica (28 марта 2020). Дата обращения: 19 августа 2021. Архивировано 28 марта 2020 года.
  30. Controlled Digital Lending by Libraries (англ.). Controlled Digital Lending by Libraries. Дата обращения: 22 августа 2021. Архивировано 2 августа 2019 года.
  31. 1 2 3 Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 июня 2020). Дата обращения: 19 августа 2021. Архивировано 18 августа 2021 года.
  32. Weisband, 2010, pp. 8—11.
  33. Search (англ.). Internet Archive. Дата обращения: 22 ноября 2021.
  34. eBooks and Texts (англ.). Internet Archive. Дата обращения: 15 июня 2021.
  35. Marks. Справочная: “Архив Интернета” — история создания, миссия и дочерние проекты. Хабр (26 октября 2018). Дата обращения: 20 августа 2021. Архивировано 2 сентября 2021 года.
  36. John Delaney, D. Sean West. Open Access, Open Source, and the Battle to Defeat COVID-19 (англ.). JD Supra (22 апреля 2020). Дата обращения: 19 августа 2021. Архивировано 2 сентября 2021 года.
  37. Maria Bustillos. Publishers Are Taking the Internet to Court (англ.). The Nation (10 сентября 2020). Дата обращения: 19 августа 2021. Архивировано 23 августа 2021 года.
  38. Techcrunch. Интернет-архив завершает бесплатную программу электронных книг, следуя примеру издателя. Kolibri Press (12 июня 2020). Дата обращения: 20 августа 2021. Архивировано 2 сентября 2021 года.
  39. Timothy Lee. Internet Archive offers 1.4 million copyrighted books for free online (англ.). ArsTechnica (28 марта 2020). Дата обращения: 22 августа 2021. Архивировано 28 марта 2020 года.
  40. Schard, 2021.
  41. Andy Maxwell. Internet Archive Wants Publishers’ Sales Data to Show Digital Library Doesn’t Hurt Sales (англ.). Torrent Freak (14 августа 2021). Дата обращения: 29 августа 2021. Архивировано 27 августа 2021 года.
  42. Andrew Albanese. Internet Archive Seeking 10 Years of Publisher Sales Data for Its Fair Use Defense (англ.). Publishers Weekly (9 августа 2021). Дата обращения: 29 августа 2021. Архивировано 31 августа 2021 года.
  43. Andrew Albanese. Internet Archive to End 'National Emergency Library' Initiative (англ.). Publishers Weekly (12 июня 2020). Дата обращения: 19 августа 2021. Архивировано 10 августа 2021 года.
  44. Annie Bronson. «Архив Интернета» просит издателей отозвать иск с требованием удалить 1,5 млн книг. Хабр (31 июля 2020). Дата обращения: 20 августа 2021. Архивировано 2 сентября 2021 года.
  45. Anna Lovine. Internet Archive loses first ruling in copyright lawsuit. Mashable (25 марта 2023). Дата обращения: 4 апреля 2023. Архивировано 6 апреля 2023 года.
  46. Paul Hill. Court rules against Internet Archive in favour of book publishers on digital lending. NeoWin (25 марта 2023). Дата обращения: 4 апреля 2023. Архивировано 2 апреля 2023 года.
  47. Jay Peters and Sean Hollister. The Internet Archive has lost its first fight to scan and lend e-books like a library. The Verge (23 мая 2023). Дата обращения: 7 апреля 2023. Архивировано 25 марта 2023 года.
  48. Internet Archive Loses Lawsuit Over E-Book Copyright Infringement. Here’s What to Know. Time (31 марта 2023). Дата обращения: 7 апреля 2023. Архивировано 7 апреля 2023 года.

Литература

[править | править код]
  • Ismail L. Open Library (Internet Archive) (англ.) // The Charleston Advisor. — 2019. — P. 38—42.
  • Robin Schard. Hachette Book Group v. Internet Archive: Is There a Better Way to Restore Balance in Copyright? (англ.) // Internet Reference Services Quarterly. — 2021. — Vol. 24, iss. 1—2. — P. 53—58.
  • Weisband P. The Open Library Book Project: an Opening for Women-focused Books (англ.) // Feminist Collections: A Quarterly of Women's Studies Resources. — 2010. — Vol. 31, no. 3. — P. 8—11.
  • Савицкая Т.Е. Internet Archive: электронная библиотека нового типа. — 2017. — Т. 66, вып. 1. — С. 29—36.