Открытые данные
Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля.
Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается[кем?] открытым, даже если он выложен в машиночитаемом виде в Интернет.
Обзор
[править | править код]Цели движения открытых данных похожи на другие «открытые» движения, такие как открытое программное обеспечение (open source), открытый контент (open content) и открытый доступ (open access). Рост популярности идеи об открытых данных во второй половине 2000-х годов связан, прежде всего, с запуском правительственных инициатив, таких как Data.gov.
Открытые данные часто ассоциируются с нетекстовыми материалами такими как карты, геномы, химические компоненты, математические и научные формулы, медицинские данные, данные о биологическом разнообразии. Проблемы чаще всего возникают по той причине что эти данные могут быть коммерчески ценными или могут быть собраны в некие ценные продукты.
Доступ к данным, как и последующее их использование, контролируется организациями — государственными и частными. Контроль может быть через ограничения, лицензии, копирайт, патенты и требования оплаты для доступа или повторного использования. Сторонники идеи «открытых данных» считают, что подобные ограничения идут против общественного блага и данные должны быть доступны без ограничений или оплаты. Также важно что данные должны быть доступны без последующих запросов на разрешение, хотя и способы повторного использования, такие как создание продуктов на базе данных, могут контролироваться лицензией.
Источники
[править | править код]Открытые данные могут поступать из различных источников. Однако наибольшие массивы данных публикуются (или готовятся к публикации) государственными органами и научным сообществом.
Открытые данные государств
[править | править код]Концепция открытого доступа к государственным данным является одним из ключевых интересов общества, многочисленные некоммерческие организации и отдельные активисты, которые добиваются открытости государственной информации в машиночитаемой форме. Многие правительства в рамках стратегий «открытого государства» создали веб-сайты для распространения части данных, обрабатываемых в секторе государственного управления. Некоторые известные сайты в стратегии открытых данных: data.gov (портал открытых данных США), science.gov[англ.], data.gov.uk[англ.], data.gov.in[англ.].
В октябре 2015 года Партнерство «Открытое правительство» (OGP) приняло Международную хартию открытых данных — набор принципов и передовых методов публикации открытых государственных данных, во время Международного саммита OGP в Мексике[1].
Открытые данные в науке
[править | править код]Концепция открытого доступа к научным данным была сформирована и институциально оформлена в 1957—1958 гг., когда был сформирован Международный центр данных[2].
В настоящее время Международный совет по науке (ранее Международный совет научных сообществ) курирует несколько мировых центров открытых данных, в целях уменьшения риска потери данных и увеличения их доступности[3].
Тем не менее только с началом работы интернета с доступностью быстрых, повсеместных сетей публикация/получение открытых данных стала значительно менее дорогой и стала занимать меньше времени[4].
Проект «Геном человека» был главной инициативой, которая продемонстрировала силу открытых данных. Он был основан на так называемых Бермудских принципах, которые гласят: «Вся информация о геномной последовательности человека (…) должна быть в свободном доступе и находиться в открытом доступе, чтобы стимулировать исследования и разработки и максимизировать их пользу для общества»[5]. Более поздние инициативы, такие как Консорциум структурной геномики, показали, что подход с открытыми данными может также продуктивно использоваться в контексте промышленных исследований и разработок[6].
В 2004 году министры науки всех стран Организации экономического сотрудничества и развития (ОЭСР), в которую входят наиболее развитые страны мира, подписали декларацию, в которой в основном говорится, что все архивные данные, финансируемые государством, должны быть общедоступными[7]. В ответ на запрос и интенсивное обсуждение с учреждениями, производящими данные в государствах-членах, ОЭСР опубликовала в 2007 году Принципы и руководящие указания ОЭСР по доступу к данным исследований из государственного финансирования в качестве рекомендации мягкого права[8].
Примеры открытых данных в науке:
- Проект Dataverse Network — программное обеспечение архивного хранилища, способствующее обмену данными, постоянному цитированию данных и воспроизводимым исследованиям
- Проект Figshare — поддерживает институциональный репозиторий с функцией бесплатной публикации неограниченного объёма открытых данных.
- data.uni-muenster.de — Открытые данные о научных фактах Университета Мюнстера, Германия. Запущен в 2011 году.
- connectedscience.org/data — Открытые научные наборы данных в виде связанных данных. Запущен в 2011 году.
Смежные направления
[править | править код]Цели открытия данных аналогичны целям других «открытых» движений.
- Открытый доступ (англ. Open access) — связан с доступностью научных публикации в Интернете. В некоторых случаях эти статьи также включают открытые наборы данных.
- Открытый контент (англ. Open content) — связан с предоставлением свободного доступа к ресурсам, предназначенным для людей (например, к прозе, фотографиям или видео).
- Открытое знание (англ. Open knowledge) — Open Knowledge International выступает за открытость в целом ряде вопросов, включая, в частности, вопросы открытых данных. Он охватывает (а) научную, историческую, географическую или иную информацию (б) контент, такой как музыка, фильмы, книги (в) государственную и другую административную информацию. Открытые данные включены в объем определения открытых знаний, которое упоминается в протоколе Science Commons для реализации данных открытого доступа[9].
- Наука об «открытых тетрадях» (англ. Open notebook science) — связана с применением концепции открытых данных на всех этапах научного цикла, включая данные о неудачных экспериментах а также необработанные экспериментальны данные.
- Программное обеспечение с открытым исходным кодом (англ. Open-source software) — связано с лицензиям, по которым могут распространяться компьютерные программы с открытым исходным кодом. Обычно не касается данных.
- Открытые образовательные ресурсы (англ. Open educational resources) — это свободно доступные, открытые по лицензии документы и средства массовой информации, которые полезны для преподавания, обучения и оценки, а также для исследовательских целей.
- Открытые исследования / открытая наука / открытые научные данные — означает подход к открытию и взаимосвязи научных активов, таких как: данные, методы и инструменты — для обеспечения прозрачных, воспроизводимых и междисциплинарных исследований.
- Пиратская партия России в своём Уставе определяет открытость данных одним из руководящих принципов[10], а в своей Программе выделяет такие цели и задачи, как ориентацию государственных органов на свободные и открытые технологии, открытое государство, реформу авторских прав в соответствии с интересами авторов и общества, а не издателей, свободу и открытость любой государственной информации, исключая информацию, содержащую персональные данные[11]. 4 апреля 2020 года Пиратская партия России присоединилась к проекту распределённых вычислений Folding@home для борьбы с коронавирусом[12]. 10 января 2023 года Пиратская партия России заявила об участии в перезапуске Creative Commons в России[13].
См. также
[править | править код]- Электронное государство
- Будапештская инициатива открытого доступа
- Викиданные
- Linked data
- Лицензии и инструменты Creative Commons
- Управление данными, Data governance[англ.], Data curation[англ.]
- FAIR-данные
- Разведка по открытым источникам
Примечания
[править | править код]- ↑ The Open Data Charter: A Roadmap for Using a Global Resource . The Huffington Post. Дата обращения: 29 октября 2015. Архивировано 3 октября 2018 года.
- ↑ Committee on Scientific Accomplishments of Earth Observations from Space, National Research Council. Earth Observations from Space: The First 50 Years of Scientific Achievements (англ.). — The National Academies Press[англ.], 2008. — P. 6. — ISBN 978-0-309-11095-2. Архивировано 30 июля 2014 года.
- ↑ World Data System. Data Sharing Principles . www.icsu-wds.org. ICSU-WDS (International Council for Science - World Data Service) (27 сентября 2017). Дата обращения: 27 сентября 2017. Архивировано 17 сентября 2018 года.
- ↑ Open data, open review and open dialogue in making social sciences plausible (англ.) : journal. — 2017. — 12 December. Архивировано 27 января 2022 года.
- ↑ Human Genome Project, 1996. Summary of Principles Agreed Upon at the First International Strategy Meeting on Human Genome Sequencing (Bermuda, 25-28 February 1996)
- ↑ Perkmann, Markus and Schildt, Henri, Open Data Partnerships between Firms and Universities: The Role of Boundary Organizations, Research Policy Архивная копия от 22 марта 2019 на Wayback Machine 44 (2015) 1133—1143
- ↑ OECD Declaration on Open Access to publicly funded data Архивировано 20 апреля 2010 года.
- ↑ OECD Principles and Guidelines for Access to Research Data from Public Funding . Дата обращения: 27 мая 2019. Архивировано 24 сентября 2015 года.
- ↑ Protocol for Implementing Open Access Data . Дата обращения: 27 мая 2019. Архивировано из оригинала 30 января 2017 года.
- ↑ Устав Пиратской Партии России . Дата обращения: 27 февраля 2024. Архивировано 27 февраля 2024 года.
- ↑ ПРОГРАММА “ПИРАТСКОЙ ПАРТИИ РОССИИ” (от 28 мая 2017 г.) (28 мая 2017). Дата обращения: 9 августа 2021. Архивировано 9 августа 2021 года.
- ↑ Пиратская партия России присоединилась к проекту распределённых вычислений Folding@home для борьбы с коронавирусом . Дата обращения: 27 февраля 2024. Архивировано 27 февраля 2024 года.
- ↑ Пиратская партия России примет участие в перезапуске Creative Commons в России . Дата обращения: 27 февраля 2024. Архивировано 27 февраля 2024 года.
Ссылки
[править | править код]- Видео об открытых данных госслужб России . Доклады Moscow Python Meetup №36 (23 июня 2016).
- Связанные открытые данные — беседа с Адрианом Полем на сайте Гёте-Института в Москве, май 2012
- Видео (англ.) Бернерса-Ли на TED 2010, показывающего примеры открытых данных
В статье не хватает ссылок на источники (см. рекомендации по поиску). |