Журналистика данных

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Журнали́стика да́нных (англ. data journalism) — направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником. Развитие журналистики данных связано с развитием технологий, позволяющих хранить и обрабатывать большие объемы данных, и движением в сторону большей открытости информации.

Журналистика данных связана с такими сферами, как информатика, дизайн и статистика.

Направления работы

[править | править код]
  1. Работа журналиста с данными.
  2. Инфографика и визуализация данных в целом (статичная или интерактивная, игровые форматы).
  3. Журналистика, основанная на работе с базами данных (предоставление для аудитории возможности открыто изучить большие объёмы данных без дополнительной аналитики).
Материал The Guardian 1821 года

Первым полноценным материалом, представляющим журналистику данных, считается исследование The Guardian 1821 года[1], в котором рассказывается о стоимости высшего образования в различных вузах Британии. Авторы материала подготовили сводные таблицы, в которых указали цену на обучение в каждом учебном заведении. Работа получила позитивные рецензии за то, что впервые в журналистской практике столь «открыто были представлены все данные для читательской аудитории».

В 1858 году Флоренс Найтингейл создала исследование, посвященное анализу состояния и ежегодных потерь британской армии[2]. В 54-страничном материале автор приводит огромное количество данных, переведенных в табличный вид и диаграммы. Основой для материала стали «сырые» данные, полученные из доступных на тот момент источников. Из работы Найтингейл складывается полноценное журналистское расследование, вывод из которого состоит в том, что даже в мирное время смертность в армии оказывается почти вдвое выше, чем смертность гражданских лиц аналогичного возраста (вследствие проблем, совершенно не связанных с военными действиями). Новаторство её работы заключалась не в использовании графиков и диаграмм (их в журналистских материалах использовали и до работы Найтингейл), а в подходе к «сырым» данным. С их помощью автор оформила полностью прозрачный (в значении используемых источников и данных) материал, который при желании может самостоятельно проанализировать и каждый читатель, используя опубликованные в статье данные.

Появление журналистики данных в её современном виде связывают с 1952 годом — именно тогда в работе журналиста впервые был использован компьютер[3]. Телеканал CBS арендовал вычислительные мощности компьютера UNIVAC I для расчета прогнозов на результаты президентских выборов и оценки результатов каждого из кандидатов. Подобная практика использования компьютера для журналистики стала носить понятие «компьютерной журналистики» (Computer-assisted reporting (CAR)).

С конца 60-х использование компьютерного анализа данных для создания журналистского материала получило более широкое распространение. В 1967 году Филипп Мейер, журналист газеты Detroit Free Press, использовал компьютерные данные для создания материала о прошедших в городе протестах[3]. Другой журналист Билл Дедмен в 1980-е годы создал серию сюжетов «Цвет денег», которые раскрывали информацию о систематических расовых предрассудках в кредитной политике ведущих финансовых институтов[3]. В начале 1990-х годов Стив Дойг в своей работе «Что пошло не так» стремился проанализировать ущерб от урагана «Эндрю», чтобы понять, в какой степени на силу этого ущерба оказали влияние недостатки в области политики и практики городского развития. Репортажи на основе данных стали ценной общественной работой и позволили журналистам завоевать известные награды[3].

В конце 1980-х годов произошло несколько значимых событий для журналистики данных. В 1989 году газета The Atlanta Journal-Constitution получила Пулитцеровскую премию за серию репортажей, в которых использовалась компьютерная обработка данных. В Школе журналистики при университете Миссури был сформирован Национальный Институт компьютерной журналистики (National Institute for Computer Assisted Reporting (NICAR)[4]). В 1990 году этот Институт организовал первую конференцию, посвященную журналистике с использованием компьютерных технологий в Индианском университете. С тех пор эти конференции проходят ежегодно и являются крупнейшими встречами журналистов данных.

Само понятие журналистики данных впервые было сформулировано в 2010 году на международной конференции в Амстердаме[5], после чего данное направление журналистики считается официально сформированным. Начиная со второй половины 2010 года, понятие журналистики данных активно используется как на конференциях, так и в академических журналах.

Журналистика данных в наше время

[править | править код]

Первым СМИ, ставшим на постоянной основе заниматься журналистикой данных, стал The Guardian, в 2009 году запустивший раздел Datablog[6], в котором все материалы создаются с помощью обработки и представления данных.

Другие медиа также создают проекты, основанные на работе с большими объемами данных. Так, редакция газеты Las Vegas Sun в течение двух лет создавала проект «Do No Harm»[7], в рамках которого оформила целый раздел на сайте, посвященный проблемам в области медицины в Лас-Вегасе. В рамках проекта, редакция опубликовала цикл статей, фотоотчетов, видеорепортажей, читательских историй, а также интерактивной инфографики с указанием и публикацией исходных документов и исследований, ставших основной для журналистских статей. В результате работы с массивом из 2,9 миллионов больничных записей, Las Vegas Sun удалось выявить более 3500 случаев травм и осложнений, которые случились с пациентами по вине медицинского персонала в больницах города (включая инциденты, которые завершались смертельным исходом). Проект получил большой резонанс как среди читателей, так и в городском правительстве и экспертном медицинском сообществе.

В 2009 году проект Toxic Waters[8] от The New York Times получил Пулитцеровскую премию. Он стал одним из важнейших примеров журналистского материала на стыке журналистики данных и репортажной журналистики. В рамках проекта команда журналистов оформила целую серию инфографики, интерактивных карт, опросов и данных, основанных на анализе профессиональных документов об исследовании уровня загрязнения питьевой воды в различных штатах США. Помимо анализа вопросов по содержанию вредных веществ в воде, команда журналистов, работавших над проектом, также изучила потенциальные риски для здоровья, которые могут нанести повышенные дозы определенных веществ, из-за чего проект имеет черты научного журналистского исследования.

Новым витком в развитии журналистики данных стала визуализация информации, ставшей доступной благодаря Wikileaks. Журналисты Associated Press Джонатан Стрэй и Джулиан Берджесс с помощью открытых инструментов визуализации The Overview Project и Gephi обработали 391832 документа и визуализировали массив разнородных отчетов о войне в Ираке[9]. В рамках проекта журналисты создали облако тегов, которые встречаются во всем множестве документов, полученных от проекта Wikileaks о военных действиях в Ираке. Получившаяся визуализация позволила выделить ключевые слова документов: «задержаны», «убиты», «взрывчатое вещество», «подвержены пыткам». В аннотации[10] к визуализации журналисты отметили, что согласно имеющимся данным, в ходе операций в Ираке погибло около 4000 военнослужащих США и около 100000 гражданского населения. Десятки тысяч описанных инцидентов стрельбы и пыток позволили журналистам определенно заявить о том, что правительство скрывало множество фактов об операции в Ираке.

В 2012 году общество Global Editors Network организовало премию в области журналистики данных — Data Journalism Awards[11]. С тех пор призы ежегодно присуждаются в нескольких номинациях, в числе которых лучшая визуализация данных, расследование года, лучшее личное портфолио, лучший сайт СМИ и другие.

Примечания

[править | править код]
  1. Rusbridger, Alan (2009-03-10). "Free the facts". The Guardian (англ.). Архивировано 29 октября 2014. Дата обращения: 28 марта 2016.
  2. Mortality of the British Army, 1858. Scribd. Дата обращения: 28 марта 2016.
  3. 1 2 3 4 Грей Д. Пособие по журналистике данных. Дата обращения: 9 августа 2020. Архивировано 8 октября 2021 года.
  4. Investigative Reporters and Editors, Inc. Investigative Reporters and Editors | About. IRE. Дата обращения: 28 марта 2016. Архивировано 26 марта 2016 года.
  5. Technology Tank | All About Data Journalism. technologytank.org. Дата обращения: 28 марта 2016. Архивировано 17 октября 2015 года.
  6. Data. the Guardian. Дата обращения: 28 марта 2016. Архивировано 25 марта 2016 года.
  7. Do No Harm: Hospital Care in Las Vegas. LasVegasSun.com. Дата обращения: 28 марта 2016. Архивировано 6 апреля 2016 года.
  8. Toxic Waters - Series - The New York Times. projects.nytimes.com. Дата обращения: 28 марта 2016. Архивировано 27 декабря 2016 года.
  9. Stray, Jonathan (2010-12-16). "Wikileaks Iraq: how to visualise the text". The Guardian (англ.). Архивировано 17 ноября 2017. Дата обращения: 28 марта 2016.
  10. A full-text visualization of the Iraq War Logs | Jonathan Stray. jonathanstray.com. Дата обращения: 28 марта 2016. Архивировано 2 апреля 2016 года.
  11. Data Journalism Awards | GEN. GEN. Дата обращения: 28 марта 2016. Архивировано из оригинала 20 июня 2016 года.