Data steward

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Data steward (с англ. — «Распорядитель данных, дата-стюард») — это специалист по надзору или по управлению данными в организации, который отвечает за обеспечение качества и соответствия объектов данных их назначению.

Целью работы распорядителя данных является управление качеством данных. Это включает в себя документирование метаинформации о данных, включая метаданные физических активов данных, подготовка описаний наборов данных, определение обязанностей владельцев и хранителей данных, управление взаимосвязями объектов, формирование описаний объектов в бизнес-глоссарии, документирование правил обработки и хранения данных.[1]

Распорядители данных начинают процесс управления с каталогизации источников данных и их компонентов, каталогизации витрин данных и процессов преобразования данных. Для достижения этой цели применяется специализированный класс программного обеспечения - Каталог данных.

Роли по управлению данными необходимы организациям деятельность которых зависит от качества и своевременности обработки данных. Распорядитель данных является сотрудником департамента по работе с данными или Data Office. Обычно, высшую должность в этом департаменте занимает Директор по данным.

Некоторые поставщики средств управления метаданными, например Alation[1] выдвигают на передний план дата-стюарда в качестве единой точки входа для сотрудников организации использующих корпоративные данные при принятии управленческих решений.

Должностные обязанности распорядителя данных[править | править код]

Распорядитель данных гарантирует, что каждый объект данных:

  • Имеет четкое и однозначное определение элемента данных
  • Не конфликтует с другими объектами данных в каталоге данных (дубликаты, синонимы)
  • Имеет четкие определения перечисляемых значений, если они относятся к типу Code
  • Имеет статус жизненного цикла, например активный либо архивный объект
  • Используется в соответствии со своим назначением
  • Имеет соответствующую документацию по правильному использованию
  • Обладает записью о происхождении и его трансформация
  • Защищен от несанкционированного доступа или изменения

Обязанности распорядителей данных различаются в разных организациях и учреждениях. Например, в Делфтском техническом университете распорядители данных считаются первым контактным лицом по любым вопросам, связанным с исследовательскими данными, каждый факультет университета имеет штатного распорядителя данных[2]. В Республике Казахстан должность дата-стюарда официально вводится в реестр должностей политических и административных государственных служащих.[3]

Типы распорядителей данных[править | править код]

По мере роста объемов данных и сложности процессов их управления делегирование управления метаданными одному человеку становится неэффективным. Невозможно уследить за всеми данными, поступающими в организацию, даже небольшую[4]. Дата-стюард тесно сотрудничает с бизнес-аналитиками, архитекторами данных и разработчиками моделей машинного обучения, аналитиками по качеству данных, сотрудниками отделов организации, ответственными за ввод данных, дата-инженерами и администраторами информационных систем[5]. В рамках разделения обязанностей по управлению данными в организации выделяются четыре типа управляющих данных, в зависимости от специфики их задач.[6]

  • Распорядитель бизнес-данных — отвечает за управление критически важными данными, как справочными, так и транзакционными, созданными или используемыми одной бизнес-функцией. Распорядитель данных также может служить связующим звеном между пользователями данных организации и техническими группами, помогая преодолеть разрыв между бизнес-пользователями и техническими специалистами
  • Управляющий данными процесса — отвечает за управление данными в рамках бизнес-процесса
  • Распорядитель системных данных — отвечает за управление данными ИТ-системы
  • Распорядитель данных бизнес-глоссария — отвечает за управление справочными данными и атрибутами в бизнес-глоссарии

В большинстве организаций есть несколько распорядителей данных для каждой основной функциональной области, в то время как в небольших организациях может быть всего один управляющий. Поэтому в крупных организациях возникает новая роль Chief Data Steward — главный распорядитель данных, на которого возложена ответственность за общее управление функцией управления в определенной области. В отличие от линейного руководства, распорядители данных и их главный распорядитель данных не имеют прямых отношений подчинения, скорее, главные распорядители выступают в качестве руководителей команды управления в этой функциональной области. Вместе все главные распорядители данных организации составляют координационную группу по управлению данными, где принимаются решения, влияющие на управление данными более чем в одной функциональной области[7].

На ноябрь 2023 года не сформировался устоявшийся перевод наименования роли Data Steward на русский язык. Встречаются несколько вариантов перевода, такие как распорядитель данных, владелец данных, дата-стюард, хранитель данных и другие[8].

Преимущества управления данными[править | править код]

Внедрение процессов систематического управление данными, и соответствующих ролей распорядителя данных способствует:

  • Более быстрому анализу данных
  • Всестороннему использованию данных в управленческом процессе, или data-driven management
  • Снижению затрат связанных с хранением и обработкой данных
  • Снижению риска потери или утечки данных
  • Улучшению контроля опасностей, связанных с конфиденциальностью, юридическими вопросами и ошибками в данных
  • Повышению достоверности моделей машинного обучения

Специализированный инструментарий распорядителя данных[править | править код]

Создается рынок приложений и информационных систем, используя которые дата-стюарды осуществляют управление объектам данных. Эти приложения обеспечивают возможности ведения бизнес-глоссария, обеспечения контроля качества данных, поддержку сбора метаданных из систем источников. Поставщики внедряют дополнительные функции, такие как использование искусственного интеллекта для создания гипотез и описаний данных, автоматическое построение графов происхождения данных[2], модули управления процессами и системы обеспечения коммуникации между владельцами, распорядителями и пользователями данных. В исследовании Gartner Magic Quadrant анализируется 17 инструментов различных производителей программного обеспечения для управления метаданными[9].

Примечания[править | править код]

  1. Jonathan James Cramer. 6 Key Responsibilities of the Invaluable Data Steward (англ.). https://www.dnb.com. Dun & Bradstreet (5 марта 2019). Дата обращения: 25 ноября 2023. Архивировано 28 марта 2019 года.
  2. Data stewardship (англ.). https://www.tudelft.nl. TU DELFT. Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.
  3. О внесении дополнений в Указ Президента Республики Казахстан от 29 декабря 2015 года № 150 «Об утверждении Реестра должностей политических и административных государственных служащих». Указы Президента Республики Казахстан. Открытые НПА (20 сентября 2021). Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.
  4. Mike Loukides. Governance and Discovery (англ.). https://www.oreilly.com/radar. O’REILLY (6 апреля 2020). Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.
  5. Н. С. Гаркуша,. 5. ОРГАНИЗАЦИЯ УПРАВЛЕНИЯ ДАННЫМИ И РОЛИ В КОМАНДЕ. Центр подготовки руководителей и команд цифровой трансформации. ВШГУ РАНХиГС (2022). Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.
  6. GEORGE FIRICAN. Understanding the different types of a data steward (англ.). https://www.lightsondata.com/. Lightsondata. Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.
  7. Anne Marie Smith. A Rose By Any Other Name – Titles In Data Governance (англ.). www.eiminstitute.org. Enterprise Information Management Institute (1 марта 2008). Дата обращения: 26 ноября 2023. Архивировано 26 ноября 2023 года.
  8. Дмитрий Дорофеев. Разрыв между производством и потреблением данных. https://habr.com. Хабр Блокчейн Паблишинг ЛТД (4 октября 2021). Дата обращения: 26 ноября 2023. Архивировано 26 ноября 2023 года.
  9. Guido De Simoni, Mark Beyer, Ankush Jain, Alan Dayley. Gartner Magic Quadrant for Metadata Management Solutions (англ.). Gartner (11 ноября 2020). Дата обращения: 25 ноября 2023. Архивировано 25 ноября 2023 года.

Литература[править | править код]

  • David Plotkin. Data Stewardship: An Actionable Guide to Effective Data Management and Data Governance. — Academic Press, 2020 ISBN 0128221674, 9780128221679
  • Mark Allen, Dalton Cervo. Multi-Domain Master Data Management: Advanced MDM and Data Governance in Practice. — Morgan Kaufmann, 2015 ISBN 0128011475, 9780128011478