CRISP-DM

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

CRISP-DM (Cross-Industry Standard Process for Data Mining[1]  (англ.) — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая [2] [3] [4] методология по исследованию данных.

Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед [5].

Первая версия этой методологии была представлена на четвёртом по счёту мероприятии под названием CRISP-DM SIG Workshop в Брюсселе в марте 1999[6], а пошаговая инструкция была опубликована годом позже.[7]

Фазы цикла исследования данных[править | править код]

Жизненный цикл исследования данных
  1. Понимание бизнес-целей (Business Understanding)
  2. Начальное изучение данных (Data Understanding)
  3. Подготовка данных (Data Preparation)
  4. Моделирование (Modeling)
  5. Оценка (Evaluation)
  6. Внедрение (Deployment)

См. также[править | править код]

Ссылки[править | править код]

  1. Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
  2. Poll: What main methodology are you using for data mining?. www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  3. Poll: Data Mining Methodology. www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  4. What main methodology are you using for your analytics, data mining, or data science projects? Poll. www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  5. Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.
  6. Pete Chapman (1999); The CRISP-DM User Guide.
  7. Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); CRISP-DM 1.0 Step-by-step data mining guide.
  8. CRISP-DM методология на сайте открытого университета "Интуит". Data Mining: Информация. ИНТУИТ.