Разведочный анализ данных

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Разведочный анализ данных (РАД, Exploratory data analysis (EDA)) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей. Термин EDA был введен математиком Джоном Тьюки, который сформулировал цели РАД следующим образом:

  • максимальное "проникновение" в данные
  • выявление основных структур
  • выбор наиболее важных переменных
  • обнаружение отклонений и аномалий
  • проверка основных гипотез
  • разработка начальных моделей

К основным инструментам РАД относятся: