Автоматическое машинное обучение

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Автоматическое машинное обучение (AutoML) — процесс автоматизации сквозного процесса применения машинного обучения к задачам реального мира. В типичном приложении машинного обучения пользователь должен применить подходящие методы предварительной обработки данных, конструирования признаков, выделения признаков и выбора признаков[en], которые делают набор данных пригодным для обучения машин. После этих шагов работник должен осуществить выбор алгоритма[en] и оптимизацию гиперпараметров для максимизации прогнозируемой производительности конечной модели. Поскольку многие из этих шагов не могут осуществить люди, не будучи экспертами, был предложен подход AutoML как основанное на искусственном интеллекте решение для всё возрастающей необходимости применения машинного обучения[1][2]. Автоматизация сквозного процесса применения машинного обучения даёт преимущество получения более простых решений, более быстрого создания таких решений и моделей, которые часто превосходят модели, построенные вручную.

Автоматическое машинное обучение может иметь целью различные стадии процесса[2]:

  • автоматическая подготовка данных[en] и сбор и сохранение данных (из сырых данных и разнообразных форматов):
    • автоматическое определение типа столбца, например, булевские данные, дискретные численные данные, непрерывные числовые значения или текст;
    • автоматическое определение смысла столбца; например, цель, метка, поле районирования, числовой признак, текстовая категория или свободный текст;
    • автоматическое обнаружение задач, например, двоичная классификация, регрессия, выделение кластеров или ранжирование;
  • автоматическое конструирование признаков:
  • автоматический выбор модели;
  • оптимизация гиперпараметров алгоритма обучения и характеризации;
  • автоматический выбор каналов по времени, памяти и ограничений сложности;
  • автоматический выбор метрик оценки и процедур валидации;
  • автоматическая проверка задач:
    • определение утечки;
    • определение ошибок в конфигурации;
  • автоматический анализ полученных результатов;
  • пользовательские результаты и визуализация для автоматического обучения машин

Примечания[править | править код]

  1. «Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms» in KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining.: 847—855. 
  2. 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. AutoML 2014 @ ICML. AutoML 2014 Workshop @ ICML. Дата обращения: 28 марта 2018.

Литература[править | править код]