Kaggle

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Kaggle
Kaggle logo.png
URL kaggle.com​ (англ.)
Тип сайта бизнес и Конкурсная платформа по исследованию данных[d]
Владелец Alphabet
Автор Энтони Голдблум
Начало работы апрель 2010
Слоган The Home of Data Science
Рейтинг Alexa 5384[1]

Kaggle — система организации конкурсов по исследованию данных, а также социальная сеть специалистов по обработке данных и машинному обучению. Принадлежит корпорации Google (с марта 2017 года)[2][3][4].

Среда организована как публичная веб-платформа, на которой пользователи и организации могут публиковать наборы данных, исследовать и создавать модели, взаимодействовать с другими специалистами по данным и инженерами по машинному обучению, организовывать конкурсы по исследованию данных и участвовать в них. В системе размещены наборы открытых данных, предоставляются облачные инструменты для обработки данных и машинного обучения. Также реализованы обучающие ресурсы, имеется раздел для размещения вакансий работодателями, где тоже возможна организация конкурсов для отбора наилучших кандидатов.

В июне 2017 года заявлено о миллионном зарегистрированном пользователе (пользователей в системе называют «кэгглерами» — kagglers), среди участников как начинающие специалисты, так и крупные исследователи данных[5].

Конкурсы[править | править код]

Типичная схема организации конкурса Kaggle:

  • ведущий конкурса (как правило, крупная коммерческая организация) готовит данные и описание проблемы;
  • участники экспериментируют с различными методами и соревнуются друг с другом, чтобы создать лучшие модели; работа распределяется публично через Kaggle Kernels, результаты автоматически оцениваются (на основе точности относительно контрольного набора или известного решения), что влияет на рейтинг участника;
  • по истечении установленного срока организатор конкурса выплачивает призовой фонд в обмен на «всемирную, бессрочную, безотзывную и бесплатную лицензию на использование выигравшей заявки», то есть разработанный алгоритм, программное обеспечение и соответствующую интеллектуальную собственность.

Кроме публичных конкурсов также организуются закрытые соревнования, в которых участвуют только специалисты с определённым рейтингом Kaggle. Кроме того, предлагается бесплатный инструмент для учителей информатики для проведения академических соревнований по машинному обучению (Kaggle In Class).

Всего проведено более сотни публичных конкурсов по машинному обучению, среди них соревнования по улучшению распознавания жестов для Microsoft Kinect[6], конкурс по совершенствованию системы поиска бозона Хиггса в ЦЕРНе[7].

Результаты некоторых конкурсов вылились в крупные проекты, среди них — технологии исследований ВИЧ[8], шахматные рейтинги[9], прогнозирование загруженности магистралей[10]. Среди участников конкурсов — Джеффри Хинтон и Джордж Даль, выигравшие с использованием глубоких нейронных сетей соревнование корпорации Merck; их результат, наряду с победой ученика Хинтона Влада Мних на конкурсе Adzuna, послужил признанию глубокого обучения как универсальной техники, в дальнейшем широко распространившейся среди других участников соревнований. На основе результатов, полученных на соревнованиях Kaggle, было опубликовано несколько научных работ[11][12]

Примечания[править | править код]

  1. Alexa Internet (англ.) — 1996.
  2. Lardinois, Frederic. Google is acquiring data science community Kaggle. Techcrunch (March 8, 2017). — «Sources tell us that Google is acquiring Kaggle [...] the official announcement could come as early as tomorrow.». Дата обращения: 9 марта 2017. Архивировано 9 марта 2017 года.
  3. Google buys Kaggle and its gaggle of AI geeks (англ.), CNET (8 March 2017). Дата обращения 1 июня 2018.
  4. Welcome Kaggle to Google Cloud (англ.), Google Cloud Platform Blog. Дата обращения 19 августа 2018.
  5. Markoff. Scientists See Advances in Deep Learning, a Part of Artificial Intelligence (англ.). Дата обращения 19 августа 2018.
  6. Byrne. Kaggle launches competition to help Microsoft Kinect learn new gestures, VentureBeat (December 12, 2011). Дата обращения 13 декабря 2011.
  7. The machine learning community takes on the Higgs, Symmetry Magazine (July 15, 2014). Дата обращения 14 января 2015.
  8. Carpenter. May the Best Analyst Win, Science Magazine (February 2011). Дата обращения 1 апреля 2011.
  9. Sonas. The Deloitte/FIDE Chess Rating Challenge, Chessbase (20 February 2011). Дата обращения 3 мая 2011.
  10. Foo. Smartphones to predict NSW travel times?, The Australian (April 6, 2011). Дата обращения 3 мая 2011.
  11. "NIPS 2014 Workshop on High-energy Physics and Machine Learning".. 
  12. Athanasopoulos. The Value of Feedback in Forecasting Competitions, International Journal of Forecasting, С. 845–849.

Литература[править | править код]