DeepMind

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
DeepMind Technologies Limited
Тип

коммерческая организация

Основание

2010

Прежние названия

DeepMind Technologies, Google DeepMind

Основатели

Demis Hassabis[d], Mustafa Suleyman[d] и Shane Legg[d]

Расположение

5 New Street Square, London EC4A 3TW, UK

Отрасль

искусственный интеллект

Число сотрудников
  • 400 чел.[1]
Материнская компания

Alphabet Inc.

Сайт

deepmind.com

DeepMind Technologies Limited, или DeepMind, — британская компания, занимающаяся искусственным интеллектом. Основана в 2010 году в Лондоне под названием DeepMind Technologies. В 2014 году была приобретена Google.

Компания получила известность благодаря разработке компьютерной системы AlphaGo, победившей профессионального игрока в го[2]. DeepMind создала нейронную сеть способную научиться играть в видеоигры на уровне человека[3].

История[править | править вики-текст]

В 2010 году Демис Хассабис, Шейн Легг, Мустафа Сулейман основали стартап DeepMind Technologies[4]. До того Хассабис и Легг уже были знакомы по Университетскому Колледжу Лондона, где работали в подразделении вычислительной нейробиологии Gatsby (Gatsby Computational Neuroscience Unit, www.gatsby.ucl.ac.uk)[5].

В компанию вложились большие венчурные фонды Horizons Ventures, Founders Fund[6], а также энтрепренеры Скотт Банистер[7] и Илон Маск[8]. Ян Таллинн был одним из ранних инвесторов и советников компании[9].

В 2014 DeepMind получила награду «Компания года» от Компьютерной лаборатории Кембриджского университета[10].

26 января 2014 года Google объявил о приобретении DeepMind Technologies[11]. По разным сообщениям сумма сделки составила от 400 до 650 миллионов долларов[12][13][14][15]. Сообщается, что сделка состоялась после того, как Facebook прекратил переговоры о покупке DeepMind Technologies в 2013 году[16]. Одним из условий сделки DeepMind с Google было создание последней коллегии по этическим проблемам искусственного интеллекта[17].

После покупки Google компания стала называться Google DeepMind.

В начале сентября 2016 года компания перешла в родительскую компанию Google — Alphabet, а из её названия исчезло упоминание Google, теперь она известна как DeepMind Technologies Limited или же DeepMind. Также веб-сайт компании сменил дизайн.

Направление исследований[править | править вики-текст]

Цель компании — «решить проблему интеллекта»[18]. Для этого они используют «лучшие технологии, начиная от машинного обучения и заканчивая системной психофизиологией, чтобы создать в итоге обучающиеся алгоритмы общего назначения»[18]. Также они работают над формализацией интеллекта[19] для того, чтобы не только реализовать его в машинах, но и чтобы понять, как работает мозг человека. По словам Демиса Хассабиса[20]:

« ... попытка извлечь сущность интеллекта в виде алгоритмической конструкции может оказаться наилучшим способом понять самые глубокие тайны нашего ума. »

Решение проблемы интеллекта DeepMind видит в создании универсальных самообучающихся интеллектуальных агентов, которые были бы способны автономно обучаться на необработанных входных данных и были бы пригодны для решения любых задач в отличие от «ограниченных ИИ», таких как Deep Blue или IBM Watson, решающих только одну предопределённую задачу. В качестве основного подхода к построению интеллектуальных агентов выбрано обучение с подкреплением[21].

В настоящий момент компания занимается исследованиями в области компьютерных систем, которые умеют играть в различные игры — от стратегических игр вроде го до компьютерных аркад. Шейн Легг утверждает, что искусственный интеллект сможет достичь уровня человека, «когда машина научится играть в широкий класс игр, используя только входной и выходной сигналы потока восприятия, и переносить понимание из игры в игру...»[22]. Демис Хассабис объясняет фокус на играх, а не на более традиционной робототехнике, тем, что «роботы — дорогие, медленные и часто ломаются... исследователь отвлекается на починку механических деталей робота...»[21]. Сообщается, что Google купил компанию именно после публикации исследования об ИИ, успешно играющего в семь различных Atari-игр (Pong, Breakout, Space Invaders, Seaquest, Beamrider, Enduro, Q*bert)[3].

Нейронная машина Тьюринга[править | править вики-текст]

В 2014 году DeepMind опубликовал архитектуру гибридной нейронной сети, состоящую из рекуррентной нейросети и внешней памяти[23][24]. Нейросеть использует внешнюю память для записи и последующего чтения информации так же, как это делает машина Тьюринга, по этой причине архитектуре дали название «Нейронная машина Тьюринга» (Neural Turing Machine). По замыслу исследователей Нейронная машина Тьюринга имитирует кратковременную память человека и позволяет понять принципы её работы. В экспериментах нейросеть успешно обучалась простым алгоритмам: копирование, сортировка, ассоциативная память.

Глубинное обучение с подкреплением в видеоиграх[править | править вики-текст]

DeepMind представил систему ИИ, которая способна обучиться играть в классические игры 70-80-ых гг. для игровой консоли Atari 2600[25][26][27][28][29]. В исследовании ИИ обучался игре в 49 видеоигр. В результате был достигнут уровень игры сравнимый с уровнем человека, а в 22 играх система смогла превзойти человека. ИИ DeepMind не запрограммирован жестко под конкретную игру. В начале обучения система ничего не знает о правилах игры и учится играть самостоятельно, используя на входе только пиксельное изображение игры и информацию об очках, получаемых в ходе игры.

В основе ИИ лежит подход, который DeepMind называет глубинным обучением с подкреплением, или deep Q-network (DQN)[25][27]. Это вариация обучения с подкреплением без модели с применением Q-обучения, в котором функция полезности моделируется с помощью глубинной нейронной сети. В качестве архитектуры нейросети выбрана свёрточная нейронная сеть, в настоящее время эта архитектура эффективно применяется для распознавания изображений.

В планах DeepMind научить ИИ, построенного на тех же принципах, играть в более сложные 3D игры 90-ых, такие как Doom и гоночные симуляторы[21]. В феврале 2016 были представлены первые результаты обучения ИИ 3D играм[30][31]. ИИ смог обучиться управлению машиной в 3D гоночном симуляторе TORCS[32], поиску выхода и призов в Doom-подобном 3D лабиринте Labyrinth [33], выполнению простых задач (локомоция, поддержание равновесия, манипуляция предметами) в физическом симуляторе MuJoCo (www.mujoco.org)[34]. Как и прежде на вход ИИ подавалось только пиксельное изображение «мира». Архитектура нейросети была расширена добавлением LSTM, разновидности рекуррентной нейронной сети.

Игра в го[править | править вики-текст]

В октябре 2015 программа для игры в го AlphaGo[35], разработанная DeepMind, победила чемпиона Европы по го Фань Хуэя (2-ой дан) со счётом 5—0[2]. О новости было объявлено только 27 января 2016 года одновременно с публикацией статьи в журнале Nature[2].

Это первый в истории случай, когда ИИ выиграл в го у профессионала[36], до AlphaGo все известные ИИ играли в го только на любительском уровне. Го считается игрой, в которую компьютеру выиграть достаточно тяжело (в сравнении с аналогичными играми, например, c шахматами) в виду большого количества вариантов ходов, из-за этого традиционный для ИИ метод перебора ходов практически неприменим[2][37]. В марте 2016 года программа выиграла матч у одного из сильнейших гоистов мира Ли Седоля со счетом 4-1.

Другие направления[править | править вики-текст]

Публикации DeepMind затрагивают следующие темы[38]: понимание естественного языка машинами[39], генерация изображений по шаблону с помощью нейронных сетей[40], распознавание речи, алгоритмы обучения нейронных сетей.

DeepMind Health[править | править вики-текст]

DeepMind Health — подразделение DeepMind, работающее в области искусственного интеллекта в медицине[41][42][43]. О его открытии было объявлено 24 февраля 2016 года на веб-сайте компании. Подразделение возглавляет Мустафа Сулейман.

В своей работе DeepMind Health будет сотрудничать с Национальной службой здравоохранения Великобритании. DeepMind Health планирует предоставлять врачам техническую экспертизу для разработки и совершенствования технологий по уходу за пациентами. Особое внимание будет уделяться безопасности данных пациентов и конфиденциальности. Деятельность подразделения будет проверяться советом из независимых экспертов, в число которых входит Ричард Хортон (англ.), редактор авторитетного журнала по медицине The Lancet.

В настоящее время DeepMind Health работает над созданием электронных инструментов, упрощающих работу врача. Было представлено приложение для смартфона, позволяющее более точно диагностировать острую почечную недостаточность. Также DeepMind купил медицинское приложение, таск-менеджер для врачей. Команда врачей из Имперского колледжа Лондона, создавшая его, присоединяется к DeepMind Health. Сумма сделки не разглашается.

Сотрудничество с университетами[править | править вики-текст]

В 2014 году DeepMind начинает сотрудничество с Оксфордским университетом[44][45]. DeepMind нанимает две передовые команды из Оксфорда, работающих в области искусственного интеллекта. Это команда ведущих экспертов мира по применению глубинного обучения в области понимания естественного языка машинами: профессора Нандо Де Фрейтас и Фил Блансом, доктора Эдвард Грефенстетт и Карл Мориц. И команда одних из ведущих экспертов мира в области машинного зрения: доктора Карэн Симоньян и Макс Яденберг, профессор Эндрю Зиссерман. В рамках сотрудничества факультет компьютерных наук и факультет инженерных наук получат существенное финансирование от Google. Также DeepMind планирует программу студенческих стажировок, чтение лекций и проведение семинаров для студентов.

С DeepMind работают учёные и из других университетов. Дэвид Сильвер, соавтор статьи о AlphaGo[46] и еще многих публикаций DeepMind об обучении с подкреплением, читает лекции в Университетском Колледже Лондона[47]. Некоторые публикации DeepMind написаны в соавторстве с учёными из следующих организаций[38]: Торонтский университет, Монреальский университет, Австралийский национальный университет, Амстердамский университет, Калифорнийский университет в Беркли, INRIA.

Сотрудничество с Blizzard Entertainment[править | править вики-текст]

На ежегодном фестивале Blizzcon 2016 компания Blizzard, которая является инициатором данного мероприятия, объявила о своем сотрудничестве с компанией DeepMind. Затем об этом событии была опубликована статья на официальных блогах обеих компаний[48][49]. Целью данного сотрудничества является внедрение и обучение ИИ в игре Starcraft II. По мнению разработчиков игры — Starcraft II является идеальной средой для обучения искусственного интеллекта, поскольку сложные правила игры достаточно отражают сложность и многогранность реального мира.

« StarCraft II — идеальная среда, которая позволит вывести исследования, связанные с созданием искусственного интеллекта, на новый уровень. Сложные правила игры в достаточной мере отражают многогранность и хаотичность реального мира. Сначала вы учитесь добывать ресурсы, затем возводить простые строения, исследовать карту и искать противника. Стоит производить больше боевых единиц или лучше будет укрепить оборонительный рубеж? Будете вы совершать атаки на раннем этапе или сосредоточитесь на развитии? »

В данный момент ведется работа над «Starcraft 2 API», которая позволяет ИИ полностью взаимодействовать с интерфейсом игры, принять участие в разработке может любой желающий, для таковых были опубликованы технические задачи[50], которые планируется реализовать в первом квартале 2017 года. Сам ИИ будет обучаться, просматривая повторы других игроков, которые принимали участие в рейтинговых играх.

О том, когда появится ИИ в самой игре Starcraft II, пока не известно.

Примечания[править | править вики-текст]

  1. 1 2 Alphabet's DeepMind unit could be expanded to 1,000 people
  2. 1 2 3 4 Google achieves AI 'breakthrough' by beating Go champion - BBC News (en-GB). BBC News. Проверено 8 февраля 2016.
  3. 1 2 The Physics arXiv Blog. The Last AI Breakthrough DeepMind Made Before Google Bought It For $400m: The end is nigh. Humans have lost another key battle in the war against computer domination. Medium (29 января 2014). Проверено 8 февраля 2016.
  4. Amy Thomson. Google Buys U.K. Artificial Intelligence Company DeepMind. Bloomberg.com. Проверено 8 февраля 2016.
  5. Gibbs, Samuel. Demis Hassabis: 15 facts about the DeepMind Technologies founder (en-GB), The Guardian (28 января 2014). Проверено 8 февраля 2016.
  6. Davies, Sally. DeepMind buy heralds rise of the machines, Financial Times (27 января 2014). Проверено 8 февраля 2016.
  7. "DeepMind Technologies Investors".
  8. Elon Musk: Artificial Intelligence 'Potentially More Dangerous Than Nukes'. International Business Times UK. Проверено 8 февраля 2016.
  9. Exclusive: Google to Buy Artificial Intelligence Startup DeepMind for $400M. Re/code. Проверено 8 февраля 2016.
  10. Computer Laboratory: Hall of Fame Awards. www.cl.cam.ac.uk. Проверено 8 февраля 2016.
  11. Google to buy artificial intelligence company DeepMind, Reuters (27 января 2014). Проверено 8 февраля 2016.
  12. Computers, gaming // The Economist. — ISSN 0013-0613.
  13. Catherine Shu. Google Acquires Artificial Intelligence Startup DeepMind For More Than $500M. TechCrunch. Проверено 8 февраля 2016.
  14. Google to buy artificial intelligence company DeepMind, Reuters (27 января 2014). Проверено 8 февраля 2016.
  15. Gibbs, Samuel. Google buys UK artificial intelligence startup Deepmind for £400m (en-GB), The Guardian (27 января 2014). Проверено 8 февраля 2016.
  16. Google Beat Facebook for DeepMind, Creates Ethics Board. The Information. Проверено 8 февраля 2016.
  17. Inside Google's Mysterious Ethics Board. Forbes. Проверено 8 февраля 2016.
  18. 1 2 Google DeepMind. deepmind.com. Проверено 8 февраля 2016.
  19. Legg, Shane; Veness, Joel (29 September 2011). "An Approximation of the Universal Intelligence Measure".
  20. Hassabis, Demis (23 February 2012). "Model the brain's algorithms".
  21. 1 2 3 Royal Television Society. Public Lecture with Google DeepMind's Demis Hassabis (19 ноября 2015). Проверено 8 февраля 2016.
  22. Q&A with Shane Legg on risks from AI - Less Wrong. lesswrong.com. Проверено 8 февраля 2016.
  23. Alex Graves, Greg Wayne, Ivo Danihelka Neural Turing Machines // arXiv:1410.5401 [cs]. — 2014-10-20.
  24. Best of 2014: Google's Secretive DeepMind Startup Unveils a "Neural Turing Machine". MIT Technology Review. Проверено 8 февраля 2016.
  25. 1 2 DQN | Google DeepMind. deepmind.com. Проверено 10 февраля 2016.
  26. Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A. Rusu, Joel Veness Human-level control through deep reinforcement learning (англ.) // Nature. — 2015-02-26. — Vol. 518, iss. 7540. — P. 529–533. — ISSN 0028-0836. — DOI:10.1038/nature14236.
  27. 1 2 Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou Playing Atari with Deep Reinforcement Learning // arXiv:1312.5602 [cs]. — 2013-12-19.
  28. From Pixels to Actions: Human-level control through Deep Reinforcement Learning (en-US). Research Blog. Проверено 8 февраля 2016.
  29. DeepMind's AI is an Atari gaming pro now (Wired UK). Wired UK. Проверено 8 февраля 2016.
  30. Volodymyr Mnih, Adrià Puigdomènech Badia, Mehdi Mirza, Alex Graves, Timothy P. Lillicrap Asynchronous Methods for Deep Reinforcement Learning // arXiv:1602.01783 [cs]. — 2016-02-04.
  31. Jacob Aron. Google DeepMind AI navigates a Doom-like 3D maze just by looking (en-US). New Scientist. Проверено 14 февраля 2016.
  32. DeepMind. Asynchronous Methods for Deep Reinforcement Learning: TORCS (4 февраля 2016). Проверено 14 февраля 2016.
  33. DeepMind. Asynchronous Methods for Deep Reinforcement Learning: Labyrinth (4 февраля 2016). Проверено 14 февраля 2016.
  34. DeepMind. Asynchronous Methods for Deep Reinforcement Learning: MuJoCo (4 февраля 2016). Проверено 14 февраля 2016.
  35. AlphaGo | Google DeepMind. deepmind.com. Проверено 10 февраля 2016.
  36. Tual, David Larousserie et Morgane. Première défaite d’un professionnel du go contre une intelligence artificielle (фр.), Le Monde.fr. Проверено 8 февраля 2016.
  37. AlphaGo: Mastering the ancient game of Go with Machine Learning. Research Blog. Проверено 8 февраля 2016.
  38. 1 2 Publications | Google DeepMind. deepmind.com. Проверено 10 февраля 2016.
  39. Karl Moritz Hermann, Tomáš Kočiský, Edward Grefenstette, Lasse Espeholt, Will Kay Teaching Machines to Read and Comprehend // arXiv:1506.03340 [cs]. — 2015-06-10.
  40. Ivo Danihelka. DRAW: A Recurrent Neural Network For Image Generation by Google DeepMind (17 сентября 2015). Проверено 10 февраля 2016.
  41. Health | Google DeepMind. deepmind.com. Проверено 27 февраля 2016.
  42. Francisco, Sarah Boseley Paul Lewis in San. Smart care: how Google DeepMind is working with NHS hospitals (en-GB), The Guardian (24 февраля 2016). Проверено 27 февраля 2016.
  43. Jack Clark. Google's DeepMind Forms Health Unit to Build Medical Software. Bloomberg.com. Проверено 27 февраля 2016.
  44. Teaming up with Oxford University on Artificial Intelligence (en-US). Google Europe Blog. Проверено 10 февраля 2016.
  45. University of Oxford teams up with Google DeepMind on artificial intelligence. Department of Computer Science. Проверено 10 февраля 2016.
  46. David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre Mastering the game of Go with deep neural networks and tree search (англ.) // Nature. — 2016-01-28. — Vol. 529, iss. 7587. — P. 484–489. — ISSN 0028-0836. — DOI:10.1038/nature16961.
  47. David Silver. www0.cs.ucl.ac.uk. Проверено 10 февраля 2016.
  48. DeepMind and Blizzard to release StarCraft II as an AI research environment | DeepMind. DeepMind. Проверено 11 ноября 2016.
  49. BlizzCon: DeepMind и самообучающийся ИИ в StarCraft II (ru-RU). StarCraft II. Проверено 11 ноября 2016.
  50. StarCraft II API -- Technical Design - StarCraft II Forums. us.battle.net. Проверено 11 ноября 2016.