Тензорный процессор Google

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Тензорный процессор Google (Google Tensor Processing Unit, Google TPU) — тензорный процессор, относящийся к классу нейронных процессоров, являющийся специализированной интегральной схемой, разработанной корпорацией Google и предназначенной для использования с библиотекой машинного обучения TensorFlow. Представлен в 2016 году на конференции Google I/O, при этом утверждалось, что устройства к тому моменту уже использовались внутри корпорации Google более года[1][2].

Описание[править | править код]

По сравнению с графическими процессорами, рассчитан на более высокий объём вычислений с уменьшенной точностью (например, всего 8-разрядную точность[3]) при более высоких производительности на ватт и отсутствие модуля для растеризации и текстурных блоков[1][2].

Утверждается, что тензорные процессоры применялись в серии игр в го программы AlphaGo против Ли Седоля[2] и в следующих подобных поединках[4]. Также корпорация применила тензорные процессоры для обработки фотографий Google Street View на предмет извлечения текста, сообщалось, что весь объём обработан менее чем за пять дней. В Google Фото один тензорный процессор может обрабатывать более 100 миллионов фотографий в день. Также устройство применяется для самообучающейся системы RankBrain, обрабатывающей отклики поисковой системы Google.

Архитектура[править | править код]

Устройство реализовано как матричный умножитель для 8-разрядных чисел, управляемый CISC-инструкциями центрального процессора по шине PCIe 3.0. Изготавливается по технологии 28 нм, тактовая частота составляет 700 МГц и имеет тепловую расчётную мощность 28—40 Вт. Оснащается 28 Мбайт встроенной оперативной памяти и 4 Мбайт 32-разрядных аккумуляторов, накапливающих результаты в массивах из 8-битных множителей, организованных в матрицу размером 256×256. Инструкции устройства передают данные на узел или получают их из него, выполняют матричные умножения или свёртки[5]. В такт может производиться 65536 умножений на каждой матрице; в секунду — до 92 трлн[6].

Примечания[править | править код]

  1. 1 2 Google's Tensor Processing Unit explained: this is what the future of computing looks like (англ.).
  2. 1 2 3 Jouppi, Norm Google supercharges machine learning tasks with TPU custom chip (англ.). Google Cloud Platform Blog. Google (May 18, 2016). Дата обращения 22 января 2017.
  3. Armasu, Lucian Google's Big Chip Unveil For Machine Learning: Tensor Processing Unit With 10x Better Efficiency (Updated). Tom's Hardware (19 мая 2016). Дата обращения 26 июня 2016.
  4. The Future of Go Summit, Match One: Ke Jie & AlphaGo на YouTube, начиная с 6:03:10 (23 мая 2017)
  5. Norman P. Jouppi et al. In-Datacentre Performance Analysis of a Tensor Processing Unit (англ.). (44th International Symposium on Computer Architecture (ISCA), 2017)
  6. Ian Cutress. Hot Chips: Google TPU Performance Analysis Live Blog (3pm PT, 10pm UTC) (англ.), AnandTech (August 22, 2017). Дата обращения 23 августа 2017.

Ссылки[править | править код]