Процессор в памяти: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Строка 22: Строка 22:
* начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе).
* начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе).


* начать с системы с отдельным чипом CPU, DRAM чипов (ы), добавить небольшое количество "сопроцессор" вычислительные способности к DRAM, работающих в рамках DRAM процесс и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлилась в узкое горлышко между CPU, DRAM: ноль-заливки выделенных областей памяти, копирование больших блоков данных из одного места в другое, где найти (если есть) данный байт происходит в некоторых блок данных, и т.д. В результате система-без изменений CPU чип, и "смарт-DRAM-чип (s) - это, по крайней мере, так же быстро, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшой размер дополнительной области, как ожидается, будет более чем вернуть в сбережений в дорогих время испытаний, так как там сейчас достаточно вычислительной мощности на "умную DRAM-для пластин полного DRAM для выполнения большинства тестирования внутренне параллельно, а не традиционный подход полностью тестирования одного DRAM чипов на время с дорогим внешним автоматическое тестовое оборудование.
* начать с системы с отдельным чипом CPU и DRAM чипом(-ами), добавить небольшое количество "сопроцессорной" вычислительных функций к DRAM, работая в рамках DRAM процесса и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлились в узкое горлышко между CPU и DRAM: обнуление выделенных областей памяти, копирование больших блоков данных из одного места в другое, поиск где есть (если есть) заданный байт в некотором блоке данных, и т.д. В результате система - без изменений CPU чипа, и со "смарт-DRAM-чипом(ами)" - по крайней мере, так же быстра, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшого размера дополнительной области, как ожидается, будет более чем возвращена во счет экономии дорогих (т.к. долгих) проверок памяти, так как на смарт-DRAM сейчас достаточно вычислительной мощности - для пластин кремния ("вафель") полных DRAM-ами для выполнения большинства проверок на памяти внутренне и параллельно, а не традиционным подходом полных проверок одного DRAM чипа за раз с использованием дорогого внешнего автоматического тестирующего оборудования.


* начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. Проект Беркли IRAM, TOMI Technology
* начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. Проект Беркли IRAM, TOMI Technology




==См. также==
==См. также==

Версия от 09:33, 23 июня 2012

Процессор в памяти, Processor-in-memory (PIM), или Вычисляющее ОЗУ или Computational RAM, C-RAM, также, "Вычисления в памяти", называют процессор, тесно интегрированный в память, как правило, на одном кремниевом кристалле, либо, оперативную память с интегрированными вычисляющими элементами.

Главная цель объединения процессорного компонента и компоненты памяти таким способом -- уменьшение латентности (времени отклика) памяти и увеличение пропускной способности. Достигнутое таким путем сокращение расстояния, на которое данные должны быть перенесены снижает требования к мощности системы. Большинство сложности современных процессоров (а, следовательно, и их энергопотребления) вытекает из требования избегания задержек обмена данных с памятью, и реализации этой стратегии в кремнии.

Примеры

В 1980-х годах, крошечный процессор, исполняющий программы FORTH был изготовлен в DRAM чипе для убыстрения операций PUSH и POP. FORTH является стек-ориентированным языком программирования, и это повысило его эффективность.

Транспьютер также имел большую память на чипе, учитывая, что эти чипы были изготовлены в начале 1980-х годов, это делает его, по существу, Процессором-в-памяти.

Заметные PIM проекты включают: проект IRAM в университете Калифорнии, Беркли; и PIM проект в Университете Нотр-Дам.


C-RAM

Вычисляющее ОЗУ или C-RAM - это ОЗУ с процессорными элементами, интегрированными в дизайн. Это позволяет использовать в качестве SIMD компьютера. Он также может использоваться для более эффективного использования пропускной способности памяти в памяти чипа.

Пожалуй, наиболее влиятельные, в этой области, реализации вычисляющих ОЗУ пришли из проекта IRAM в Беркли.

В некоторых чрезвычайно параллельных (embarrassingly parallel) вычислительных задачах уже архитектура фон Неймана ставит ограничения в виде узкого места между CPU и DRAM (Узкое место архитектуры фон Неймана). Некоторые исследователи считают, что для той же суммарной стоимости, машина, построенная в вычислительной оперативной памяти будет работать на порядок быстрее, чем в традиционных ЭВМ общего назначения на эти видах задач.

На 2011 год, процессы изготовления чипов, "DRAM процесс" (несколько слоев; оптимизирован для высокой электрической емкости) и "CPU процесс" (многие слои; процесс оптимизирован для высокой частоты; относительно дорогой на квадратный миллиметр) отличаются достаточно сильно, так, что есть три подхода к изготовлению Вычисляющего ОЗУ:

  • начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе).
  • начать с системы с отдельным чипом CPU и DRAM чипом(-ами), добавить небольшое количество "сопроцессорной" вычислительных функций к DRAM, работая в рамках DRAM процесса и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлились в узкое горлышко между CPU и DRAM: обнуление выделенных областей памяти, копирование больших блоков данных из одного места в другое, поиск где есть (если есть) заданный байт в некотором блоке данных, и т.д. В результате система - без изменений CPU чипа, и со "смарт-DRAM-чипом(ами)" - по крайней мере, так же быстра, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшого размера дополнительной области, как ожидается, будет более чем возвращена во счет экономии дорогих (т.к. долгих) проверок памяти, так как на смарт-DRAM сейчас достаточно вычислительной мощности - для пластин кремния ("вафель") полных DRAM-ами для выполнения большинства проверок на памяти внутренне и параллельно, а не традиционным подходом полных проверок одного DRAM чипа за раз с использованием дорогого внешнего автоматического тестирующего оборудования.
  • начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. Проект Беркли IRAM, TOMI Technology

См. также


Шаблон:Компоненты компьютера