Процессор в памяти: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Vald (обсуждение | вклад) →C-RAM: категория |
Нет описания правки |
||
Строка 9: | Строка 9: | ||
Заметные PIM проекты включают: проект IRAM в университете Калифорнии, Беркли; и PIM проект в Университете Нотр-Дам. |
Заметные PIM проекты включают: проект IRAM в университете Калифорнии, Беркли; и PIM проект в Университете Нотр-Дам. |
||
==C-RAM== |
==C-RAM== |
||
Строка 16: | Строка 17: | ||
В некоторых [[Чрезвычайно параллельный|чрезвычайно параллельных]] (embarrassingly parallel) вычислительных задачах уже архитектура фон Неймана ставит ограничения в виде узкого места между CPU и DRAM ([[Узкое место архитектуры фон Неймана]]). Некоторые исследователи считают, что для той же суммарной стоимости, машина, построенная в вычислительной оперативной памяти будет работать на порядок быстрее, чем в традиционных ЭВМ общего назначения на эти видах задач. |
В некоторых [[Чрезвычайно параллельный|чрезвычайно параллельных]] (embarrassingly parallel) вычислительных задачах уже архитектура фон Неймана ставит ограничения в виде узкого места между CPU и DRAM ([[Узкое место архитектуры фон Неймана]]). Некоторые исследователи считают, что для той же суммарной стоимости, машина, построенная в вычислительной оперативной памяти будет работать на порядок быстрее, чем в традиционных ЭВМ общего назначения на эти видах задач. |
||
На 2011 год, процессы изготовления чипов, "DRAM процесс" (несколько слоев; оптимизирован для высокой электрической емкости) и "CPU процесс" (многие слои; процесс оптимизирован для высокой частоты; относительно дорогой на квадратный миллиметр) отличаются достаточно сильно, так, что есть три подхода к изготовлению Вычисляющего ОЗУ: |
|||
* начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе). |
|||
* начать с системы с отдельным чипом CPU, DRAM чипов (ы), добавить небольшое количество "сопроцессор" вычислительные способности к DRAM, работающих в рамках DRAM процесс и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлилась в узкое горлышко между CPU, DRAM: ноль-заливки выделенных областей памяти, копирование больших блоков данных из одного места в другое, где найти (если есть) данный байт происходит в некоторых блок данных, и т.д. В результате система-без изменений CPU чип, и "смарт-DRAM-чип (s) - это, по крайней мере, так же быстро, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшой размер дополнительной области, как ожидается, будет более чем вернуть в сбережений в дорогих время испытаний, так как там сейчас достаточно вычислительной мощности на "умную DRAM-для пластин полного DRAM для выполнения большинства тестирования внутренне параллельно, а не традиционный подход полностью тестирования одного DRAM чипов на время с дорогим внешним автоматическое тестовое оборудование. |
|||
* начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. Проект Беркли IRAM, TOMI Technology |
|||
==См. также== |
|||
* [[Ассоциативная память]] |
|||
* [[Вычисления с памятью]] |
|||
{{Технологии CPU}} |
{{Технологии CPU}} |
||
{{Компоненты компьютера}} |
{{Компоненты компьютера}} |
||
{{Микроконтроллеры}} |
|||
[[Категория:Микропроцессоры]] |
[[Категория:Микропроцессоры]] |
Версия от 09:18, 23 июня 2012
Процессор в памяти, Processor-in-memory (PIM), или Вычисляющее ОЗУ или Computational RAM, C-RAM, также, "Вычисления в памяти", называют процессор, тесно интегрированный в память, как правило, на одном кремниевом кристалле, либо, оперативную память с интегрированными вычисляющими элементами.
Главная цель объединения процессорного компонента и компоненты памяти таким способом -- уменьшение латентности (времени отклика) памяти и увеличение пропускной способности. Достигнутое таким путем сокращение расстояния, на которое данные должны быть перенесены снижает требования к мощности системы. Большинство сложности современных процессоров (а, следовательно, и их энергопотребления) вытекает из требования избегания задержек обмена данных с памятью, и реализации этой стратегии в кремнии.
Примеры
В 1980-х годах, крошечный процессор, исполняющий программы FORTH был изготовлен в DRAM чипе для убыстрения операций PUSH и POP. FORTH является стек-ориентированным языком программирования, и это повысило его эффективность.
Транспьютер также имел большую память на чипе, учитывая, что эти чипы были изготовлены в начале 1980-х годов, это делает его, по существу, Процессором-в-памяти.
Заметные PIM проекты включают: проект IRAM в университете Калифорнии, Беркли; и PIM проект в Университете Нотр-Дам.
C-RAM
Вычисляющее ОЗУ или C-RAM - это ОЗУ с процессорными элементами, интегрированными в дизайн. Это позволяет использовать в качестве SIMD компьютера. Он также может использоваться для более эффективного использования пропускной способности памяти в памяти чипа.
Пожалуй, наиболее влиятельные, в этой области, реализации вычисляющих ОЗУ пришли из проекта IRAM в Беркли.
В некоторых чрезвычайно параллельных (embarrassingly parallel) вычислительных задачах уже архитектура фон Неймана ставит ограничения в виде узкого места между CPU и DRAM (Узкое место архитектуры фон Неймана). Некоторые исследователи считают, что для той же суммарной стоимости, машина, построенная в вычислительной оперативной памяти будет работать на порядок быстрее, чем в традиционных ЭВМ общего назначения на эти видах задач.
На 2011 год, процессы изготовления чипов, "DRAM процесс" (несколько слоев; оптимизирован для высокой электрической емкости) и "CPU процесс" (многие слои; процесс оптимизирован для высокой частоты; относительно дорогой на квадратный миллиметр) отличаются достаточно сильно, так, что есть три подхода к изготовлению Вычисляющего ОЗУ:
- начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе).
- начать с системы с отдельным чипом CPU, DRAM чипов (ы), добавить небольшое количество "сопроцессор" вычислительные способности к DRAM, работающих в рамках DRAM процесс и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлилась в узкое горлышко между CPU, DRAM: ноль-заливки выделенных областей памяти, копирование больших блоков данных из одного места в другое, где найти (если есть) данный байт происходит в некоторых блок данных, и т.д. В результате система-без изменений CPU чип, и "смарт-DRAM-чип (s) - это, по крайней мере, так же быстро, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшой размер дополнительной области, как ожидается, будет более чем вернуть в сбережений в дорогих время испытаний, так как там сейчас достаточно вычислительной мощности на "умную DRAM-для пластин полного DRAM для выполнения большинства тестирования внутренне параллельно, а не традиционный подход полностью тестирования одного DRAM чипов на время с дорогим внешним автоматическое тестовое оборудование.
- начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. Проект Беркли IRAM, TOMI Technology
См. также