SW26010

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

SW26010 — 260-ядерный процессор, спроектированный китайским Национальным центром по проектированию высокопроизводительных интегральных микросхем в Шанхае[1]. В процессоре реализована 64-битная RISC-микроархитектура ShenWei, разработанная в Китае. SW26010 состоит из 4 групп (называемых кластерами) по 64 «вычислительно-процессорных элемента» (compute-processing elements, CPE), расположенных в виде матрицы 8×8 элементов. CPE исполняют SIMD-инструкции и могут выполнять за один цикл 8 операций над числами с плавающей запятой одинарной точности. Каждый кластер сопровождается более традиционным ядром общего назначения, называемым «управляющим процессорным элементом» (management processing element, MPE), и обеспечивающим функции мониторинга и управления[1]. Каждый кластер имеет свой собственный контроллер памяти DDR3 SDRAM и банк памяти (англ. memory bank) со своим собственным адресным пространством[2][3]. Процессор работает с тактовой частотой 1,45 ГГц[4].

Каждый CPE обладает внутренней сверхоперативной памятью (англ. scratchpad memory) размером 64 Кб для данных и 16 Кб для инструкций, и соединены посредством сети-на-кристалле (англ. network on a chip), вместо традиционной иерархии кеш-памяти (англ. cache hierarchy)[5][6]. MPE имеет более традиционную схему с 32 Кб кеш-памяти 1-го уровня для данных и инструкций и 256 Кб кеш-памяти 2-го уровня[1]. Сеть-на-кристалле соединена с единым внутрисистемным интерфейсом, который соединяет микросхему с внешним миром.

SW26010 применяются в суперкомпьютере Sunway TaihuLight, который с ноября 2016 года занял 1-е место по производительности в рейтинге TOP500[7]. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.

Примечания[править | править код]

  1. 1 2 3 Dongarra, Jack Report on the Sunway TaihuLight System. www.netlib.org (June 20, 2016).
  2. Fu, H H (2016). «The Sunway TaihuLight Supercomputer: System and Applications». Sci. China Inf. Sci.. DOI:10.1007/s11432-016-5588-7.
  3. Trader, Tiffany China Debuts 93-Petaflops ‘Sunway’ with Homegrown Processors. HPC Wire (June 19, 2016). — «Each core of the CPE has a single floating point pipeline that can perform 8 flops per cycle per core (64-bit floating point arithmetic) and the MPE has a dual pipeline each of which can perform 8 flops per cycle per pipeline (64-bit floating point arithmetic)».
  4. Hemsoth, Nicole A Look Inside China's Chart-Topping New Supercomputer. The Next Platform (20 июня 2016).
  5. Lendino, Jamie Meet the new world’s fastest supercomputer: China’s TaihuLight. Extremetech (20 June 2016). — «"The TOP500 report said that the chip also lacks any traditional L1-L2-L3 cache, and instead has 12KB of instruction cache and 64KB “local scratchpad” that works sort of like an L1 cache."».
  6. https://www.researchgate.net/profile/Yi_Chao_Wang/publication/311614249_Porting_and_Optimizing_GTC-P_on_TaihuLight_Supercomputer_with_Sunway_OpenACC/links/5850e4c708ae8f373819491e.pdf
  7. Top 500 The List: November 2016. TOP 500 (14 November 2016).