NAS Parallel Benchmarks

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
NAS Parallel Benchmarks
Тип

промышленный бенчмарк

Разработчик

NASA Advanced Supercomputing Division

Написана на

Фортран, Си

Первый выпуск

1991 (1991)

Аппаратная платформа

кросс-платформенная

Последняя версия

3.3.1

Сайт

nas.nasa.gov/Software/NPB/

NAS Parallel Benchmarks — набор тестов производительности нацеленных на проверку возможностей высокопараллельных суперкомпьютеров. Они были разработаны в начале 1990-х в рамках программы NASA Numerical Aerodynamic Simulation Program[1] и поддерживаются в NASA Advanced Supercomputing (NAS) Division, расположенном в NASA Ames Research Center.

История[править | править вики-текст]

Более ранние, чем NPB, пакеты тестовых программ, такие как Livermore loops, LINPACK Benchmark и NAS Kernel Benchmark Program, были ориентированны на векторные компьютеры. Многие из них быстро стали неадекватны, в том числе из-за ограничений, связанный с настройкой наведённого параллелизма, и недостаточного размера проблем, которые не соответствовали параллельным системам. Также плохо для них подходили и промышленные приложения, работающие в режиме оценки производительности, из-за большой стоимости портирования их на параллельную систему и невозможности автоматического их распараллеливания на большие системы.

Набор тестов NAS Parallel Benchmarks был разработан в 1991-1992 годах в NASA Ames[1]. Целью создания пакета тестов стала возможность оценить производительность суперкомпьютеров за несколько часов. В пакет вошли вычислительные ядра, наиболее часто возникавшие при численном моделировании полета космического аппарата при решении задач гидро- и аэродинамики[1].

Изначально создателями NPB был создан набор правил и рекомендаций для реализации тестов, задающая допустимые языки программирования, алгоритмы, размерности данных, ограничения на распараллеливание, организации ввода и вывода данных, замера времени и публикации результатов. В первой выпущенной версии, NPB 1, было определено 8 тестов (EP, MG, CG, FT, LU, SP, BT[2]) и предоставлялись примеры реализации на Fortran 77[3].

Затем ими была написана публично доступная программная реализация, получившая версию 2.0 (1995-1996 годы[4]). В версиях 2.3 (1997) и 2.4 (2002) пакет NPB был дополнен вариантом, распараллеленным с помощью стандарта MPI.

В версии NPB 3 были добавлены реализации с распараллеливанием OpenMP, а также на языках Java и High Performance Fortran.

Тесты[править | править вики-текст]

В версии 3.3 пакет NPB 3.3 включает в себя 11 тестов.

Тест Полное название[5] Версия появления Описание[5] Замечания
MG MultiGrid — множественная сетка NPB 1[2][5] Аппроксимация решения трехмерного дискретного уравнения Пуассона при помощи V-циклового многосеточного метода
CG Conjugate Gradient — сопряженный градиент Приближение к наименьшему собственному значению большой разреженной симметричной положительно определенной матрицы с использованием inverse iteration вместе с методом сопряженных градиентов в качестве подпрограммы для решения СЛАУ
FT Fast Fourier Transform — Быстрое преобразование Фурье Решение трехмерного уравнения в частных производных при помощи Быстрого преобразования Фурье (FFT)
IS Integer Sort — сортировка целых Сортировка малых целых чисел при помощи карманной сортировки[6]
EP Embarrassingly Parallel — Чрезвычайно параллельный Генерация независимых нормально распределенных случайных величин при помощи en:Marsaglia polar method
BT Block Tridiagonal Решает синтетическую систему нелинейных диф. уравнений в частных производных (3-хмерная система уравнений Навье-Стокса для сжимаемой жидкости или газа), используя три алгоритма: блочная трехдиагональная схема с методом переменных направлений (BT), скалярная пятидиагональная схема (SP) и метод симметричной последовательной верхней релаксации (алгоритм SSOR, задача LU).
  • У теста BT есть подтип с большой интенсивностью ввода-вывода[7]
  • Все три версии теста имеют мультизонные варианты[8]
SP Scalar Pentadiagonal[9] — Скалярный пентадиагональный
LU Lower-Upper разложение при помощи симметричного метода Гаусса-Зейделя [9]
UA Unstructured Adaptive[10] — Неструктурированный Адаптивный NPB 3.1[11] Решение уравнения теплопроводности с учетом диффузии и конвекции в кубе. Источник тепла подвижен, сетка нерегулярна и меняется каждые 5 шагов.[12] * Используется 3D Mortar method
DC Data Cube operator — оператор «куб данных»[13]
DT Data Traffic[11][14] — трафик данных NPB 3.2[11]  Симуляция обменов данными между узлами-источниками, узлами-обработчиками и узлами-потребителями Только MPI-версия

Литература[править | править вики-текст]

  • Weeratunga, D.; Barscz, E.; Barton, J. & Browning, D. (March 1994), "The NAS Parallel Benchmarks", «NAS Technical Report RNR-94-007», NASA Ames Research Center, Moffett Field, CA 
  • Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (December 1995), "The NAS Parallel Benchmarks 2.0", NAS Technical Report NAS-95-020, NASA Ames Research Center, Moffett Field, CA

Примечания[править | править вики-текст]

  1. 1 2 3 А.Н. Свистунов. Раздел «Оценка производительности кластерных систем». 2.2. NAS Parallel Benchmarks. Учебный курс «Технологии построения и использования кластерных систем». Нижегородский государственный университет им. Н.И.Лобачевского (2007). Проверено 8 января 2015.
  2. 1 2 David H Bailey,The NAS Parallel Benchmarks // David Padua, ed., Encyclopedia of Parallel Computing, Springer, Nov 2009
  3. Baily, D.; Barscz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Weeratunga, S. (March 1994), "The NAS Parallel Benchmarks", NAS Technical Report RNR-94-007, NASA Ames Research Center, Moffett Field, CA
  4. Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (December 1995), "The NAS Parallel Benchmarks 2.0", NAS Technical Report NAS-95-020, NASA Ames Research Center, Moffett Field, CA
  5. 1 2 3 Weeratunga, D.; Barscz, E.; Barton, J. & Browning, D. (March 1994), "The NAS Parallel Benchmarks", «NAS Technical Report RNR-94-007», NASA Ames Research Center, Moffett Field, CA 
  6. Saphir, W.; van der Wijngaart, R.; Woo, A. & Yarrow, M., "New Implementations and Results for the NAS Parallel Benchmarks 2", «», NASA Ames Research Center, Moffett Field, CA 
  7. Wong, P. & van der Wijngaart, R. (January 2003), "NAS Parallel Benchmarks I/O Version 2.4", «NAS Technical Report NAS-03-002», NASA Ames Research Center, Moffett Field, CA 
  8. van der Wijngaart, R. & Jin, H. (July 2003), "NAS Parallel Benchmarks, Multi-Zone Versions", «NAS Technical Report NAS-03-010», NASA Ames Research Center, Moffett Field, CA 
  9. 1 2 van der Wijngaart, R. (October 2002), "NAS Parallel Benchmarks Version 2.4", «NAS Technical Report NAS-02-007», NASA Ames Research Center, Moffett Field, CA 
  10. Feng, H.; van der Wijngaart, F.; Biswas, R. & Mavriplis, C. (July 2004), "Unstructured Adaptive (UA) NAS Parallel Benchmark, Version 1.0", «NAS Technical Report NAS-04-006», NASA Ames Research Center, Moffett Field, CA 
  11. 1 2 3 NAS Parallel Benchmarks Changes. NASA Advanced Supercomputing Division. Проверено 17 марта 2009. Архивировано из первоисточника 3 мая 2012.
  12. http://www.exascale.ru/shmem.pdf (недоступная ссылка); Альтернативные модели программирования Высокоскоростных коммуникационных сетей, Корж А.А., НИЦЭВТ, стр 31
  13. Frumkin, M. & Shabanov, L. (September 2004), "Benchmarking Memory Performance with the Data Cube Operator", «NAS Technical Report NAS-04-013», NASA Ames Research Center, Moffett Field, CA 
  14. Communication Intensive Grid Benchmark DT // NASA Ames, 2004

Ссылки[править | править вики-текст]