Дом Перспективное мышление Большие изменения наконец-то на горизонте для суперкомпьютеров

Большие изменения наконец-то на горизонте для суперкомпьютеров

2024

Видео: ÐÑÐµÐ¼Ñ Ð¸ Ð¡ÑÐµÐºÐ»Ð¾ Ð¢Ð°Ðº Ð²ÑÐ¿Ð°Ð»Ð° ÐÐ°ÑÑÐ° HD VKlipe Net (Ноябрь 2024)

Оглядываясь на конференцию по суперкомпьютерам ISC 17 на этой неделе, похоже, что в мире суперкомпьютеров в ближайшие пару лет произойдут серьезные обновления, но обновление списка Top 500 самых быстрых суперкомпьютеров мира два раза в год не сильно отличалось от предыдущая версия.

Самыми быстрыми компьютерами в мире по-прежнему являются две огромные китайские машины, которые в течение нескольких лет возглавляли этот список: компьютер Sunway TaihuLight из Китайского национального суперкомпьютерного центра в Уси, с устойчивой производительностью Linpack более 93 петафлопс (93 тысячи триллионов с плавающей запятой) операций в секунду); и компьютер Tianhe-2 из Национального суперкомпьютерного центра Китая в Гуанчжоу с устойчивой производительностью более 33, 8 петафлопс. Они остаются самыми быстрыми машинами с огромным отрывом.

Новый номер три - это система Piz Daint от Швейцарского национального суперкомпьютерного центра, система Cray, использующая Intel Xeons и Nvidia Tesla P100s, которая была недавно модернизирована, чтобы обеспечить стабильную производительность Linpack в 19, 6 петафлопс, что вдвое больше, чем в прошлом. Это подняло его с восьмого в списке.

Это опускает верхнюю систему США - систему «Титан» в Национальной лаборатории Ок-Риджа - на четвертое место, что делает это впервые за двадцать лет, когда в первой тройке нет системы США. Остальная часть списка остается без изменений: на США по-прежнему приходится пять из десяти ведущих стран, а на Японию - две.

Даже если список самых быстрых компьютеров не сильно изменился, в других местах есть большие изменения. В списке самых энергоэффективных систем Green 500 изменились девять из первой десятки. Сверху находится система Tsubame 3.0, модифицированная система HPE ICE XA в Токийском технологическом институте, основанная на 14-ядерном Xeon E5-2680v4, межсоединении Omni-Path и Tesla P100 от Nvidia, которая обеспечивает 14, 1 гигафлопс на ватт. Это огромный скачок от Nvidia DGX Saturn V, основанного на платформе DGX-1 фирмы и чипах P100, которая была на первом месте в ноябрьском списке, но на этот раз на десятом месте, с 9, 5 гигафлопс / ватт. P100 входит в девять из десяти лучших систем Green500.

Разбить 10 гигафлопс / ватт - большая проблема, потому что это означает, что гипотетическая система exaflop, построенная с использованием современных технологий, будет потреблять менее 100 мегаватт (МВт). Это все еще слишком много - цель в 20–30 МВт для системы exaflop, которую исследователи надеются увидеть в ближайшие пять лет или около того, - но это огромный шаг вперед.

Как и в списке Top 500, в аналогичных списках были внесены лишь незначительные изменения с различными показателями, такими как критерий HPCG (High Performance Conjugate Gradients), где машины имеют тенденцию видеть только 1-10 процентов от их теоретической пиковой производительности, и где верх система - в данном случае машина Riken K - по-прежнему обеспечивает менее 1 петафлопа. Обе системы TaihuLight и Piz Daint поднялись в этом списке. Когда исследователи говорят о машине exaflop, они имеют в виду эталонный тест Linpack, но HPCG может быть более реалистичной с точки зрения реальной производительности.

Появление вычислений на GPU в качестве ускорителя - почти всегда использующих процессоры Nvidia GPU, таких как P100, - стало наиболее заметным изменением в этих списках в последние годы, после чего последовал выпуск собственного ускорителя Intel, многоядерного Xeon Phi (включая самая свежая версия Knights Landing). Текущий список Top 500 включает 91 систему, использующую ускорители или сопроцессоры, в том числе 74 с графическими процессорами Nvidia и 17 с Xeon Phi (еще три используют оба); один с графическим процессором AMD Radeon в качестве ускорителя, а два с многоядерным процессором от японского поставщика PEZY Computing. Дополнительные 13 систем теперь используют Xeon Phi (Knights Landing) в качестве основного процессора.

Но многие крупные изменения в суперкомпьютерах все еще на горизонте, так как мы начинаем видеть большие системы, разработанные с учетом этих концепций. В качестве примера можно привести новый MareNostrum 4 в Барселонском суперкомпьютерном центре, который вошел в список 500 крупнейших компаний под номером 13. Как уже было установлено, это система Lenovo, основанная на новой версии Skyeke-SP Xeon (официально Xeon Platinum 8160 24). процессор). Здесь интересны три новых кластера «новых технологий», запланированных на ближайшие пару лет, в том числе один кластер с процессорами IBM Power 9 и графическими процессорами Nvidia, рассчитанный на пиковую производительность обработки более 1, 5 Петафлопс; второй, основанный на версии Xeon Phi в Knights Hill; и третий на основе 64-битных процессоров ARMv8, разработанных Fujitsu.

Эти концепции используются в ряде других крупных суперкомпьютерных проектов, в частности, в нескольких из них, спонсируемых Министерством энергетики США в рамках сотрудничества CORAL в Национальных лабораториях Ок-Риджа, Аргонна и Лоуренса Ливермора. Первым должен быть Summit в Оук-Ридже, который будет использовать процессоры IBM Power 9 и графические процессоры Nvidia Volta и должен обеспечить более 150-300 петафлопс; затем Сьерра в Лоуренс Ливермор, намеченный для доставки более 100 петафлопс

Затем мы должны увидеть суперкомпьютер Aurora в Аргоннской национальной лаборатории, основанный на версии Xeon Phi в Knights Hill и построенной Cray, которая рассчитана на 180 петафлопс. Системы CORAL должны быть Бег Следующий год.

Между тем, китайские и японские группы также запланировали обновления, в основном с использованием уникальных архитектур. На это должно быть интересно смотреть.

Еще больший сдвиг, кажется, чуть дальше: сдвиг в сторону машинного обучения, обычно на массивно параллельных процессорах внутри самого процессора. Хотя число Linpack относится к производительности с 64-разрядной или двойной точностью, существуют классы приложений, в том числе многие приложения на основе глубоких нейронных сетей, которые лучше работают с вычислениями с одинарной или даже половинной точностью. Это используют новые процессоры, такие как недавний анонс Nvidia Volta V100 и готовящаяся к выпуску версия Xeon Phi для Knights Mill. На выставке Intel сообщила, что эта версия, которая должна выйти в производство в четвертом квартале, будет иметь новые наборы команд для «высокоточных вычислений», называемых Quad Fused Multiply Add (QFMA) и Quad Virtual Neural Network Instruction (QVNNI)., Я предполагаю, что эти концепции могут быть применены и к другим архитектурам, таким как TPU от Google или FPGA от Intel и чипы Nervana.

Даже если мы не увидим больших изменений в этом году, в следующем году мы должны ожидать большего. Концепция машины exascale (1000 терафлопс) все еще на виду, хотя она, вероятно, повлечет за собой ряд еще более значительных изменений.