Дом Перспективное мышление Будут ли альтернативные архитектуры управлять суперкомпьютерами?

Будут ли альтернативные архитектуры управлять суперкомпьютерами?

2024

В последние годы мы увидели несколько интересных новых подходов к высокопроизводительным вычислениям, в частности переход от традиционных больших процессоров к кластерам процессоров x86 с ускорителями или сопроцессорами для ускорения определенных видов вычислений. Выходя из шоу Supercomputing на прошлой неделе, мы увидели, что Intel стремится интегрировать свой сопроцессор Xeon Phi с традиционным процессором сервера Xeon, чтобы упростить программирование; Nvidia представляет новую версию своего ускорителя Tesla GPU; и Микрон поддерживает совершенно другой тип процессора для еще более специализированных вычислений. И все это происходило в то время, когда ускорители и сопроцессоры стали доминировать в списке 500 самых быстрых компьютеров в мире, что побудило некоторых экспертов предположить, что существующие тесты придают слишком большой вес этим процессорам.

Nvidia рекламировала свои успехи с помощью своих ускорительных плат Tesla, больших кластеров графических процессоров, подключенных к основным процессорам Intel или AMD. Такие чипы используются в самых разных системах, включая систему Titan в Национальной лаборатории Ок-Риджа и новую систему Piz Daint в Швейцарском национальном вычислительном центре суперкомпьютеров. Что еще интереснее, компания заявляет, что платы Tesla входят в топ-10 систем в последнем списке Green 500 самых энергоэффективных суперкомпьютеров в мире. Все эти системы также используют Intel Xeon, за исключением Titan на базе AMD Opteron, которая является второй самой быстрой системой в мире в Top 500, но занимает гораздо более низкое место в списке Green 500.

Кроме того, Nvidia объявила о партнерстве с IBM, чтобы предложить свои ускорители Tesla в системах на основе архитектуры IBM Power. IBM уже давно рекламирует свою серийную производительность, и ее система BlueGene / Q, основанная на процессорах Power, работает под управлением системы Sequoia в Ливерморской национальной лаборатории им. Лоуренса и системы Mira в Аргоннской национальной лаборатории. Совместная работа IBM и Nvidia должна привести к появлению некоторых интересных систем в будущем.

На выставке компания анонсировала Tesla K40, следующее поколение своей ускорительной платы на GPU. Компания заявила, что предложит 1, 4 терафлопс с производительностью двойной точности, 12 ГБ памяти (пропускная способность 288 Гбит / с) и функцию ускорения GPU, которая позволяет ему работать с более высокой тактовой частотой в некоторых ситуациях. Это обновление по сравнению с существующей серией Tesla K20, в которой используется тот же базовый графический процессор, созданный по технологии 28 нм.

Другие инициативы включают способы облегчения программирования на GPU, в том числе CUDA 6, которая теперь поддерживает унифицированную память, позволяя разработчикам подходить к памяти как к единому пулу, даже если память CPU и GPU остается раздельной. Компания также поддерживает OpenACC, стандартный набор директив компилятора, который сообщает системе, какие части программы (написанные на C / C ++ и Fortran) могут быть выгружены из ЦП в ускоритель для повышения производительности.

Подход Intel, который он называет своей архитектурой Many Integrated Core (MIC), сильно отличается. Он объединяет несколько маленьких ядер x86 в один чип под названием Xeon Phi. В течение последних нескольких лет Intel рекламировала тот факт, что все x86 упрощают программирование, хотя очевидно, что разработчикам все еще приходится ориентироваться на архитектуру напрямую. Текущая версия Xeon Phi, называемая Knights Corner, предназначена для использования в качестве ускорителя наряду с более традиционными серверными чипами Xeon E, и используется различными топовыми системами, включая китайскую Tianhe-2 (в настоящее время самая быстрая система). в мире) и система Stampede в Центре передовых вычислений в Техасском университете.

На выставке Intel анонсировала новую версию под кодовым названием Knights Landing, которая также будет работать как автономный процессор, который может вписаться в стандартную стоечную архитектуру и запускать операционную систему напрямую, не требуя центрального процессора (такого как Xeon E). Это может быть очень важно для расширения привлекательности Xeon Phi, особенно на рынке рабочих станций. Опять же, это сделано для того, чтобы разработчикам программного обеспечения было проще рассматривать его как единый процессор. Knights Landing будет доступен как в виде отдельного процессора, так и в виде платы PCI Express, которая встраивается в существующие системы в качестве обновления от Knights Corner.

Есть и другие существенные изменения в Knights Landing, в том числе добавление «почти памяти», эффективно DRAM, который предлагается в пакете с ЦП и, следовательно, может обеспечить гораздо более высокую пропускную способность, чем традиционная память DDR, которая ограничена скоростью автобус. (Это тоже становится быстрее, но не так сильно.) Это не первый шаг в этом направлении; IBM годами рекламировала встроенную DRAM в своей архитектуре Power, а сама Intel внедряет встроенную DRAM для графики в версии Iris Pro своего семейства Haswell Core. Тем не менее, я думаю, что мы увидим гораздо больше усилий в этом направлении в ближайшие годы.

Между тем, один из самых интересных новых подходов исходит от Micron, который объявил о новом ускорителе под названием Automata Processor, предназначенном в основном для решения сложных проблем неструктурированных данных.

Микрон описал это как предложение ткани, состоящей из десятков тысяч и миллионов обрабатывающих элементов, связанных для решения конкретных задач. Компания, один из крупнейших производителей памяти DRAM и NAND, говорит, что она будет использовать обработку на основе памяти для решения сложных вычислительных задач в таких областях, как сетевая безопасность, биоинформатика, обработка изображений и аналитика. Первоначально Micron будет распространять процессор Automata на плате PCI-Express, чтобы разработчики могли работать с ним, но компания планирует продавать процессоры со стандартными модулями памяти, известными как DIMM, или в виде отдельных чипов для встроенных систем. В некотором смысле это похоже на программируемые пользователем вентильные матрицы (FPGA), которые настроены для решения конкретных задач, связанных с сопоставлением с образцом.

Компания заявила, что работает с Georgia Tech, Университетом Миссури и Университетом Вирджинии над разработкой новых приложений для Automata. Хотя компания не объявила дату выпуска конечных продуктов, в следующем году планируется выпустить комплект для разработки программного обеспечения вместе с инструментами моделирования.

Автоматика звучит как незавершенная работа, и, вероятно, еще слишком рано знать, насколько широки приложения, но это интересный подход.

В целом, мы наблюдаем эволюцию высокопроизводительных вычислений. Не так много лет назад самые быстрые компьютеры были в основном просто огромным количеством стандартных серверных процессоров. Действительно, системы IBM Blue Gene и системы на базе Sparc (такие как компьютер K в Японском институте вычислительных наук RIKEN, в котором используются процессоры Fujitsu Sparc) по-прежнему занимают значительную часть рынка, включая пять из 10 самых быстрых системы в мире. Но в последние годы импульс переместился в сторону сопроцессора, причем системы, использующие Tesla, а в последнее время ускорители Xeon Phi составляют больше новых систем. С улучшениями в этих системах, новыми партнерствами, улучшенным программным обеспечением и некоторыми новыми подходами рынок суперкомпьютеров в будущем может сильно измениться.