Дом Перспективное мышление Суперкомпьютер в основном не изменился, но сидел

Суперкомпьютер в основном не изменился, но сидел

Видео: Приколы с кошками и котами (Октября 2024)

Видео: Приколы с кошками и котами (Октября 2024)
Anonim

Самый последний список самых быстрых суперкомпьютеров в мире не сильно изменился, но на ежегодной выставке Supercomputing (SC14) было много обсуждений о новых системах в списке, а также несколько высокопроизводительных вычислений, таких как новые ускорители от Intel и Nvidia.

Китайский суперкомпьютер Tianhe-2, использующий процессоры Intel Xeon и ускорители Xeon Phi, остался на первом месте в списке Top500 с пиковой производительностью 54, 9 петафлопс (квадриллионов операций с плавающей запятой в секунду). Фактически, в этом году первые девять систем были идентичны первому новому дополнению, занявшему 10-е место, - неустановленный аппарат для правительственной системы США, представляющий собой Cray CS-Storm на базе процессоров Intel Xeon E5-2660 v2 и графических процессоров Nvidia K40, подключенных через Infiniband.

Далее в списке появилось 78 новых систем, хотя даже это новый рекордный минимум. И в целом, похоже, что мы наблюдаем замедление темпов роста совокупной мощности 500 систем.

Рейтинг этих систем основан на эталонном тесте LINPACK, хотя в настоящее время предпринимаются определенные усилия по созданию новых эталонных тестов, ориентированных на различные виды вычислений. Мне показалось интересным, что в своем выступлении на шоу Хорст Саймон, редактор списка Top500, сказал, что, несмотря на цель достижения превосходного компьютера - 1 экзафлоп в секунду (примерно 1000 петафлопс) - к 2020 году, он полагает, что это, вероятно, до конца 2024 года. Отчасти это связано с тем, что нам потребуется больше энергосберегающих технологий, таких как кремниевая фотоника, трехмерная интеграция и упаковка, чтобы снизить мощность, необходимую для системы расширения, до 20 мегаватт. Это большие системы.

Несмотря на отсутствие больших изменений наверху, мы услышали пару новых объявлений, в частности, от Intel и Nvidia, которые могут указать путь к более быстрым машинам.

Nvidia, чьи графические процессоры и язык программирования CUDA действительно начали движение к ускорителям и сопроцессорам в высокопроизводительных вычислениях, была во всем шоу с большим количеством систем. В настоящее время он предлагает ускоритель K40 и на выставке анонсировал следующую версию, Tesla K80, которая использует подход с двумя графическими процессорами, чтобы предложить, как заявляет фирма, почти в два раза более высокую производительность и удвоить пропускную способность памяти своего предшественника.

Nvidia заявляет, что K80 предлагает 4992 ядра CUDA и 24 мегабайта оперативной памяти и имеет пиковую емкость 2, 91 терафлопс на плату. Интересно, что K80 уже доступен и многие производители систем уже предлагают системы с платой. Например, Dell продемонстрировала свои новые серверы PowerEdge C4130, которые позволяют устанавливать до четырех ускорительных плат Nvidia (или ускорителей Intel Xeon Phi) на 1U-сервере, причем версия K80 предлагает до 7, 2 терафлопс в каждом блоке. Это просто сумасшедшее количество вычислительной мощности в стойке (хотя она потребляет много энергии и требует большого охлаждения).

Между тем Intel объявила, что в следующей версии своего чипа Xeon Phi - версии, известной как Knight's Landing, для которой первые коммерческие системы должны начать поставляться в следующем году, - теперь более 50 клиентов планируют использовать новую версию процессора для этой части (где Xeon Phi действует как системный процессор в новых суперкомпьютерах. Многие другие системы используют версию продукта сопроцессора PCIe.

Среди заказчиков Knights Landing - суперкомпьютер Trinity, созданный совместными усилиями Los Alamos и Sandia National Laboratories, и суперкомпьютер Cori, объявленный Национальным центром научных исследований в области энергетики (NERSC) Министерства энергетики США. Предполагается, что производительность Knight's Landing составит около 3 терафлопс, и она будет интегрирована с технологией Intel Omni-Path Fabric, основанной на кремниевой фотонике, которая, по словам компании, обеспечит скорость линии 100 Гбит / с и на 56% меньшую задержку коммутационной матрицы, чем альтернативы InfiniBand. (Обратите внимание, что провайдеры InfiniBand теперь говорят и о новых версиях.)

Intel заявила, что продолжение, известное как Knight's Hill, будет построено с использованием 10-нм техпроцесса Intel и с использованием следующего поколения структуры Omni-Path. Это будет следовать за высадкой Рыцаря, но точное время не было раскрыто.

Не следует забывать и об этом - AMD, которая объявила и продемонстрировала свою однопроцессорную карту FirePro S9150, которая, по ее словам, может предложить 2, 53 терафлопс производительности. Эта система, которая запрограммирована с использованием OpenCL, уже поставляется.

Фактически, новый суперкомпьютер под названием L-CSC от GSI Helmholtz Center, основанный на графических процессорах S9150 и 10-ядерных процессорах Intel Xeon 2690v2, возглавил новую версию списка Green500, в котором перечислены суперкомпьютеры в порядке вычислительной мощности на ватт. Это первый раз, когда система смогла превзойти 5 гигафлопс / ватт (миллиарды операций в секунду на ватт). Обратите внимание на то, что второе место заняла система Suiren, оснащенная многоядерными ускорителями PEZY-SC и процессорами Xeon; в то время как остальные топ-10 используют графические процессоры Nvidia Tesla, показывая диапазон таких систем.

Есть и другие, более необычные варианты. Micron демонстрирует свою микросхему Automata, по сути специальную микросхему, предназначенную для сопоставления с образцом, для использования в таких вещах, как сетевая безопасность и поиск геномики. Это превращается в плату PCIe 3 с 32 чипами и планируется к выпуску в первом квартале 2015 года, первоначально в небольших объемах. (Компания также стоит за своим гибридным кубом памяти для памяти следующего поколения для таких систем.) У IBM есть процессор TrueNorth, который, как она надеется, укажет путь к более «интеллектуальным вычислениям». NEC работает над следующим поколением векторного процессора SX-ACE, который, по его словам, легче программировать, чем графические процессоры. И, конечно же, ARM также пытается выйти на рынок серверов, используя X-Gene1 от Applied Micro в качестве процессора для подключения к разным ускорительным платам.

Ряд поставщиков демонстрировали новые системы. В дополнение к системе Dell, о которой я упоминал ранее, Lenovo продемонстрировала двухпроцессорную систему с водяным охлаждением на базе специального процессора Intel Xeon E5-2798A (с 16 ядрами, работающими до 3, 2 ГГц), который, по ее словам, обеспечивает 1, 083 терафлопс. И в нем говорится, что в следующем году процессор Knights Landing Xeon Phi позволит использовать систему «peta-cube», которая обеспечивает более одного петафлопа всего в двух стандартных стойках 42U.

Серверы One Stop показали высокопроизводительный ускоритель вычислений, который использует PCIe Gen3 для поддержки до 16 высокопроизводительных ускорительных плат от одного или нескольких серверов, а компания заявляет, что обеспечивает до 89, 6 терафлопс с использованием плат Tesla K80. Это может работать с процессором IBM Power8. Huawei демонстрировала наличие в США своего сервера X6800 Data Center Server и версии жидкостного охлаждения своего блейд-сервера FusionServer 9000.

Для объединения систем компания Obsidian Technologies запустила свою инициативу InfiniCortex, предназначенную для передачи 100-гигабитного соединения InfiniBand на большие расстояния. Компания объявила о поддержке Сингапурского агентства по науке, технологиям и исследованиям (A * STAR). А Mellanox продемонстрировал 100 Gigabit Infiniband, работающий более 100 метров по оптоволокну и 8 метров по меди.

Чтобы создать крупнейшие суперкомпьютеры, организации, как правило, обращаются к таким компаниям, как IBM и Cray, чтобы собрать системы, хотя на их создание часто уходят годы. Самым большим объявлением Cray такого рода на выставке была система стоимостью 80 миллионов долларов, известная как Shaheen II в Университете науки и технологий им. Короля Абдаллы в Саудовской Аравии, для Cray XC40, включая устройство для анализа графиков Urika-GD.

И, конечно же, непосредственно перед показом Министерство энергетики заключило с IBM (и поставщиками компонентов Nvidia и Mellanox) огромный контракт на создание двух крупнейших суперкомпьютеров в стране, каждый из которых имеет более 100 петафлопс.

Примечание редактора: этот пост был обновлен 26.11. Пик производительности Tianhe-2 составляет 54, 9 петафлопс, а не терафлопс.

Суперкомпьютер в основном не изменился, но сидел