Дом Перспективное мышление Суперкомпьютинг 15: большие изменения на горизонте

Суперкомпьютинг 15: большие изменения на горизонте

2024

Видео: Маша и Медведь (Masha and The Bear) - Подкидыш (23 Серия) (Ноябрь 2024)

Когда я просматриваю анонсы и материалы прошлогодней конференции Supercomputing 15 (SC15) в Остине, кажется, что, хотя высокопроизводительные вычисления могут быть немного тупиковыми, рынок готов к некоторым крупным изменениям в этом году. приходить.

Если вы посмотрите на лидеров из списка top500, список самых быстрых компьютеров в мире, который проводится два раза в год, то в шестой раз подряд лидером является Tianhe-2, суперкомпьютер, созданный Национальным университетом оборонных технологий Китая. Согласно списку top500, эта машина обеспечивает 33, 86 петафлоп / с (квадриллионы вычислений в секунду) устойчивой производительности в тесте Linpack и 54, 9 петафлоп / с теоретической пиковой производительности. Это основано на процессорах Intel Xeon и Xeon Phi.

Второе место по-прежнему занимает Titan, система Cray XK7, основанная на процессорах AMD Opteron и графических процессорах Nvidia K20x, установленных в Национальной лаборатории DOE в Ок-Ридже, со стабильной производительностью 17, 59 петафлопс / с в тесте Linpack.

Две новые машины взломали топ-10. Компьютер Trinity в Ливерморской национальной лаборатории им. Лоуренса (LLNL) занимает шестое место с 8, 1 петафлопс / с, а система Hazel-Hen в немецком Höchstleistungsrechenzentrum Штутгарте (HLRS) заняла восьмое место с 5, 6 петафлопс / с. Оба являются компьютерами Cray XC, основанными на процессорах Intel Xeon с соединением Aries.

Большие изменения происходят дальше вниз по списку, особенно с большим увеличением числа китайских систем, которое выросло до 109, по сравнению со всего 37 в предыдущем списке. Частично это происходит из-за того, что все больше китайских систем запускают тесты и представляют результаты для списка. В результате число систем в США сократилось с 231 до 200, что является самым низким показателем с момента его создания в 1993 году; и число европейских систем сократилось с 141 до 108.

Одна большая тенденция - это увеличение числа систем, использующих ускорители или сопроцессоры, которое выросло до 104 систем в текущем списке по сравнению с 90 в июле. В большинстве этих систем используются графические процессоры Nvidia Tesla, за которыми следуют сопроцессоры Intel Xeon Phi, причем некоторые используют комбинацию. Nvidia указала, что это было в 70 из этих систем, в том числе 23 из 24 новых систем в списке.

На выставке Nvidia подчеркнула рост числа ускорителей и, в частности, количество доступных приложений, оптимизированных для архитектуры фирмы CUDA. Компания говорит, что 90 процентов из 10 лучших высокопроизводительных вычислительных приложений и 70 процентов из 50 лучших сейчас ускорены. Одно интригующее использование - для систем, запускающих моделирование погоды, основное приложение для высокопроизводительных вычислений, поскольку прогнозы погоды составляются правительствами всех видов. Ранее Крэй указывал на использование таких ускорителей в Швейцарском метеорологическом бюро (MeteoSwiss) и говорил о том, как он работает с учеными в Швейцарии над переписыванием многих своих приложений. В настоящее время Nvidia указывает на использование ускорителей Национальным управлением океанических и атмосферных исследований (NOAA) для некоторых прогнозов погоды.

Среди других приложений, Cray рекламировал нефтегазовые приложения, такие как использование 3D-геофизики для моделирования пласта, а также финансовые услуги, такие как оценка рисков. Такие приложения редко составляют самые быстрые системы в мире, но они указывают на то, что высокопроизводительные вычисления играют более широкую роль в большем количестве корпоративных приложений. Крэй говорил об устойчивом прогрессе к запуску более крупных и подробных моделей во всех научных и инженерных дисциплинах и сочетанию традиционных рабочих нагрузок с аналитикой.

Меня также заинтересовало объявление Linux Foundation о новом проекте под названием OpenHPC, предназначенном для создания более открытых стандартов в мире HPC. Это интересная идея, и на нее, похоже, подписались многие крупные игроки.

В работе есть ряд новых систем. IBM строит новый компьютер под названием Summit в Национальных лабораториях Ок-Риджа (ORNL), а другой - Sierra в Ливерморской национальной лаборатории им. Лоуренса (LLNL), основанный на процессорах архитектуры IBM Power, графических процессорах Nvidia Tesla и межсоединениях Mellanox. Саммит, как ожидается, доставит 150–300 петафлопс / с, а Сьерра - более 100 петафлоп / с.

Кроме того, Intel и Cray строят новую машину под названием Aurora на основе будущих процессоров Intel Xeon Phi компании Knights Hill для Argonne Leadership Computing Facility (входит в состав Argonne National Labs), которая рассчитана на 150 петафлопс в 2018 году. Все эти являются частью программы Министерства энергетики, известной как совместная работа национальных лабораторий Ок-Риджа, Аргонна и Лоуренса Ливермора (CORAL), направленной на ускорение развития высокопроизводительных вычислений, в частности проекта FastForward 2.

Тем не менее, нам еще предстоит пройти долгий путь в направлении «масштабных вычислений».

Тем временем было несколько анонсов процессоров, которые могли бы предвещать хорошие перспективы на будущее. В частности, Nvidia подтолкнула использование суперкомпьютеров для гиперпространственных веб-приложений, особенно для машинного обучения. Он анонсировал несколько более дешевых продуктов: плату Tesla M40 с ядрами 3072 CUDA, которая, по ее словам, была способна выполнять до 7 терафлопс с одинарной точностью, нацеленную в первую очередь на обучение «глубокому обучению», и M4, плата с низким энергопотреблением с 1024 ядрами и 2, 2 терафлопс / с с одинарной точностью, которые можно использовать для глубокого обучения, а также для обработки изображений и видео. Кроме того, компания анонсировала новый «гиперпространственный пакет» с приложениями, предназначенными для крупнейших вычислительных площадок. Оба новых аппаратных продукта основаны на 28-нм техпроцессе и архитектуре Maxwell компании.

Компания анонсировала две последующие архитектуры, известные как Pascal, которые должны выйти в следующем году, и Volta, которая последует за ним. Intel сосредоточилась на том, как HPC влияет на науку, и я был заинтригован ее описанием того, как он использует свой собственный суперкомпьютер - в настоящее время занимающий 99-е место в списке 500 лучших - для разработки собственных процессоров. В частности, компания заявила, что использует миллион процессорных часов только для разработки фотомасок для процессоров следующего поколения.

Большая часть деятельности Intel была сосредоточена на Knights Landing, следующей версии ее чипа Xeon Phi, которую можно использовать как ускоритель, но при этом загружать; и его ткань Omni-Path. Хотя в настоящее время Intel заявляет, что общая доступность будет в первой половине 2016 года, некоторые клиенты имеют ранний доступ к Knights Landing. В настоящее время Cray проводит испытания большой системы Knights Landing в рамках подготовки к поставке в следующем году нового суперкомпьютера Cori для Национального научно-вычислительного центра энергетических исследований (NERSC), а также Национальной лаборатории Лос-Аламоса и Национальной лаборатории Сандиа. Bull, подразделение французского системного интегратора Atos, также получило ранние версии Knights Landing для подготовки к системе Tera 1000, которую она строит для французской комиссии по альтернативной энергии и атомной энергии. Argonne Leadership Computing Facility работает над системой под названием Theta, которая должна быть поставлена в следующем году, а Sandia National Laboratories работает с Penguin Computing, чтобы модернизировать несколько систем, которые используют более ранние поколения сопроцессоров Xeon Phi.

Ранее Intel заявляла, что будет три разных версии Knights Landing: базовый хост-процессор (способный к самостоятельной загрузке), хост-процессор с интегрированной матрицей Omni-Path и карта ускорителя PCIe. Сам чип будет состоять из 36 фрагментов, каждый с двумя ядрами ЦП (всего 72 ядра), четырьмя векторными процессорами (по два на ядро), 1 МБ общей кэш-памяти L2 и агентом кэширования для обеспечения согласованности; Intel заявила, что должна обеспечить примерно в три раза более высокую скалярную производительность процессора Knights Corner с максимальной производительностью 3 терафлоп / с и максимальной производительностью 6 терафлоп / с. Он также использует новую систему памяти под названием MCDRAM - встроенную память с пропускной способностью, в 3 раза превышающей доступную пропускную способность по сравнению с выходом на DDR4, что является вариантом архитектуры Hybrid Memory Cube, о которой Intel и Micron говорили об этом. На выставке у Cray была прототипная система с загрузочной системой Knights Landing, а ряд других поставщиков демонстрировали системы, разработанные для Knights Landing. Предполагается, что за этой версией Xeon Phi последует версия под названием Knights Hill, которая должна быть построена на предстоящем 10-нм процессе.

Кроме того, Fujitsu немного больше рассказала о своем проекте Flagship 2020, основанном на новом чипе FX100 с 32 ядрами. Ожидается, что это примерно в четыре раза выше производительности с плавающей запятой по сравнению с текущим FX10, и, как и Knights Landing, FX100 от Fujitsu также будет использовать версию архитектуры Hybrid Memory Cube. Кроме того, у NEC есть проект под кодовым названием Aurora (не связанный с проектом CORAL), основанный на продолжении чипа SX-ACE, но с большей пропускной способностью памяти. Это намечено на 2017 год.