Видео: ÐÑÐµÐ¼Ñ Ð¸ СÑекло Так вÑпала ÐаÑÑа HD VKlipe Net (Ноябрь 2024)
Вчерашние новости о том, что китайский суперкомпьютер Tianhe-2 является самым быстрым в мире, не так уж и шокируют. В конце концов, более ранняя версия была в списке суперкомпьютеров еще в 2010 году.
Что еще более удивительно, так это архитектура Tianhe-2 (также известная как Млечный Путь-2). Он основан на новой архитектуре Intel Xeon Phi, которая объединяет большое количество ядер x86 в один чип; суперкомпьютер объединяет эти чипы в единую архитектуру. Эта система не должна была быть развернута еще пару лет, поэтому я был удивлен, увидев систему на основе Xeon Phi, которая возглавит список. Больше всего меня интересует конкуренция с системами, основанными в основном на вычислениях на GPU. Действительно, система, основанная на ядрах графического процессора Nvidia CUDA, которая в прошлый раз стояла на первом месте, сейчас находится на втором месте.
Список Top500 самых быстрых компьютеров в мире обычно выходит два раза в год: один раз в связи с Международной конференцией суперкомпьютеров (ISC), которая проходит сейчас в Германии, и снова осенью на конференции суперкомпьютеров (SC 13).
Tianhe-2, базирующийся в Национальном университете оборонных технологий в Чанша, Китай, демонстрирует устойчивую производительность более 33, 8 петафлопс (более 17 500 триллионов операций с плавающей запятой в секунду) и пиковую производительность 54, 9 петафлопс в тесте LINPACK. Это примерно вдвое быстрее, чем у предыдущего лидера - системы Titan, базирующейся в Национальной лаборатории Ок-Риджа (ORNL) Министерства энергетики США. Tianhe-2 имеет 16 000 узлов, каждый с двумя процессорами Intel Xeon E5-2692 (12-ядерные процессоры, использующие Ivy Bridge) и тремя процессорами Xeon Phi, что в сумме составляет 3 120 000 вычислительных ядер. Ядра Xeon основаны на новой 12-ядерной версии семейства Xeon # 5-2600, основанной на 22-нм архитектуре Ivy Bridge. Общая мощность системы составляет 17, 8 МВт, что является наибольшим показателем среди всех топовых систем в списке 500 лучших, но поскольку показатели производительности настолько высоки, она все еще считается относительно энергоэффективной. Июньский список самых эффективных суперкомпьютеров, Green500, скоро выйдет.
Система Titan ORNL, которая возглавила предыдущий список, теперь находится на втором месте. Это основано на системе Cray XK7 с 18 688 узлами, каждый из которых содержит 16-ядерный AMD Opteron 6274 и ускоритель графического процессора (GPU) Nvidia Tesla K20x. Эта система демонстрирует устойчивую производительность 17, 5 петафлопс (более 17 500 триллионов операций с плавающей запятой в секунду) и пиковую производительность более 27 петафлопс в тесте LINPACK. Система Sequoia в Ливерморской национальной лаборатории им. Лоуренса, основанная на системе IBM BlueGene / Q и ее Power CPU, год назад заняла второе место в списке Top500, но опустилась на третье место. Четвертое место занимает система «K computer» в Японском институте вычислительных наук RIKEN на базе процессоров Fujitsu SPARC64.
Лучшие четыре системы показывают четыре очень разные архитектуры. Традиционные системы с большим количеством железа, такие как системы на базе IBM BlueGene (Power) и архитектуры Fujitsu SPARC, все еще работают, но большая часть внимания уделяется новой архитектуре Intel Xeon Phi и архитектуре Nvidia CUDA. Между тем, продолжают появляться истории о том, что Китай работает над созданием собственного процессора для суперкомпьютеров.
Более подробно Nvidia объявила вчера, что исследователи из Стэнфордского университета используют графические процессоры для создания крупнейшей в мире искусственной нейронной сети, предназначенной для моделирования процесса обучения человеческого мозга. Также выяснилось, что его инструментарий CUDA теперь будет поддерживать платформы на основе ARM.
В рамках конференции по суперкомпьютерам Intel также представила новые версии своего семейства сопроцессоров Xeon Phi, в том числе 7100 с 61 ядром с тактовой частотой 1, 23 ГГц, 16 ГБ памяти и более 1, 2 Тфлопс с удвоенной точностью; семейство Xeon Phi 3100 с 57 ядрами с тактовой частотой 1, 1 ГГц и тактовой частотой 1TFlops с двойной точностью; и новый 5100D, разработанный таким образом, что гнезда можно прикрепить к мини-плате для использования в форм-факторах лезвия. Intel заявляет, что следующее поколение, известное как «Knights Landing» и основанное на технологии 14nm, будет работать не только как сопроцессор, но и как основной процессор, устраняя тем самым сложность перемещения данных в разные пулы памяти. Это позволит интегрировать встроенную память для ускорения работы.
Intel называет сочетание традиционных процессоров Xeon и Xeon Phi «нео-гетерогенной архитектурой». Аппаратная архитектура имеет несколько классов вычислительных возможностей, к которым обращается общая модель программирования. Компания подчеркивает, что, поскольку весь x86 может оптимизировать разработку и оптимизацию таким образом, что будет сложнее при использовании комбинации процессоров и ускорителей GPU. Nvidia и другие компании, использующие вычисления на GPU, не согласятся с такой оценкой.
Intel также говорила об использовании высокопроизводительных вычислений не только для традиционных применений, таких как правительственные и военные исследования и высокопроизводительные коммерческие приложения, такие как моделирование нефти и газа, но также и для приложений, таких как большие данные. Цель состоит в том, чтобы сделать суперкомпьютинг более массовым.
Смотрите полный список суперкомпьютеров Top500 здесь.