Дом Перспективное мышление Intel видит растущую роль для fpgas, гетерогенных вычислений

Intel видит растущую роль для fpgas, гетерогенных вычислений

Видео: Nnnnnnnnn (Ноябрь 2024)

Видео: Nnnnnnnnn (Ноябрь 2024)
Anonim

Большая часть интересного обсуждения процессоров в последнее время вращалась вокруг использования различных типов чипов и ядер, в отличие от универсальных вычислительных ядер, распространенных в обычных процессорах. Мы видели все виды различных комбинаций микросхем, используемых для конкретных вычислительных задач, в том числе процессоры, графические процессоры, DSP, настраиваемые ASICS и программируемые пользователем вентильные массивы (FPG), и все чаще мы видим приложения, которые объединяют аспекты всех они иногда в системе, а иногда в одной микросхеме.

Даже Intel - давно являющаяся сторонником вычислительных ядер общего назначения, скорость которых удваивалась каждые пару лет, - вступила в действие с покупкой Altera, одного из ведущих производителей ПЛИС. Недавно у меня была возможность поговорить с Дэном Макнамара, генеральным менеджером Intel Programmable Solutions Group (PSG), которая раньше была известна как Altera, который пролил некоторый свет на планы Intel в этой области и более подробно рассказал о планах компании по подключению разные виды ядер и разные кристаллы вместе в высокоскоростных чиповых пакетах.

«Мир становится неоднородным», - сказал Макнамара, отметив, что в настоящее время существует общее понимание того, что невозможно решить все проблемы с ядрами общего назначения. Пользовательские ASIC, такие как Tensor Processing Units или TPU от Google, могут ускорить определенные виды функций, значительно превосходящие традиционные CPUS или GPU, но их создание занимает много времени. В отличие от этого, по его словам, FPGA позволяют настраивать код, который дает большую часть преимуществ ASIC, не дожидаясь двух лет разработки и производства чипов. Разработчик может немедленно изменить алгоритмы в FPGA, в то время как процессор, графический процессор или специализированный чип работают фиксированным образом.

Макнамара также сказал, что FPGA имеют очень низкую задержку и могут быть очень параллельными, так как различные части чипа работают одновременно в таких приложениях, как обработка изображений или обмен данными.

В настоящее время Intel поставляет FPGA Arria 10, изготовленную по 20-нм техпроцессу TSMC, и предлагает пакет, объединяющий процессор Xeon (Broadwell) и Arria 10. Он используется в таких приложениях, как поиск и аналитика в масштабах сети. Макнамара сказал, что FPGA могут ускорить поиск в 10 раз, и отметил, что Microsoft открыто заявляет об использовании таких FPGA для ускорения поиска.

В последнее время одной большой областью улучшений стало создание более быстрых многочиповых пакетов, которые могут комбинировать кристаллы, созданные на разных процессах и, возможно, от разных производителей. К ним относятся пакеты, содержащие ЦП и ПЛИС, такие как комбинация Xeon / Arria; FPGA с различными трансиверами, как в Intel Stratix 10 FPGA; или даже разные части полного процессора, как Intel описала в своем недавнем технологическом и производственном дне.

Для этого Intel создала новую технологию, называемую встроенным многочиповым межкомпонентным мостом (EMIB), которая дебютировала в Stratix 10. В EMIB базовый кристалл создается по 14-нм процессу Intel, а трансиверы по 16-нм процессу TSMC.

В целом, по словам Макнамара, несколько областей стремятся к внедрению большего количества ПЛИС с использованием такой упаковки. Он рассказал о гипермасштабных веб-сайтах, где наблюдается быстрое изменение спроса, и где комбинация ПЛИС / ЦП может хорошо работать в таких областях, как поиск, аналитика и потоковое видео, а также трансформация сети, где наблюдаются такие тенденции, как программно-определяемые сети. и виртуализация сетевых функций приводит к необходимости дополнительной обработки пакетов. Другие области внимания включают приложения 5G и беспроводные приложения, автономное вождение и приложения искусственного интеллекта (AI). Что касается искусственного интеллекта, Макнамара сказал, что оптимизированные ASIC и вычислительная мощность компьютера могут быть лучшими для обучения (Intel приобрела Nervana), но сказал, что FPGA часто лучше всего подходят для вывода из-за их гибкости и низкой задержки, и отметил, что ZTE использовал Arria 10 для показать очень впечатляющие результаты распознавания изображений.

Лично мне любопытно посмотреть, действительно ли будущие процессоры будут принимать разные компоненты, смешивать и сочетать их, используя EMIB или аналогичную технологию, чтобы изменить то, что мы считаем чипом процессора. Я заинтригован идеей, что системы будущего могут использовать множество различных ядер - некоторые программируемые (FPGA) и некоторые фиксированные (сочетание как пользовательских ASIC, так и традиционных процессоров и графических процессоров) для совместной работы, которая улучшит то, что любой технология может делать сама по себе.

Intel видит растущую роль для fpgas, гетерогенных вычислений