Дом Перспективное мышление Открытый вычислительный саммит показывает огромные аппаратные инновации

Открытый вычислительный саммит показывает огромные аппаратные инновации

Видео: OCP Summit 2016: Jay Parikh, Facebook & Urs Hölzle, Google - Keynote (Октября 2024)

Видео: OCP Summit 2016: Jay Parikh, Facebook & Urs Hölzle, Google - Keynote (Октября 2024)
Anonim

Возможно, наиболее интересной тенденцией в компьютерном оборудовании сегодня является проект Open Compute Project, и его усилия направлены на то, чтобы перейти к общим, эффективным стандартам для оборудования центра обработки данных, а не к проприетарному оборудованию и программному обеспечению, которое мы имеем сегодня. Когда мы впервые услышали об Open Compute, это стало хорошим способом для гипермасштабных веб-фирм разработать более энергоэффективные и простые в обслуживании серверы. Но с тех пор Open Compute охватывает многие другие виды оборудования - от хранилища до сетей - и становится применимым для корпоративных вычислений, а не только для компаний, занимающихся облачным программным обеспечением.

Все это было совершенно очевидно на прошлой неделе на саммите Open Compute Project, где различные компании представили новое оборудование, предназначенное для работы с оборудованием и спецификациями Open Compute, от серверов до сетей.

«Еще в 2011 году мы посадили несколько семян», - заявил Фрэнк Франковский, председатель правления Фонда OCP, на открытии саммита. «Что бы произошло, если бы мы применили принципы open source к аппаратному пространству? Работа, которую мы выполняем вместе, коренным образом преобразовывает отрасль».

Новые чипы и спецификации Push ARM-серверов

Некоторые вещи, объявленные в течение недели, выделялись. Подавляющее большинство серверов в реальном мире и в Open Compute Project основано на процессорах Intel Xeon и архитектуре x86. Хотя это вряд ли изменится в ближайшее время, у конкурентов, таких как ARM и AMD, есть несколько интересных альтернатив.

AMD объявила о своем первом 64-разрядном серверном процессоре на базе ARM, 28-нм серии Opteron A1100 (с кодовым названием Seattle), который, по словам Эндрю Фельдмана, генерального директора и корпоративного вице-президента, будет производить выборки для клиентов «в течение нескольких недель», хотя это ожидается, что он не станет широко доступным до конца года. A1100 включает в себя 4- или 8-ядерные процессоры ARM Cortex-A57, до 4 МБ общего L2 и 8 МБ общего кэша L3, два канала памяти DDR3 или DDR4 с ECC, ARM TrustZone для безопасности и сопроцессоры для шифрования и данных сжатия.

Фельдман рассказал о наборе A Series Development Kit с процессором A1100 и сказал, что компания тесно сотрудничает с Linaro Enterprise Group и поставщиками программного обеспечения для разработки совместимой операционной системы Linux на основе Fedora от Red Hat, оптимизированного стека LAMP, поддержки Java и других. программное обеспечение, включая приложения, гипервизоры, компиляторы и симуляторы. Фельдман поддержал дизайн небольшого микросервера, используя AMD Opteron A-Series и общую спецификацию слотов Open Compute Project для материнских плат, известную как «Group Hug», и объявил, что компания вносит свой вклад в проект, чтобы производители оборудования могли начать строить серверы на его основе.

В то время как Фельдман сказал, что AMD привержен x86 и ARM, он настоятельно предположил, что будущее ЦОД будет ориентировано на серверы на базе ARM. «В истории компьютеров всегда выигрывали процессоры меньшего размера, с меньшими затратами и с большим объемом», - сказал Фельдман. «В этом нет исключения». Он отметил, что в прошлом году было поставлено 8 миллиардов процессоров ARM по сравнению с 13 миллионами процессоров x86-серверов. (Это кажется глупым сравнением, поскольку оно включает в себя процессоры ARM, используемые во всех видах приложений, не связанных с центрами обработки данных, но исключает x86, используемые не на серверах, а на других серверах.) Фельдман предсказал, что к 2019 году ARM будет управлять четвертью рынка серверов и пользовательских систем. SoC ARM станут нормой для крупных центров обработки данных, в то время как более мелкие и эффективные процессоры x86 будут доминировать на рынке серверов x86.

Applied Micro также сообщила, что весной этого года ее X-Gene 2 будет опробовать, и, по словам компании, это будет первая реализация ARMv8, предназначенная для серверов. Фельдман также сказал, что в следующем году за ним последует X-Gene 3 с 16 или более ядрами ARM, выполненными на процессоре FinFET.

Одной из проблем, которая была у некоторых людей по поводу серверов на базе ARM, является фрагментация. Чтобы противостоять этому, Иан Дрю, исполнительный вице-президент по развитию бизнеса и директор по маркетингу ARM, объявил о новой архитектуре серверной базовой системы. Идея состоит в том, чтобы иметь одну базовую аппаратную спецификацию для разработчиков ОС и прошивок и один образ ОС для всех серверов на базе ARMv8-A. «Это аппаратная спецификация, которая была написана парнями из аппаратного обеспечения и парнями из программного обеспечения», - сказал Дрю. Он отметил, что это не стандартизация, в которой все будут монолитными, а разработанные таким образом, чтобы дифференциация происходила на нужном уровне в нужное время.

Дрю сказал, что ARM хочет убедиться, что все на борту, так что это публично доступно на веб-сайте ARM. Он имеет поддержку OEM-производителей и ряда полупроводниковых партнеров, включая AMD, Applied Micro, Broadcom и Cavium.

Microsoft присоединяется к OCP

Microsoft заявила, что присоединяется к OCP и предоставляет полный набор спецификаций для серверов, работающих на Office 365, Windows Azure и Bing. По словам вице-президента корпорации Билла Лейнга, компания хочет внедрять инновации в облачных дата-центрах. Этот первоначальный дизайн сильно отличается от стандартной 21-дюймовой стойки, изначально предоставленной Facebook, которая на сегодняшний день определила большую часть серверов Open Compute. Вместо этого это шасси 12U, которое умещается в стандартную стойку с вычислительным блейдом, блейдом хранения, общей объединительной платой, общим электропитанием и охлаждением и узлом управления.

Лэйнг сказал, что эти конструкции могут быть предварительно собраны и имеют минимальную интеграцию на месте, так как готовые лотки могут быть удалены и заменены. По сравнению с традиционным корпоративным сервером, он сказал, что эта конструкция обеспечивает экономию затрат до 40 процентов, повышение эффективности энергопотребления до 15 процентов, а также увеличение времени развертывания и обслуживания на 50 процентов. Идея состоит в том, чтобы позволить клиентам получить те же преимущества и «продвигать вперед облачные вычисления, как мы преобразовали корпоративные вычисления в центрах обработки данных».

По словам Лейнга, Microsoft управляет более чем 200 облачными сервисами по всему миру, обслуживая более 1 миллиарда клиентов и более 20 миллионов предприятий на более чем 90 рынках, и в настоящее время развертывает более 1 миллиона серверов в своих центрах обработки данных.

Open Compute добавляет сеть

Одним из новых проектов является создание сетей, которое было официально запущено в мае прошлого года. «Это довольно странно, что открытый исходный код оказал это удивительно положительное влияние на программное обеспечение, серверы, центры обработки данных и хранилище, и у нас есть эти любовно созданные острова технологий с открытым исходным кодом, но то, что соединяет эти острова вместе, все еще остается проприетарным черным ящиком». Франковский сказал. «Поэтому мы решили взломать этот черный ящик и предоставить клиентам гибкость и выбор в их сети и прозрачности. То, что привлекает людей к программному обеспечению с открытым исходным кодом, - это то, что привлекает нас к оборудованию с открытым исходным кодом. Это естественное человеческое любопытство по поводу того, как эта работа и как она будет работать по-другому, если я разберу ее и соберу обратно так, как хочу собрать?"

Через несколько месяцев, по его словам, OCP получила взносы от Broadcom, Intel, Mellanox, Big Switch и Cumulus Networks.

Хотя ряд компаний говорили о непатентованных коммутаторах с верхней стойкой, я был заинтригован, увидев, как Dell объявила о заключении сделки с Cumulus Networks, в рамках которой компания-производитель оборудования будет перепродавать сетевое программное обеспечение Cumulus на базе Linux поверх OCP-совместимой сети. аппаратное обеспечение.

Другие интересные новости об оборудовании, представленные на выставке, включали в себя объявление Seagate о том, что он предоставляет свою платформу хранения Kinetic для OCP, которая позволяет приложениям подключаться к хранилищу напрямую через Ethernet, а не через традиционные серверы хранения.

Полная оптимизация инфраструктуры Facebook

Учитывая его ключевую роль в запуске Open Compute, неудивительно, что Facebook является одним из лидеров по внедрению большинства технологий. Джей Парих, вице-президент Facebook по инфраструктуре, выступил с докладом о том, «почему все, что Facebook делает с инфраструктурой, действительно имеет значение». По словам Париха, вначале команда разработчиков инфраструктуры Facebook просто сосредоточилась на поддержании работоспособности. Но, поскольку это продолжало расти, команда быстро достигла пределов аппаратного и программного обеспечения. У них были некоторые «впечатляющие неудачи», сказал он, но в процессе усвоил одну основную вещь: в масштабе все ваши проблемы усиливаются.

По пути они создали новый дизайн сервера, который был более экономичным и энергоэффективным, а также облегчал управление и ремонт серверов. Сегодня у Facebook есть собственный дата-центр с настраиваемыми стойками, вычислительными серверами и серверами хранения, а также сетью.

«Со временем мы были вынуждены взять на себя контроль над каждой частью стека, потому что мы должны были идти в ногу с ростом», - сказал Парих. Он рассказал о концепции «полной оптимизации инфраструктуры стека», включая программное обеспечение, сети, серверы и хранилище. В настоящее время компания использует только оборудование Open Compute Project. «На самом деле мы экономим кучу денег», - сказал он. За последние три года полная оптимизация стека сэкономила Facebook более 1, 2 миллиарда долларов.

Парих тогда дал обновление на холодном хранении Facebook. Он сказал, что первый новый холодильный склад компании, вместимостью 30 петабайт, запущен, и скоро будет запущен второй, что увеличит общую емкость хранилища до «более 100 петабайт» в ближайшие несколько месяцев. Каждое средство предназначено для хранения максимум трех экзабайт, так что есть много места для роста.

Впервые Парих продемонстрировал прототип сервера хранения Facebook с использованием дисков Blu-ray (идея, о которой компания говорила на прошлогоднем саммите). Кабинетный сервер вмещает 10 000 дисков Blu-ray, что составляет всего 1 петабайт памяти, и Facebook планирует в конечном итоге увеличить плотность до 5 петабайт на стойку. По словам Париха, по сравнению с существующей системой холодного хранения на жестких дисках серверы Blu-ray могут сократить расходы вдвое и снизить потребление энергии на 80 процентов. Facebook планирует протестировать производственную систему позднее в этом году и будет использовать серверы Blu-ray для холодного хранения редко используемых пользователем фотографий и видео.

Открытые вычисления и малые компании

Одна из вещей, которая больше всего заинтриговала меня с саммита, была указанием, что не только облачные компании, такие как Facebook, Rackspace и Microsoft, приняли эту концепцию. Вместо этого Франковский указал на то, что крупные корпоративные клиенты, такие как Bloomberg, Fidelity и Goldman Sachs, находятся в процессе развертывания Open Compute.

Интересно, что теперь есть больше способов использовать стандартные 19-дюймовые компоненты стойки с 21-дюймовым контейнером Open Rack, и наоборот. Например, Франковский указал, что Fidelity поставлялась со стойкой Open Bridge в стандартную стойку EIA в Open Rack. Компания Hyve Solutions взяла несколько системных плат Open Compute и упаковала их в стандартные 19-дюймовые лотки и вернула дизайн обратно в основу.

В панельной дискуссии Марк Андреессен, соучредитель и генеральный партнер Andreessen Horowitz, и Энди Бехтольсхайм, основатель, директор по развитию и председатель Arista Networks, рассказали о том, как тенденция к созданию менее дорогих центров обработки данных меняет бизнес.

Андреессен сказал, что в настоящее время существует радикальная возможность объединить программное обеспечение с открытым исходным кодом и аппаратное обеспечение с открытым исходным кодом в большом объеме, чтобы значительно снизить стоимость систем и предоставлять облачные услуги в таких областях, как здравоохранение и образование. Новые компании могут работать почти полностью в облаке, и, как следствие, за 500 000 долларов теперь можно купить стартап на два года для запуска продукта. В то время как Facebook (Андреессен в совете директоров) имеет большой капитальный бюджет, сказал он, если бы он существовал в 1999 году, для него потребовался бы бюджет в 50-100 раз больше, чем сейчас, возможно, тратя 100 миллиардов долларов в год на капитал оборудование, которое невозможно. Разработка более дешевого, более объемного оборудования - это то, что делает возможными такие сервисы, как Facebook или Google. По его словам, если вы планируете продвигаться вперед еще на 10 лет, услуги, которые будут возможны, будут ошеломляющими.

«Весь рост происходит в облаке», - сказал Бехтольсхайм, при этом традиционные расходы на ИТ остаются неизменными или сокращаются. Arista Networks разрабатывает сетевое оборудование, которое отвечает потребностям этих облачных центров обработки данных. Он сказал, что имеет смысл стандартизировать сетевое оборудование. По словам Бехтольсхайма, до тех пор, пока не появился проект Open Compute Project, в отрасли никогда не было форума для открытых совместных аппаратных инноваций. Сейчас, хотя есть еще несколько компаний, производящих свои собственные чипы, он считает, что это устаревшая модель. Дело в том, что вам нужен программный стек, который действительно работает. Аппаратное обеспечение - это просто, а программное обеспечение - сложно, сказал он, поэтому у Arista гораздо большая команда разработчиков программного обеспечения.

Бехтольсхайм сказал, что появление 64-битных вычислений и ARM SoC с более высокими частотами (не менее 2 ГГц) сделает ARM жизнеспособным в центре обработки данных. Это может произойти, когда это имеет смысл, сказал он. Он также сказал, что «в защиту Intel» он проделал замечательную работу, используя свои технологические процессы для создания более энергоэффективных и менее дорогих процессоров. По его словам, Intel является серьезным конкурентом, и вам нужны соревнования для продолжения инноваций. При нынешних темпах развития центр обработки данных, который сегодня стоит 1 млрд долларов, будет стоить всего 10 000 долларов за десятилетие. Это позволит использовать приложения следующего поколения.

Чтобы помочь сделать продукты Open Compute более общепринятыми, Франковский объявил о другом виде лицензирования технологий, более похожем на GPL, поэтому любые производные работы будут возвращены фонду, а также сертификацию оборудования Open Compute с использованием новых лабораторий в Тайване и на Техасский университет в Сан-Антонио.

Открытый вычислительный саммит показывает огромные аппаратные инновации