Видео: ÐÑÐµÐ¼Ñ Ð¸ СÑекло Так вÑпала ÐаÑÑа HD VKlipe Net (Ноябрь 2024)
В то время как серверные чипы привлекают к себе наибольшее внимание на ежегодной конференции Hot Chips, AMD и Intel воспользовались случаем, чтобы рассказать о чипах, выпущенных ранее в этом году, и дали чуть больше тизеров о процессорах, которые еще предстоит выпустить.
Еще до официального начала конференции AMD, Qualcomm и другие члены Гетерогенного системного альянса (HSA) продвигали новые спецификации HSA, разработанные для улучшения совместной работы SoC (система на кристалле) с различными типами процессоров, с более унифицированной моделью памяти. Первоначально это нацелено на то, чтобы заставить ЦП и встроенные графические блоки (GPU) работать более унифицированно, хотя поддержка других типов встроенных ускорителей появится позже.
Обратите внимание, что это несколько отличается от других подходов, таких как Open CL от Kronos Group или CUDA от Nvidia, которые предназначены для управления вычислениями на GPU, но чаще всего используются с дискретной графикой.
Тем не менее, концепция очень похожа, и многие инструменты и библиотеки, которые поддерживают такие вещи, как Open CL, могут быть адаптированы к HSA. Идея состоит в том, чтобы упростить параллельное программирование как для CPU, так и для GPU, используя стандартные языки программирования. Хорошее начало - иметь процессоры со всеми этими компонентами, совместно использующими память с высокой пропускной способностью, но они становятся гораздо более полезными, поскольку разработчики действительно могут ими воспользоваться.
AMD много лет говорила о концепции HSA, а в Hot Chips компания провела некоторое время, рассказывая о чипах, выпущенных ранее в этом году, известных как Kabini и Richland.
Kabini, которая продается как серия E и нижняя часть серии A, использует четырехъядерный процессор "Jaguar" x86, а также архитектуру Radeon HD 8000 Graphics Core Next (GCN). Компания заявила, что это «настраивает нас на разнородные вычисления». AMD говорит, что это дает им более чем вдвое большую производительность на ватт предыдущего поколения (известного как Онтарио). Kabini использует 914 миллионов транзисторов и измеряет 105 мм 2 при 28 нм процессе.
Richland, который составляет высококлассные детали серии A, представляет собой переработанную версию чипа Trinity, все еще производимого по 32-нм техпроцессу. Этот чип имеет два модуля с ядрами ЦП Piledriver (каждый модуль имеет два целочисленных ядра и обладает общими функциями с плавающей запятой и другими функциями), каждый с 2 МБ общей кэш-памяти L2 и графическим процессором Radeon HD 8000 с поддержкой DX11 с шестью вычислительными блоками. Но основное внимание было уделено тому, как AMD смогла улучшить управление питанием.
Richland добавляет встроенные датчики для измерения температуры, дополнительное состояние повышения, настраиваемое значение TDP для OEM-производителей и «интеллектуальное повышение», которое определяет, чувствительна ли рабочая нагрузка на ЦП к частоте. В противном случае Intelligent Boost может снизить нагрузку на процессор и обеспечить большую мощность графического процессора для повышения общей производительности системы. В целом AMD заявила, что Richland обеспечивает на 29% более высокую производительность процессора и на 41% лучшую производительность GPU, чем Trinity, и была на 51% более эффективной, чем Trinity в воспроизведении HD-видео. В своих собственных тестах я обнаружил, что он все еще намного медленнее в задачах с чистым процессором, чем конкурирующие чипы Intel, но я не особо сосредоточился на времени автономной работы. Richland не поддерживает HSA - спецификация на самом деле не завершена, - но компания заявила, что она «вероятно, соответствует 60%». Это будет заменено в начале следующего года чипом, известным как Kaveri, который должен поддерживать больше функций HSA.
Что касается Intel, то она дала более подробную информацию о процессоре семейства Core 4-го поколения, известном как Haswell, который начал поставляться пару месяцев назад. Это семейство двух- и четырехъядерных процессоров с множеством различных графических опций, теперь включает версию со встроенным DRAM для графических вариантов самого высокого уровня.
Как и последние поколения, Haswell объединяет ядра ЦП и GPU на одном кристалле с общим кешем последнего уровня и поддерживает стандартные API-интерфейсы программирования, такие как OpenCL. Но некоторые версии Core 4-го поколения с графикой Iris Pro также включают дополнительные 128 МБ eDRAM в том же пакете, хотя и на отдельной матрице.
Большой кэш позволяет системе ускорить выполнение существующих задач. Например, графический процессор теперь может сохранять и повторно использовать данные от кадра к кадру для повышения производительности 3D-игр. Хотя ядра ЦП и GPU используют одни и те же физические пулы памяти, они по-прежнему используют отдельные указатели или адреса виртуальной памяти, что отличает его от более амбициозного подхода HSA Foundation. Но кажется справедливым сказать, что Intel движется в том же направлении, что и использование графического процессора для увеличения вычислительной нагрузки и упрощения программирования с поддержкой новейших стандартов DirectX 11 и OpenCL.
Большая часть разговоров касалась того, как Haswell лучше справляется с управлением питанием. Он имеет новое чрезвычайно низкое энергопотребление в активном состоянии (называемое S0ix), предназначенное для того, чтобы система могла собирать информацию, используя при этом очень мало энергии. И Haswell объединяет большое количество отдельных регуляторов напряжения, которые были отдельными компонентами в Ivy Bridge и предыдущих поколениях.
Другие изменения включают улучшения обработки графики и мультимедиа, включая воспроизведение видео 4K и видео QuickSync со скоростью, в четыре-12 раз превышающей скорость реального времени. Само ядро имеет новый прогноз ветвления и другие функции, а новые вычислительные инструкции включают AVX2, в то время как чип добавляет поддержку транзакционной памяти для баз данных и высокопроизводительных вычислений, а также улучшенную поддержку виртуализации. Мои первоначальные тесты на системах Haswell показали некоторые улучшения производительности в реальных тестах, но важными новостями здесь, как представляется, является время автономной работы, причем некоторые системы, такие как MacBook Air, демонстрируют значительные улучшения.
Intel не выступила с докладом о Bay Trail, его предстоящей SoC для мобильных устройств. Он, вероятно, ждет Intel Developer Forum на следующей неделе, но предоставил более подробную информацию о своем Atom Z2580, версии CloverTrail + для смартфонов. Сюда входят два ядра процессора Atom, а также двухъядерная графика (Power-VR SGX544MP2 от Imagination Technologies), контроллер памяти и механизмы кодирования и декодирования видео. По сравнению с предыдущим поколением, известным как Medfield, этот процесс перешел от одноядерного / двухпоточного ЦП к двухъядерному / четырехпотоковому дизайну, а также улучшил память, графику, дисплей и функции воспроизведения музыки с низким энергопотреблением, включая новые состояния управления питанием. В целом, по словам Intel, это обеспечило двукратное улучшение производительности процессора и трехкратное улучшение графики. (Результаты тестов, особенно по сравнению с системами ARM, были противоречивыми.)
Я надеялся, что мы услышим больше о Bay Trail от Intel - в конце концов, он должен быть в продаже систем для праздничного сезона - и, возможно, о Kaveri от AMD. Но, тем не менее, когда вы думаете об изменениях, происходящих на рынке процессоров, - об отказе от производительности в качестве наиболее важных критериев и вместо этого повышенного внимания к эффективности энергопотребления и масштабируемости - это был довольно интригующий год на рынке процессоров.