Серверы на ARM-процессорах. Грустное событие для Intel и х86 архитектуры

Когда мы говорим про рынок персональных компьютеров, первые имена, которые вспоминает большинство людей, это Windows и Intel, возможно, они идут в другой последовательности. Беспроигрышная связка Windows и Intel даже получила свое обозначение – Wintel, так как стратегически Microsoft шла рука об руку с Intel, их совместный продукт покорял один рынок за другим. Имя Intel на рынке компьютеров может считаться синонимом многих вещей, но главное, что это сердце почти любого компьютера, причем неважно, кто произвел процессор, сама компания Intel или ее прямой конкурент AMD, внутри все равно архитектура х86, которая создана компанией.
Пожалуй, можно смело сказать, что Intel многие десятилетия была той компанией, что определяла развитие рынка вычислений. Но ее время в этом качестве прошло, последний бастион в виде серверных архитектур де-факто пал вместе с анонсом процессора Grace от Nvidia, который основан на архитектуре ARM. Ирония этого события заключается в том, что именно Intel могла возглавить рынок процессоров для мобильных устройств, а затем вернуться с ARM-архитектурой в другие сегменты. Помните такой процессор, как Intel Atom, что создавался для смартфонов и других портативных устройств? Наверняка вы его забыли, а те немногие, кто им пользовался, в этот момент сдерживают себя, чтобы не выругаться. У Intel не получился мобильный процессор, так как компания с архитектурой х86 изначально ориентировалась на устройства, которые подключены к сети электрическим проводом. Появление ноутбуков привело к видоизменению х86 процессоров, они стали не такими прожорливыми, но это все равно были далеко не те мобильные устройства, которыми стали смартфоны.

В Intel искренне считали, что они на вершине мира, и для этого были все основания. Заблуждения компаний относительно своего положения на рынке и будущего всегда приводят к проблемам, вы могли убедиться в этом на примере Nokia, LG, Sony Ericsson и многих других, та же Apple сегодня идет ровно той же дорогой. Внутри Intel была компания XScale, которая создавала процессоры на ARM-архитектуре, и многие прочили ей светлое будущее, так как она могла занять огромную долю рынка в портативной электронике. Но в Intel решили, что негоже развивать чужую архитектуру, и, вооружившись напильниками, стали снимать лишнее со своих процессоров, чтобы те стали мобильными. Мне это всегда напоминало попытку превратить огромный грузовик в малолитражку, из него выкидывают кузов, кабину, не оставляют даже сидения. Меняют двигатель на небольшой, но оставляют раму и кучу ненужных креплений. Получившееся чудо-юдо гордо называют будущим автопрома, садитесь и езжайте. Динамика «малютки» как у грузовика, стиль вождения от грузовика и не нравится людям. Но вместо того, чтобы сделать какие-то выводы, в Intel тратят огромные усилия, чтобы доказать окружающим, что те просто не так воспринимают реальность. Никто не хочет спорить с Intel, партнеры кивают, но свои выводы делают.
В июне 2006 года Intel продает XScale за 600 млн долларов, это также заявление для команды разработчиков: у вас нет ни единого шанса не сделать мобильную архитектуру х86. Менеджмент Intel плохо понимает собственную компанию, возможности разработки и те задачи, что стоят перед ней. Начинается путешествие в ад разработчиков, когда не выдерживаются сроки, партнеры многократно пытаются продвигать Intel Atom, но каждый раз что-то идет не так. В конце концов за Intel Atom закрепляется слава бюджетного процессора для портативных компьютеров, ориентированных на тех, у кого нет денег на что-то нормальное. Это не просто компромисс, но компромисс с рядом оговорок. Фактически в Intel десять лет пытаются изобрести свой велосипед, но ничего дельного из этого не получается.
Взгляните, как развивались продажи процессоров на ARM-архитектуре, график говорит сам за себя.

К началу 2020 года в ARM вышли на продажи в размере 6.4 млрд процессоров за квартал! Причем рост продаж продолжается, так как вся электроника использует сегодня ARM-процессоры, от самых простых часов до смартфонов и даже компьютеров. Ярким примером являются MacBook и другие ПК от Apple на процессоре Apple M1. В Intel потеряли этот рынок, когда решили защитить свои наработки в х86, не помогать развивать конкурирующее решение. В итоге это решение развили другие, и Intel оказалась на обочине огромного рынка, который перекрывает весь рынок компьютеров вместе взятый.
Стратегия Intel в последние несколько лет выглядела удивительно. Компания вместо того, чтобы броситься в разработку ARM-процессоров, признать ошибки прошлого, пытается спасти архитектуру х86. Тут, конечно, самое время возмутиться, так как х86 процессоры в таком спасении не нуждаются, и это тоже правда! Для огромного количества задач и сфер применения в нашем мире нет альтернативы для х86 процессоров, они останутся востребованы долгие десятилетия. Но вот бизнес Intel будет страдать, так как альтернатива в виде ARM-процессоров уже здесь и они проникли во все сегменты рынка. Например, разработанный Nvidia процессор Grace для серверов основан на ARM-архитектуре (ARM v9), каждый суперкомпьютер на этих процессорах вычитает продажи х86 процессоров, ухудшает бизнес Intel. В компании разучились конкурировать на рынке, выгрызать свою долю в прямом столкновении, взлет того же AMD это хорошо доказывает.

Использование ARM-процессоров в серверах и суперкомпьютерах – это вовсе не экономия энергии (а они экономичны), а скорее дань архитектуре, ориентированной на AI-вычисления. Самые интересные алгоритмы и математические задачи решаются сегодня с помощью AI, обработки больших массивов данных, именно архитектура ARM ориентирована на этот тип вычислений. В то время как х86 процессоры универсальны, но не готовы к этому, а все попытки Intel соревноваться в этой области оборачиваются провалом.
У Intel будут отнимать рынок, в том числе в серверах и суперкомпьютерах, где она чувствовала себя неплохо. И это сильный удар, который оценили на бирже, посмотрите, как пошли вниз акции компании после анонса Nvidia Grace.

Это не говорит особо ни о чем, но косвенно указывает на настроение людей, мало кто верит в то, что Intel будет определять будущее вычислений, сегодня это, безусловно, компания ARM. И попытка Nvidia купить британскую ARM выглядит как попытка стать номером один в будущем мире, стать гигантом, который контролирует развитие человечества, и это ничуть не преувеличение. Хорошо, что даже сама ARM сопротивляется такой продаже.

Пока перспективой Intel становится контроль архитектуры х86, использование своих наработок там, где они востребованы. Но это больше не растущий рынок, а скорее медленно сползающий вниз сегмент. Никаких перспектив для роста продаж у Intel просто нет, компания постепенно становится специализированным производителем процессоров, который ориентирован на определенный круг задач. Переход Microsoft с Windows на ARM-архитектуру не за горами и ускорит эту тенденцию. Мы все чаще и чаще будем слышать, что ARM-процессоры нашли применение в той или иной области. И это нормально, так как они соответствуют современным задачам, тому, что нужно рынку (AI-вычисления везде без исключений за небольшие деньги). Даже стоимость ARM-процессоров ниже, чем у Intel-процессоров, хотя напрямую сравнить их невозможно, они слишком разные во многих аспектах.
Сказать, что Intel исчезнет, нельзя. Компанию будет трясти, она будет переживать далеко не лучшие времена и станет в конечном итоге заметно меньше, скукожится вместе с долей рынка х86 процессоров. У кого-то от этого разыграется ностальгия, но большинство людей на это просто не обратят внимания, так как у них будут в руках те же компьютеры с такими же приложениями. А главное, что совсем скоро смартфоны превратятся в аналог компьютеров, и это будет массовым направлением развития (что-то подобное DeX-режиму на смартфонах Samsung, когда ваш телевизор превращается в компьютер). И, конечно же, большая часть техники будет на ARM-процессорах, так как они уже победили Intel, которая все еще не может признать своего поражения. И единственным путем сохранения своей доли рынка у Intel является сегодня только один – примкнуть к ARM и выпускать свои решения на таких процессорах. То, чего Intel не сделала 16 лет назад и посчитала это тупиком для себя. Теперь нужно соглашаться совсем на других условиях, но хватит ли у них для этого духа? Скорее всего, хватит в момент, когда все станет еще хуже. А вы как считаете?
Ссылки по теме

Опубликовано 13 апреля 2021 г.
Серверы ARM
Протактиний (ранее протактиниум ) — это химический элемент с символом Па и атомным номером 91. Это плотный серебристо-серый актинидный металл, который легко реагирует с кислородом , водяным паром и неорганическими кислотами . Он образует различные химические соединения, в которых протактиний обычно присутствует в степени окисления +5, но он также может принимать +4 и даже +3 или +2 состояния. Концентрации протактиния в земной коре обычно составляют несколько частей на триллион, но в некоторых уранинитах могут достигать нескольких частей на миллион.
Серверы ARM ЦИФРА — аппаратное решение на базе усовершенствованной RISC-архитектруры, превосходно подходящее для работы с базами данных, виртуализации, построения SDS а также для работы с приложениями на базе платформы Linux. Основными преимуществами ARM архитектуры являются: большая производительность и меньшее тепловыделение при лаконичности самой архитектуры.

Двухсокетный сервер Pa21 высокой плотности высотой 1U поддерживает 128 ядер на частоте 2,6 ГГц, 10 дисков 2,5 дюйма SAS/SATA/SSD или 8 дисков 2,5 дюйма NVMe SSD.

| Pa21 | |
|---|---|
| Характеристика | Pa21 |
| Форм-фактор | Двухсокетный сервер 1U |
| Процессор | 2 х Kunpeng 920 |
| Память ОЗУ | 32 x DDR4 2933 MHz |
| Диски | 10 x HDD 2.5″ SAS/SATA или 8 х SSD 2.5″ NVMe |
| Поддержка RAID | RAID 0, 1, 10, 5, 50, 6 или 60 Суперконденсатор для защиты содержимого кэш-памяти при отключении питания |
| Сетевые порты | 2 x NIC LOM: 8 х 1GE или 8 x 10 GE SFP, или 8 x 25 GE SFP |
| Расширение PCIe | 2 х PCIe 4.0 x16 + 1 x PCIe 4.0 x8 |
| Модули вентиляторов | 7 х Hot Swap модулей вентиляторов, вращающихся в противоположных направлениях, с поддержкой резервирования по схеме «N+1» |
| Блоки электропитания | 2 x блока питания AC (100-240 В AC; 240 В DC) 900 Вт или 2000 Вт и поддержкой резервирования «1+1» |
| Температура эксплуатации | От 5º C до 35º C, что соответствует стандартам ASHRAE A3 и A4 |
| Размеры (ВxШxГ) | 43 мм x 435,6 мм x 790 мм |

Стоечный сбалансированный сервер Pa12 высотой 2U поддерживает 64 ядра на частоте 2,6 ГГц, 14 дисков SAS/SATA/SSD.

| Pa12 | |
|---|---|
| Характеристика | Pa12 |
| Форм-фактор | Односокетный сервер 2U |
| Процессор | 1 х Kunpeng 920 |
| Память ОЗУ | 16 x DDR4 2666 MHz |
| Диски | 14 х HDD или SSD 3.5″ SAS/SATA |
| Поддержка RAID | RAID 0, 1, 10, 5, 50, 6 или 60 Суперконденсатор для защиты содержимого кэш-памяти при отключении питания (опционально) |
| Сетевые порты | 1 x NIC LOM: 4 х 1GE или 4 x 10 GE SFP, или 4 x 25 GE SFP |
| Расширение PCIe | 3 х PCIe 4.0 x8 или 1 x PCIe 4.0 x16 + 1 х PCIe 4.0 x8 |
| Модули вентиляторов | 4 x Hot Swap модулей вентиляторов с поддержкой резервирования по схеме «N+1» |
| Блоки электропитания | 2 x блока питания AC (100-240 В AC; 240 В DC) 900 Вт или 2000 Вт и поддержкой резервирования «1+1» |
| Температура эксплуатации | От 5º C до 40º C, что соответствует стандартам ASHRAE A3 и A4 |
| Размеры (ВxШxГ) | 86,1 мм x 447 мм x 790 мм |

Двухсокетный стоечный сервер Pa22 высотой 2U поддерживает 64 ядра на частоте 2,4 ГГц, отличается высокой производительностью при низком энергопотреблении.

| Pa22 | |
|---|---|
| Характеристика | Pa22 |
| Форм-фактор | Двухсокетный сервер 2U |
| Процессор | 2 х Kunpeng 920 |
| Память ОЗУ | 32 x DDR4 2933 MHz |
| Диски | 16 x HDD 3.5″ или 27 х SSD 2.5″ SAS/SATA 16 х SSD 2.5″ NVMe |
| Поддержка RAID | RAID 0, 1, 10, 5, 50, 6 или 60 Суперконденсатор для защиты содержимого кэш-памяти при отключении питания |
| Сетевые порты | 2 x NIC LOM: 8 х GE или 8 x 10 GE SFP или 8 x 25 GE SFP |
| Расширение PCIe | 8 х PCIe 4.0 x8 или 3 x PCIe 4.0 x16 + 2 х PCIe 4.0 x8 |
| Модули вентиляторов | 4 x Hot Swap модулей вентиляторов с поддержкой резервирования «N+1» |
| Блоки электропитания | 2 x блока питания AC (100-240 В AC; 240 В DC) 900 Вт или 2000 Вт и поддержкой резервирования «1+1» |
| Температура эксплуатации | От 5º C до 40º C, что соответствует стандартам ASHRAE A3 и A4 |
| Размеры (ВxШxГ) | 86,1 мм x 447 мм x 790 мм |

Модель высокой производительности Pa42 — это четырехсокетный сервер высотой 2U, поддерживающий до 256 ядер и 24 SSD-дисков NVMe. Модель Pa42 отличается высокой плотностью вычислений, высокой производительностью хранилища и высокой скоростью сети.

| Pa42 | |
|---|---|
| Характеристика | Pa42 |
| Форм-фактор | Четырехсокетный сервер 2U |
| Процессор | 4 х Kunpeng 920 |
| Память ОЗУ | 32 x DDR4 3200 MHz |
| Диски | Конфигурация для 24 дисков: Фронтальные: 24 x 2,5″ SSD-диска NVMe Задние: 2 x 2,5″ SAS/SATA/SSD |
Фронтальные: 8 x 2,5″ NVMe SSD-дисков и 16 x 2,5″ дисков SAS/SATA/SSD
Задние 2 x 2,5″ диска SAS/SATA/SSD

Сбалансированный двухсокетный сервер Pa22 V2 высотой 2U оснащен 128 ядрами, работающими с частотой 2,6 ГГц, и позволяет установить до 28 твердотельных накопителей NVMe.

| Pa22 V2 | |
|---|---|
| Характеристика | Pa22 V2 |
| Форм-фактор | Двухсокетный сервер 2U |
| Процессор | 2 х Kunpeng 920 |
| Память ОЗУ | 32 x DDR4 2933 MHz |
| Диски | Модель с 12 дисками: Фронтальные: 12 внутренних 3,5″ дисков SAS/SATA или SSD Задние: 4 внутренних 3,5″ диска SAS/SATA или SSD |

Двухсокетный сервер Pa25 высотой 4U обеспечивает до 128 ядер и емкость локального хранилища 1 ПБ.

| Pa25 | |
|---|---|
| Характеристика | Pa25 |
| Форм-фактор | Двухсокетный сервер 4U |
| Процессор | 2 х Kunpeng 920 |
| Память ОЗУ | 16 x DDR4 2933 MHz |
| Диски | Внутренние: 72 x SSD 3.5″ SAS/SATA 2 х SSD 2.5″ SATA 4 x SSD 2.5″ NVMe |
| Поддержка RAID | RAID 0, 1, 10, 5, 50, 6 или 60 Суперконденсатор для защиты содержимого кэш-памяти при отключении питания |
| Сетевые порты | 4 x GE + 4 х 25/10 GE SFP |
| Расширение PCIe | 6 х PCIe 4.0 x8 или 1 x PCIe 4.0 x16 + 4 х PCIe 4.0 x8 |
| Модули вентиляторов | 4 x Hot Swap модулей вентиляторов с поддержкой резервирования «N+1» |
| Блоки электропитания | 2 x блока питания AC (100-240 В AC; 240 В DC) 2000 Вт и поддержкой резервирования «1+1» |
| Температура эксплуатации | От 5º C до 35º C, что соответствует стандартам ASHRAE A3 и A4 |
| Размеры (ВxШxГ) | 175 мм x 447 мм x 900 мм |
Серверные ARM-процессоры: начинают и выигрывают? Спрос продолжает расти

О серверных процессорах с ARM-архитектурой мы писали еще пару лет назад. Уже тогда они не были экзотикой, хотя только начинали проникать в разработку серверов. Экспансия, если так можно выразиться, ARM-чипов на серверный рынок стала более активной после того, как их возможности оценили игроки отрасли. Как оказалось, показывают себя они очень неплохо.
Сейчас, судя по результатам исследования ряда аналитических компаний, их популярность продолжает расти, и в ближайшем обозримом будущем эта тенденция сохранится. В частности, благодаря облачным платформам и ЦОД, которые постепенно заказывают все больше оборудования на базе ARM-процессоров. Подробнее — под катом.
Что там с ростом популярности?
Изучив рынок, компания TrendForce спрогнозировала развитие мирового рынка серверных процессоров с архитектурой ARM. Прогноз положительный, по словам экспертов, рост поставок серверов на основе таких чипов можно назвать рекордным.
Чипы и оборудование, базирующееся на них, востребовано благодаря еще одной тенденции — активному росту платформ высокопроизводительных вычислений, а также ИИ-платформ. ARM-чипы потребляют меньше энергии, по сравнению с «коллегами» с традиционной архитектурой x86. Ну а раз так, то их вполне охотно раскупают производители серверного оборудования, которое поставляются в ЦОДы.
По мнению аналитиков из TrendForce, к 2025 году, а это, на минуточку, всего три года, уровень проникновения ARM-чипов на рынок серверов вырастет до 22%. Конечно, x86 еще долго будет оставаться на коне, но ARM-сервера постепенно будут составлять все более серьезную конкуренцию.
- Возможность поддерживать разнородные и динамически меняющиеся рабочие нагрузки. Все благодаря масштабируемости, которую обеспечивают чипы, а также их экономичности, о чем уже говорилось выше.
- Решения на базе ARM-чипов можно адаптировать под выполнение самых разных задач, включая очень узкоспециализированные.
- Кроме того, оборудование получается менее габаритным, чем обычно, так что и площадь занимают меньшую.
Если вы читаете наш блог, вас могут заинтересовать эти тексты:
Сложная история ARM-процессоров на серверном рынке со счастливым концом
До завершения всей этой истории по проникновению ARM-архитектуры на рынок еще далеко. Но ясно одно — развивается эта отрасль все активнее. Ряд крупных производителей чипов либо уже начал производить серверные процессоры на ARM-архитектуре, либо собирается сделать это в ближайшем обозримом будущем. Но так было не всегда.
Дело в том, что первый серверный ARM-чип был анонсирован еще 10 лет назад. Это сделала компания Calxeda, у которой, к сожалению, возникло много проблем на пути, и она закрылась в 2013 году. Тем не менее, она была первой, кто заявил о производстве таких чипов, рассказав в 2011 году о 32-битном процессоре на базе ARM Cortex-A9. Он позволял создавать серверы формата 2U со 120 процессорами (480 ядер совокупно).
Затем появились AMD Opteron A1100, это случилось в 2016 году, это на два года позже, чем компания планировала изначально. Но популярными и востребованными эти процессоры не стали. Затем собственный вариант ARM-процессора для серверов представила Qualcomm. Вернее, компания регулярно публиковала новости о разработке, на что она потратила около четырех лет, но в итоге проект был закрыт.

Компания Marvell на мероприятии Hot Chips 32 раскрыла подробности о третьем поколении ARM-процессоров Thunder-X, но они тоже не стали особо востребованными и популярными. Проблема была не в процессоре, а в том, что компании, которые закупают серверное оборудование, например, гиперскейлеры, оказались не готовы к новой технологии. Они относились к ней с недоверием и если и приобретали системы нового типа, то лишь для тестирования. Все закончилось уходом из компании главного архитектора чипов, затем — увольнением более 100 инженеров.

Но сейчас, кажется, «темные времена» для ARM в серверной отрасли прошли. Так, всего несколько дней назад компания NVIDIA анонсировала собственные 144-ядерные Arm-процессоры Grace, с гибридом Grace Hopper. Система Grace Hopper сочетает в себе как процессоры Grace (ARMv9), так и ускорители Hopper. У процессора Grace Superchip для ИИ- и HPC-нагрузок — 144 ядра. В SPECrate2017_int_base он показал 740, что позволило NVIDIA говорить о превосходстве по сравнению с парой AMD EPYC в полтора раза.
Нельзя забывать и о компании Huawei с ее чипом Kunpeng 920. На его базе компания производит серию серверов TaiShan, предназначенных для решения разных задач — периферийных вычислений, высоконагруженных приложений и т.п. Об этих серверах мы уже писали, после того, как протестировали.
Ну хорошо, а что с серверами на базе ARM-чипов?
Статистики не так много, но в конце прошлого года специалисты аналитической компании Omdia опубликовали отчет Data Center Server Tracker, согласно которому поставки серверов с процессорами ARM достигли рекордного уровня за всю историю. Как оказалось, каждый двадцатый сервер, а это около 170 тыс. единиц оборудования, базируются на основе чипов нового типа. Статистика анализировалась по поставкам оборудования с июля по сентябрь 2021 года.
Кроме достоинств чипов и серверов такого типа, о чем уже говорилось выше, рост был обусловлен еще и влиянием глобального дефицита электронных компонентов. По этой причине многие крупные компании начали искать оборудование на базе альтернативных архитектур CPU.
В целом, мы уже писали, что для массового внедрения ARM-платформ нужно несколько составляющих. Первое — хорошая архитектура, второе — фабрика, которая способна производить чипы по современному техпроцессу. Третье — инновации для создания энергоэффективного кристалла с большой частотой. И последнее — требуется огромный тираж для того, чтобы стоимость такого чипа была конкурентоспособной, а производство процессора — выгодным.
Большинство компаний, которые производили ARM-чипы и оборудование на их основе, испытывали проблемы как раз с последней составляющей. Цены были высокими, а производительность системы — примерно такой же, что предлагали Intel, причем по меньшей цене. Но сейчас, с ростом популярности ARM-серверов, ситуация явно меняется к лучшему. Производство чипов становится более масштабным, индустрии требуются все большие объемы процессоров и оборудования на их основе.

Так что вполне может быть, что ARM-серверы ожидает светлое будущее, которое уже где-то рядом.
- Блог компании Selectel
- IT-инфраструктура
- Исследования и прогнозы в IT
- Компьютерное железо
- Процессоры
Результаты теста 80-ядерного ARM-процессора Ampere Altra и сравнение с AMD EPYC
Делимся бенчмарками GIGABYTE E252-P30 с 80-ядерным процессором от Ampere Altra.

В нашу лабораторию пришел сервер GIGABYTE E252-P30 с 80-ядерным процессором от Ampere Altra Q80-30. Этот ARM-процессор уже отметился характеристиками: процессоры с таким числом ядер с частотой 3.0 ГГц при TDP в 210 Вт не предлагает ни один «звездный» вендор.
Мы прогнали сервер через ряд тестов и сравнили с наиболее близким по характеристикам AMD EPYC 7513. В тексте рассказываем, какие результаты у нас получились.
Зачем мы вообще взяли ARM-процессор на тест
Ранее в дата-центрах Selectel уже были представители семейства ARM — так, у нас есть серверы с «малинками» и процессорами M1. Но полноценно серверных ARM-ов еще не было.
При этом архитектура довольно многообещающая — ARM-процессоры хорошо показывают себя в тестах. Так, Ampere Altra Q80-30 будет полезен в высокопроизводительных вычислениях и при создании облачных платформ. Уже сейчас вы можете арендовать выделенный сервер c ARM-процессором (Ampere Altra Max M128-30 3 ГГц, 128 ядер) или же протестировать сервер с ним бесплатно — в Selectel Lab (на тесте — 80-ядерный процессор).
ARM-архитектура привлекает внимание. Лидером по использованию таких чипов в инфраструктуре является Amazon — компания планирует перевести часть облачных сервисов на эту архитектуру к 2025 году. Также производством процессоров для открытого рынка занимаются Ampere и Huawei. К слову, AMD тоже пытался последовать тренду, но пока не достиг успеха.

Чем еще интересен ARM?
- Последние годы ARM-архитектура развивается за счет драйвера мобильных устройств.
- Большинство платформ (JVM, V8, PVM и др.) портированы на ARM.
- Большая экосистема свободного ПО хорошо сочетается с ARM.
Итак, наконец Ampere Altra оказался у нас в руках. Перейдем к тестам и ответим на вопрос, действительно ли он так хорош, как говорят?
ARM-сервер с Ampere Altra® в Selectel Lab
Проверьте производительность 80-ядерного ARM-сервера с частотой 3,0 ГГц от GIGABYTE.
Собираем тестовый конфиг

Итак, что у нас в сборке:
- Материнская плата GIGABYTE MP32-AR1-00
- Процессор Ampere Altra Q80-30
- Память: 16 x 16 ГБ Micron DDR4 3200 МГц ECC (256 ГБ)
- 2 SSD-накопителя Micron_5300 на 480 ГБ
- NVMe-диск на 1 ТБ M.2 SSD (GIGABYTE GP-AG41TB)
- Три видеокарты Nvidia TESLA T4
Три GPU подключены для проверки работы PCIe-линий при полной загрузке.
Еще немного о железе
Режим: UEFI
Архитектура: aarch64
System Information:
Operating System Ubuntu 22.04.1 LTS 5.15.0-50-generic aarch64
Model GIGABYTE E252-P30-00
Motherboard GIGABYTE MP32-AR1-00
Processor Information
Name ARM ARMv8
Topology 1 Processor, 1 Core, 80 Threads
Identifier ARM implementer 65 architecture 8 variant 3
part 3340 revision 1
Base Frequency 3.00 GHz
Краткий обзор модели Altra-систем GIGABYTE
В этой модели мы имеем компактный edge-сервер в 2U-шасси малой глубины: 439 × 86 × 449 мм. Для удобства в переднюю панель выведена дисковая корзина на шесть SFF-накопителей (SAS-3/SATA-3) с поддержкой горячей замены, а также IO-панель материнской платы и все слоты PCI Express.


Список модификаций процессора Ampere Altra и примерные цены. Красным выделен наш тестируемый.

Условия тестирования
В Selectel Lab мы тестируем железо не только для того, чтобы сравнивать заявленные характеристики с реальностью. Также нам важно выяснить, насколько та или иная платформа, серверная комплектующая и т.д. способны встроиться в общую систему дата-центров Selectel. На потенциальный конфиг должны хорошо накладываться существующие автоматизации для выделенных серверов. Они позволяют выдавать серверы клиентам в течение 5 минут. Также нам нужно понимать, насколько энергоэффективен сервер. Потребление электроэнергии и температурный режим — важные характеристики для дата-центров.
К слову, отечественные «Эльбрусы» тут нам не очень подошли. Прочитайте, как мы их тестировали.
В общем, у нас были некоторые требования к тестам, и они вылились в следующий список:
- AI-Benchmark — измеряет скорость, энергопотребление и требования к памяти для нескольких ключевых алгоритмов искусственного интеллекта.
- Geekbench 5 — утилита для тестирования CPU и GPU.
- gpu-burn — проведем классический стресс-тест для видеокарт.
- Проверим наши GPU с помощью показателей скорости кодирования/декодирования видео через программу ffmpeg NVENC.
- CUDA Toolkit — пакет библиотек, компиляторов и ПО для работы с видеокартами.
- Проверка температурного режима и энергопотребления. Для получения нужных графиков использовал стандартный софт для мониторинга — Grafana и Prometheus.
С чем будем сравнивать
Для сравнения с Amper Altra выбрали два процессора AMD EPYC 7513 — 64 ядра в сумме, базовая частота 2,6 ГГц (до 3.65 ГГц в режиме Turbo CORE). Этот CPU — достойный конкурент, который входит в топ-3 по результатам бенчмарков в single-core режиме. Это наш собственный рейтинг процессоров, которые были на тесте в Selectel Lab. Полный список можно посмотреть в нашем профиле Geekbench5.
Кроме того, цена на сравниваемые процессоры, по данным открытых источников, приблизительно равна.

Подготовка к тестам
Установка операционной системы и ПО
Пока ARM-архитектура поддерживает ограниченное количество дистрибутивов.
- ALT Linux,
- Arch linux,
- Astra Linux,
- Bodhi Linux,
- Chrome OS,
- Debian,
- ELinOS,
- Fedora,
- Centos,
- Gentoo,
- GoboLinux,
- iPodLinux,
- Kali linux,
- Maemo,
- MeeGo,
- MontaVista,
- openSUSE,
- Open webOS,
- Sailfish OS,
- Slackware,
- SteamOS,
- T2 SDE,
- Ubuntu,
- Wind River Linux.
Selectel поддерживает четыре из них: Astra Linux, Debian, Centos, Ubuntu.
На сервер решил установить Ubuntu, так как это наиболее частая в использовании ОС. В методиках испытаний использовал Ubuntu 22.04.01 LTS 5.15.0-50-generic aarch64 — это наиболее свежий дистрибутив Ubuntu под архитектуру aarch64.
Здесь никаких сюрпризов: операционная система установилась без проблем, с драйверами для видеокарт трудностей не возникло. Установка cuDNN 11.7, NVIDIA-SMI 515.65.01, libcudnn8 прошла корректно.

Теперь переходим к тестам.
Результаты Geekbench 5
Результат получился интересный и конкурентный. В целом, процессор Ampere Altra близок по характеристикам к флагманскому «эпику» от AMD.
| Процессор | Кол-во ядер/ потоков | Base/Max частота, ГГц | Single-Core Score | Multi-Core Score | Link |
| Ampere Altra Q80-30 | 80/80 | 1.00/3.00 | 883 | 42374 | https://browser.geekbench.com/v5/cpu/17900837 |
| 2x AMD EPYC 7513 | 64/128 | 2.60/3.65 | 1299 | 32377 | https://browser.geekbench.com/v5/cpu/2874631 |
| AMD EPYC 7552 | 48/96 | 2.20/3.30 | 1022 | 35438 | https://browser.geekbench.com/v5/cpu/428800 |
На графике ниже — сравнение проведенных тестов Ampere Altra Q80-30 и AMD EPYC 7513 в Geekbench 5.
Результат в режиме Single-core:

В этом режиме AMD имеет большое преимущество перед ARM-процессором. Но все меняется, если мы тестируем две разные архитектуры чипа в режиме Multi-core:

Мы видим, что ARM-процессор сильно выбивается вперед по всем критериям. Особенно это заметно в параметрах, которые касаются параллелизации. Если задача хорошо параллелится, чем больше ядер — тем лучше. При этом не просто квазиядер (гипертрейдинговых), с которыми работает x86-архитектура, а физических ядер. Поэтому в ряде критериев — например, гауссовском размытии, HDR, Camera и т.д. — ARM лидирует очень уверенно. Впрочем, вы видите сами: вся магия происходит именно в многопоточном режиме.

Краткий вывод: В однопоточном режиме процессор выдает довольно скромные результаты (впрочем, опять же, показатели не так далеко ушли от AMD EPYC). Зато в мультипоточном лидерство Ampere Altra очень уверенное. Даже несмотря на то, что использовалось два процессора AMD EPYC 7513, Ampere Altra Q80-30 составляет конкуренцию процессору от AMD. На момент публикации, согласно внутренним бенчмаркам Selectel, этот процессор на втором месте по производительности после AMD EPYC 7742.
Тесты видеокарт
Не все из планируемых тестов графических процессоров удалось провести из-за особенности архитектуры ARM. Так, под aarch64 TensorFlow — довольно сложно собрать. Времени на подобную работу не было заложено в первую итерацию тестирования, поэтому мы отложили эту задачу на будущее. В итоге провести тест GPU через AI-Benchmark не удалось.
Geekbench 5, в свою очередь, не поддерживает на данный момент бенчмарк CUDA и OpenCL GPU под aarch64. Здесь тоже без результатов.
Зато результаты кодирования/декодирования через ffmpeg получены.
Результаты декодирования видео
Мы хотели посмотреть, как проявят себя процессоры в данных конфигах. Также важно было выяснить, что уже работает «из коробки» — без допиливаний ПО.
Для тестов взяли наше эталонное видео в разрешении 4K размером 618 МБ.
Команда на выполнение декодирования:
time ffmpeg -y -i input.mp4 -preset fast -b:v 5M -profile:v high -bf 3 -rc-lookahead 20 -vsync 0 output.mp4
| Конфигурация | FPS | Время |
| Ampere Altra Q80-30 | 65 | 4m53.608s |
| 2х AMD EPYC 7513 | 95 | 3m20.599s |
Краткий вывод: В данном тесте выиграл AMD — возможно из-за большего количества потоков (напомним, что их 128). Также не стоит забывать, что у него два сокета, а у ARM — один.
Стресс-тест процессора
Справочная информация по политикам работы процессора
Для стресс-теста ARM-процессора мы использовали несколько режимов политик работы процессора — ondemand, performance. Эти режимы есть и на х86-архитектурах.
Ondemand. Режим установлен по умолчанию. В нем — пошаговое повышение работы частоты CPU, в зависимости от нагрузки, а также напряжения CPU. Каждые 20~200 мс замеряется нагрузка на CPU, общая или системным пользователем. Если нагрузка на текущей частоте более 95%, частота повышается. Если менее 20% — частота понижается на один шаг.
Например, если доступные частоты — 800-2000-3000 МГц, то при загрузке CPU на 95% частота переходит с 2000 на 3000 МГц. Частота замера, процент загрузки перехода для всех режимов выставляется при компиляции ядра.
Performance. Название режима говорит само за себя. В нем процессор выдает максимально доступную частоту, максимум своей производительности.
Существуют и иные режимы, в которых процессор ведет себя по-другому. Но мы их не тестировали, так как нам было важно изучить стабильную работу процессора и его максимальные возможности.
Возможные режимы работы процессора:
- powersave — из названия можно догадаться, что это режим сохранения энергии: минимум производительности, максимум энергоэффективности.
- shedutil — похож на ondemand, но умеет использовать данные планировщика задач CFS. За счет этого действует более разумно. Однако он не работает с отличными от CFS планировщиками — например, с muQSS Коливаса.
- userspace — работа процессора на заданной пользователем частоте.
- conservative — похож на режим ondemand, но показатель для перехода частоты процессора в большую или меньшую сторону ниже — обычно 20%. Например, доступно 500-1000-2000 МГц, работаем на 500 МГц. Нагрузка возросла на 30% — переходим на 1000 МГц.
Чтобы выставить режим, или политику, работы процессора в Ubuntu, используйте следующую команду:
#echo performance | tee /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor

Результаты стресс-теста
Результаты стресс-теста любопытные: температурные графики не менялись, хотя частота ядер в первом тесте была меньше, чем во втором

- График сверху указывает на среднюю частоту среди ядер.
- Второй график показывает частоту на каждое ядро.
Первый тест начался с 12:50 до 13:40 в режиме ondemand. Повторный стресс-тест — c 13:40 до 14:50 — в режиме performance. При этом энергопотребление не изменилось. Как можно увидеть, в режиме ondemand процессор работает не на максимум и скидывает частоту на некоторых ядрах.
Краткий вывод: Причин у такого поведения в режиме ondemand может несколько. Первый — процессор реально перегревается и дропает частоту на наиболее горячих ядрах. Второй — ARM настолько умный, что видит: ядро не утилизилируется и просто понижает частоту для экономии энергопотребления.
Перед выбором конкретного режима использования процессора стоит оценить, для каких задач вы используете сервер. У каждого режима есть свои особенности, которые стоит учитывать.
Температурный режим и энергопотребление
Как уже показали графики, теплопакет во время стресс-теста процессор поддерживает очень хорошо. Изменение частоты работы процессора не влияет на показатели.
Теперь — к заводским значениям температуры:

Энергопотребление процессора составило 150 Вт в пике стресс-теста при паспортном TDP — 210 Вт.

Краткий вывод: Показатели температур и энергоэффективности довольно комплиментарны для использования в дата-центрах. Но мы еще планируем перепроверять данные в других конфигах и сборках. Процессор новый для нас и требует более масштабной проверки.
Заключение
Базовые тесты ARM-процессора Ampere Altra показали, что на данный момент этот CPU эффективнее с точки зрения электропотребления. Учитывая этот факт и цену процессора, он экономически выгоден для дата-центра.
Для клиента же этот процессор — возможность оценить преимущества ARM-архитектуры в высокопроизводительных вычислениях. Кроме того, конфиг с новым ARM стоит дешевле, чем сборка со сравниваемым AMD EPYC. Это хорошее предложение, учитывая небольшую разницу в бенчмарках процессоров.
Мы продолжим тесты новой платформы — в конкретных приложениях и задачах. Приглашаем к тестированию и вас. Сейчас вы можете оставить заявку в Selectel Lab и попробовать ARM-процессор в своих рабочих задачах.