Производительность железа, измеряемая во флопсах: что это и с чем едят?
Для измерения производительности вычислительной техники придумали единую величину — флопсы. Рассказываем, что это такое.
Новейшее поколение игровых консолей достигло отметки в десяток терафлопс. Но что именно означает эта величина?
Производительность, измеряемая во FLOPS — это количество операций с плавающей запятой, которое может выполнить устройство за одну секунду. Отсюда и название: FLoating-point Operations Per Second. Сравнивать вычислительную мощность по флопсам намного проще, чем по тактовой частоте или чему-либо ещё.
На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.
Современная техника имеет колоссальную мощность. Поэтому, что бы не использовать большое количество нолей, к флопсам добавляют приставки СИ: гигафлопсы, терафлопсы, петафлопсы.
Краткий список железа и его производительности:
- Sega Dreamcast (1998) — 1,4 ГФлопс;
- Intel Core 2 Duo (2006) — 19,2 ГФлопс;
- МЦСТ Эльбрус-8С (2016) — 125 ГФлопс;
- Intel Core i7-4930K (2013) — 163 ГФлопс;
- Microsoft Xbox 360 (2005) — 115 ГФлопс (ЦП) и 240 ГФлопс (ГП);
- AMD Ryzen 7 3700X (2019) — 460 ГФлопс;
- Sony PlayStation 4 (2013) — 1,84 ТФлопс;
- GeForce RTX 2080 Ti (2018) — 13,5 ТФлопс (для 32-разрядных вычислений);
Что это за железка? Угадайте устройство по его силуэту
Самым слабым компьютером можно назвать Z3. Его вычислительная мощность составляет 2 флопса. Да, верно — он осиливает всего 2 операции в секунду. Но это простительно, ведь Z3 — первая работоспособная программируемая вычислительная машина, собранная ещё в 1940 г.
На данный момент этот блок не поддерживается, но мы не забыли о нём! Наша команда уже занята его разработкой, он будет доступен в ближайшее время.
Cамым мощным компьютером на момент 2020 года можно назвать Фугаку — японский суперкомпьютер. Его заявленная мощность составляет 0,54 эксафлопса (для 64-разрядных вычислений). Это 540 000 терафлопс.
Следите за новыми постами по любимым темам
Подпишитесь на интересующие вас теги, чтобы следить за новыми постами и быть в курсе событий.
Петафлопс
FLOPS (или flops или flop/s)(акроним от англ. Floating point Operations Per Second , произносится как флопс) — величина, используемая для измерения производительности компьютеров, показывающая, сколько операций с плавающей запятой в секунду выполняет данная вычислительная система.
Поскольку современные компьютеры обладают высоким уровнем производительности, более распространены производные величины от FLOPS, образуемые путём использования стандартных приставок системы СИ.
Флопс как мера производительности
Как и большинство других показателей производительности, данная величина определяется путём запуска на испытуемом компьютере тестовой программы, которая решает задачу с известным количеством операций и подсчитывает время, за которое она была решена. Наиболее популярным тестом производительности на сегодняшний день является программа LINPACK, используемая, в том числе, при составлении рейтинга суперкомпьютеров TOP500.
Одним из важнейших достоинств показателя флопс является то, что он до некоторых пределов может быть истолкован как абсолютная величина и вычислен теоретически, в то время как большинство других популярных мер являются относительными и позволяют оценить испытуемую систему лишь в сравнении с рядом других. Эта особенность даёт возможность использовать для оценки результаты работы различных алгоритмов, а также оценить производительность вычислительных систем, которые ещё не существуют или находятся в разработке.
Границы применимости
Несмотря на кажущуюся однозначность, в реальности флопс является достаточно плохой мерой производительности, поскольку неоднозначным является уже само его определение. Под «операцией с плавающей запятой» может скрываться масса разных понятий, не говоря уже о том, что существенную роль в данных вычислениях играет разрядность операндов, которая также нигде не оговаривается. Кроме того, величина флопс подвержена влиянию очень многих факторов, напрямую не связанных с производительностью вычислительного модуля, таких как: пропускная способность каналов связи с окружением процессора, производительность основной памяти и синхронность работы кэш-памяти разных уровней.
Всё это, в конечном итоге, приводит к тому, что результаты, полученные на одном и том же компьютере при помощи разных программ, могут существенным образом отличаться, более того, с каждым новым испытанием разные результаты можно получить при использовании одного алгоритма. Отчасти эта проблема решается соглашением об использовании однообразных тестовых программ (той же LINPACK) с осреднением результатов, но со временем возможности компьютеров «перерастают» рамки принятого теста и он начинает давать искусственно заниженные результаты, поскольку не задействует новейшие возможности вычислительных устройств. А к некоторым системам общепринятые тесты вообще не могут быть применены, в результате чего вопрос об их производительности остаётся открытым.
Так, например, 24 июня 2006 года общественности был представлен суперкомпьютер Йокогама), с рекордной теоретической производительностью в 1 Пфлопс. Однако данный компьютер не является компьютером общего назначения и приспособлен для решения узкого спектра конкретных задач, в то время как стандартный тест LINPACK на нём выполнить невозможно в силу особенностей его архитектуры.
Также, высокую производительность на специфичных задачах показывают графические процессоры современных видеокарт и игровые приставки. К примеру, заявленная производительность игровой приставки Xbox 360 составляет 1 Тфлопс, а приставки PlayStation 3 и вовсе 2 Тфлопс, что ставит их в один ряд с суперкомпьютерами начального уровня. Столь высокие показатели обеспечиваются тем, что операции с трёхмерной графикой, которые они в основном выполняют, очень хорошо поддаются распараллеливанию, что с успехом используется в графических процессорах. Однако эти процессоры не в состоянии выполнять большинство задач общего назначения, и их производительность не поддаётся оценке теста LINPACK и сравнению с другими системами.
Причины широкого распространения
Несмотря на большое число существенных недостатков, показатель флопс продолжает с успехом использоваться для оценки производительности, базируясь на результатах теста LINPACK. Причины такой популярности обусловлены, во-первых, тем, что флопс, как говорилось выше, является абсолютной величиной. А, во-вторых, очень многие задачи инженерной и научной практики, в конечном итоге, сводятся к решению систем линейных алгебраических уравнений, а тест LINPACK как раз и базируется на измерении скорости решения таких систем. Кроме того, подавляющее большинство компьютеров (включая суперкомпьютеры), построены по классической архитектуре с использованием стандартных процессоров, что позволяет использовать общепринятые тесты с большой достоверностью. Как показано на процессорах Intel Core 2 Quad Q9450 2.66ГГц @3.5ГГц и Intel Core 2 Duo E8400 3000 МГц (2008) программа LINPACK не использует решения алгебраических выражений, так как любая операция не может идти быстрее, чем 1 такт процессора. Так для процессоров Intel Core 2 Quad один такт требует один-два герца. Так как для задач с плавающей запятой: деление/умножение, сложение/вычитание — требуется намного больше одного такта, то видно, что выдать 48 Гигафлопс и 18,5 гигафлопса соответственно данные процессоры не могли. Часто вместо операции деления с плавающей запятой используется загрузка данных в режиме ДМА из оперативной памяти в стек процессора. Так работает программа LINPACK в некоторых тестах, но, строго говоря, результат не является значением флопс.
Примечание: замечание о невозможности выполнения более одной операции за такт абсолютно некорректно, так как все современные процессоры в каждом своем ядре содержат несколько исполнительных блоков каждого типа (в том числе и для операций с плавающей точкой) работающих параллельно и могут выполнять более одной инструкции за такт. Данная особенность архитектуры называется суперскалярность и впервые появилась еще в самом первом процессоре
Обзор производительности реальных систем
Из-за высокого разброса результатов теста LINPACK, приведены примерные величины, полученные путём осреднения показателей на основе информации из разных источников. Производительность игровых приставок и распределённых систем (имеющих узкую специализацию и не поддерживающих тест LINPACK) приведена в справочных целях в соответствии с числами, заявленными их разработчиками. Более точные результаты с указанием параметров конкретных систем можно получить, например, на сайте The Performance Database Server.
Суперкомпьютеры
- Компьютер ЭНИАК, построенный в 1946 году, при массе 27 т и энергопотреблении 150 кВт, обеспечивал производительность в 300 флопс
- IBM 709 (1957) — 5 кфлопс
- БЭСМ-6 (1968) — 1 Мфлопс (операций деления)
- Cray-1 (1974) — 160 Мфлопс
- БЭСМ-6 на базе Эльбрус-1К2 (1980-х) — 6 Мфлопс (операций деления)
- Cray Y-MP (1988) — 2,3 Гфлопс
- ASCI Red (1993) — 1 Тфлопс
- Blue Gene/L (2006) — 478,2 Тфлопс
- Jaguar (суперкомпьютер) (2008) — 1,059 Пфлопс
- IBM Roadrunner (2008) — 1,105 Пфлопс [1]
- IBM Sequoia (2012) — 20 Пфлопс [2]
Персональные компьютеры
- PC/XT (1983) — 6,9 кфлопс
- ПК на основе процессора 80386 (1985) с тактовой частотой 40 МГц — 0,6 Мфлопс
- Intel
- Intel Pentium II 300 МГц (1997) — 50 Мфлопс
- Intel Pentium III 1 ГГц (1999) — 320 Мфлопс
- AMDAthlon 64 2,211 ГГц (2003) — 840 Мфлопс [3]
- Intel Core 2 Duo 2,4 ГГц (2006) — 1,3 Гфлопс
Процессоры
- Intel Core 2 Duo E8400 3.0ГГц (2008) — 18.6 Гфлопс При использовании стандартной версии LINPACK 10
- Intel Core 2 Duo E8400 3.0ГГц @4.0ГГц (2008) — 25 Гфлопс (LINPACK Benchmark 10.0 64-бит) в Windows Vista x64 Ultimate SP1
- Intel Core 2 Quad Q9450 2.66ГГц @3.5ГГц — 48 ГФлопс (LINPACK Benchmark 10.0 64-бит) в Windows 2003sp2 x64
О лживых постах в ВК или сколько операций в секунду выполняет мозг человека
На написание этой статьи меня побудил пост одного из популярных пабликов ВКонтакте, в котором дословно было следующее: «Человеческий мозг в состоянии выполнять 1016 операций в секунду. Это значит, что его мощность до сих пор выше, чем мощность любого существующего на сегодняшний день компьютера.». Я разобрался кто круче, мозг, или компьютер.
Для начала разберемся, что это за операции в секунду, какова мощность вашего настольного компьютера, и какова мощность самого супермегапапского компа на планете.
Для измерения вычислительной мощности компьютеров используется единица измерения, называемая флопс (flops, flop/s). Флопс показывает, сколько операций с плавающей запятой выполняет компьютер за одну секунду. Кроме того, для измерения вычислительной мощности используется такое понятие, как тактовая частота. Тактовая частота процессора показывает, какое количество основных операций выполняет процессор в секунду, и измеряется в герцах. Основная операция, выполняемая процессором, может включать в себя множество операций с плавающей запятой, поэтому результаты измерения в флопсах и герцах различаются. Если вы найдете у себя на рабочем столе иконку «Мой компьютер», кликните по ней правой копкой мыши, в выпадающем меню откроете свойства, то истина для вас откроется. Найдите в открывшемся окне заголовок «Ситема», и там, напротив слова «процессор» будет указана тактовая частота вашего процессора. Скорее всего она будет иметь такой вид: «2.10 GHz». Число может незначительно отличаться. Так вот, 1 GHz — это 1000000000 герц, или один миллиард операций в секунду. Из этого следует, что при тактовой частоте 2.10 гигагерца проц выполняет 2100000000 операций в секунду. Это конечно побольше, чем 1016. При измерении в флопсах число возрастет в несколько раз.
Идем дальше. Суперкомпьютер Titan компании Cray inc. имеет приблизительную вычислительную мощность 20 петафлопс. 1 петафлопс равен 10^15 флопс. Можете сами подсчитать, какое получится число и сколько у него нулей. Как сказал один поэт: «Это ж долбануться. »
Теперь о головном мозге. Тут все не так просто, как с компьютерами. На современном этапе развития нейробиологии довольно трудно подсчитать вычислительную мощность мозга, и сравнить его с компьютером. Однако и так понятно, что мы не можем выполнять те же операции, что выполняет наш ноутбук с такой же скоростью и в таких же объемах. Очевидно, что комп мощнее, да? А вот и нет.
Давайте разберемся подробнее, как он работает.
Мозг — это биологическая нейронная сеть. Нейронная сеть состоит из нейронов, (в случае с мозгом — это клетки мозга), каждый из которых связан с другими нейронами. Место связи нейронов называется синапсом. Через синапс от одного нейрона передается химический или электрический импульс другому нейрону. Количество нейронов в головном мозге человека примерно равно 100000000000 (ста миллиардам). Данные в из разных источников немного различаются, но в целом картина схожа. Каждый из этих нейронов имеет от 7000 до 10000 синапсов. В среднем, через один синапс проходит 10 импульсов в секунду, т.е. мы имеем тактовую частоту 10 герц на одну синоптическую связь. А теперь занимательная математика: 100000000000 нейронов мы умножаем на 10000 их синоптических связей и умножаем все это на 10 герц. Мы получаем число с шестнадцатью нолями после единицы, а иначе 10^16. Так вот откуда взялось загадочное число 1016. Видимо оно просто трансформировалось в ходе бесконечного перепоста из паблика в паблик. И оказывается, что наш мозг имеет бОльшую вычислительную мощность, чем суперкомпьютер Titan. В конечном итоге автор поста о 1016 операциях в секунду был прав.
Петафлопс это сколько операций в секунду
В 2021 году Аргоннская национальная лаборатория (исследовательский центр Министерства энергетики США) презентует новейший суперкомпьютер нового поколения Aurora.
Только представьте: Aurora сможет за одну секунду выполнять операцию, на которую нам, обычным и не очень умным людям понадобилось бы 31,7 триллионов лет! Рассказываем, что такое суперкомпьютеры и зачем их вообще создают.
Суперкомпьютер — что это?
Представьте работу обычного компьютера: он выполняет все задачи последовательно и не может одновременно проводить несколько тысяч сложных вычислений. Если в системе происходит сбой, он приветливо помашет вам ручкой и покажет «экран смерти».
Суперкомпьютеры могут параллельно и очень быстро совершать несколько миллионов вычислений в секунду. В народе их даже называют «числогрызами»: такие машины щелкают сложнейшие задачи как орешки. Суперкомпьютеры оснащены сотнями супермощных процессоров. Именно благодаря этому они могут мгновенно выполнять сложнейшие операции, для которых даже самому мощному игровому ПК понадобится минимум неделя.
На сегодняшний день самым мощным суперкомпьютером является японский Fugaku. Его разработала компания Fujitsu, которую вы можете знать благодаря фото- и видеотехнике Fuji. Fugaku был разработан на базе Института Кобе в составе Института физико-химических исследований (RIKEN). Его концепция была придумана в 2010 году, и более шести лет ушло на создание и сборку.
Очевидно, что такие технологические гиганты не работают на Windows, Linux или MacOS, для них создано особое ПО.
Суперкомпьютер Fugaku работает на базе операционной системы Red Hat Enterprise Linux 8 c гибридным ядром, состоящим из одновременно работающих ядер Linux и McKernel. Чаще всего суперкомпьютер состоит из нескольких высокомощных компьютеров, объединенных локальной сетью.
Японский суперкомпьютер Fugaku
У суперкомпьютеров есть своя единица для оценивания производительности — флопс (FLOPS — FLoating-point Operations Per Second). Флопс означает количество операций над числами с плавающей точкой в секунду. С 2008 года используются петафлопсы, которые обозначают количество миллионов миллиардов вычислений в секунду. Такое даже представить страшно!
Суперкомпьютер Aurora, который власти США должны представить в этом году, сможет выполнять 1 квинтиллион операций в секунду и обойдется в $500 млн.
Зачем нужны суперкомпьютеры?
Суперкомпьютеры применяются в медицине, космонавтике, астрономии и инженерии. Главная задача суперкомпьютеров — выполнять максимум сложнейших задач за минимум времени.
Например, Fugaku изучает пути распространения коронавируса и проводит его диагностику. Он собирает и обрабатывает огромные массивы статистических данных, изучает коэффициент заражения коронавирусом, а также его состав и модель поведения. Кроме того, он может прогнозировать и воспроизводить природные катастрофы.
Другие суперкомпьютеры заточены на работу только с одним приложением, например, для прогнозирования изменения климата или моделей ядерных испытаний. В будущем это позволит избежать реальных испытаний ядерного оружия и исключить риски взрывов.
Суперкомпьютеры могут не только выполнять сложнейшие вычисления, но и моделировать реальность. В марте 2020 года года астрономы из Технологического университета Суинберна (Австралия) и Калифорнийского технологического университета (США) смоделировали на суперкомпьютере эволюцию Млечного Пути. Чтобы этого добиться, ученые использовали абсолютно все данные, известные обо всех звездных скоплениях в нашей галактике.
Еще суперкомпьютеры используются и в области искусственного интеллекта. Так, Aurora должна будет ускорить научные открытия, разработать новые возможности для улучшения медицины и прогнозирования экстремальных погодных условий.