SSE3
SSE3 (PNI — Prescott New Instruction) — третье поколение SIMD-расширения от компании Intel. Является логическим продолжением SSE2 и MMX.
Дата премьеры расширения — 2 февраля 2004 года. Впервые данная технология была употреблена в ядре Prescott процессора Pentium 4.
В 2005 году на рынок вышла реализация от компании AMD, которая предложила свою версию SSE3, предназначенную для использования в процессорах Athlon 64 (Venice, San Diego и Newark).
В пакете SSE3 вмещено 13 инструкций:
- FISTTP (x87);
- MOVSLDUP (SSE);
- MOVSHDUP (SSE);
- MOVDDUP (SSE2);
- LDDQU (SSE/SSE2);
- ADDSUBPD (SSE);
- ADDSUBPD (SSE2);
- HADDPS (SSE);
- HSUBPS (SSE);
- HADDPD (SSE2);
- HSUBPD (SSE2);
- MONITOR (нет аналога в SSE3 для AMD);
- MWAIT (нет аналога в SSE3 для AMD).
Ключевым нововведением стала функция горизонтальной работы с регистрами. Так, специалистами компании Intel были добавлены команды сложения/вычитания нескольких значений из одного регистра. Данные команды привели к значительному упрощению ряда DSP и 3D-операций.
Кроме того, была создана и новая команда для преобразования значений с плавающей точкой в целые, при этом минуя необходимость внесения изменений в глобальный режим округления.
Инструкции
- ADDSUBPD (Add Subtract Packed Double);
- ADDSUBPS (Add Subtract Packed Single);
- HADDPD (Horizontal Add Packed Double);
- HADDPS (Horizontal Add Packed Single);
- HSUBPD (Horizontal Subtract Packed Double);
- HSUBPS (Horizontal Subtract Packed Single);
- FISTTP (транформация вещественного числа в целое, при этом, с сохранением целочисленного значения, а также округления в сторону 0).
- LDDQU (загрузка 128bit невыровненных данных из памяти в регистр xmm, при этом производится предотвращение пересечения границы строки кеша).
Поддерживающие SSE3 процессоры
- AMD:
- Athlon 64 (от Venice Stepping E3 и San Diego Stepping E4 и выше)
- Athlon 64 X2
- Athlon 64 FX (от San Diego Stepping E4 и выше)
- Opteron (от Stepping E4 и выше)
- Sempron (от Palermo до E3)
- Phenom
- Phenom II
- Athlon II
- Turion 64
- Turion 64 X2
- Intel:
- Celeron D
- Celeron 420, 430 and 440
- Pentium 4 (от Prescott и выше)
- Pentium D
- Pentium Dual-Core
- Pentium Extreme Edition (кроме Pentium 4 Extreme Edition)
- Intel Core Duo
- Intel Core Solo
- Intel Core 2 Duo
- Intel Core 2 Extreme
- Intel Core 2 Quad
- Xeon (от Nocona и выше)
- Atom
- Intel Core i3
- Intel Core i5
- Intel Core i7
- VIA/Centaur:
- C7
- Nano
- Transmeta
- Efficeon TM88xx (кроме серии TM86xx)
ООО «Альтербит», 197183, Санкт-Петербург, Комендантский проспект, 2 схема проезда
Телефон: (812) 309-2602 ← Звони если хочешь купить сервер, схд, компьютерРасширения SSE
SSE (Streaming SIMD Extensions) — расширение инструкций процессора для потоковой обработки в режиме SIMD (Single Instruction Multiple Data), т.е. когда требуется применять однотипные операции к потоку данных.
Расширение SSE разработано компанией Intel и было впервые применено в процессоре Intel Pentium III с ядром Katmai. Отсюда изначальное название KNI (Katmai New Instructions). Технология SSE позволила преодолеть проблемы MMX — при использовании MMX невозможно было одновременно использовать инструкции сопроцессора, так как его регистры задействовались для MMX и работы с вещественными числами.
В общем случае, к архитектуре процессора добавляется ряд самих инструкций и несколько 128-битных регистров с различной интерперетацией. Тем не менее, хотя изначально каждый регистр трактуется как два значения с плавающей точкой двойной точности (2*64-бит), операции могут применяться практически ко всем типам, «помещающимся» в 16 байт:
Это означает, например, что появляется возможность одновременно сложить или умножить с помощью всего одной инструкции два операнда из четырех чисел с плавающей точностью одинарной точности, двух — с двойной, двух 64-битных целочисленных, 16 8-битных целых и т.п.
Таким образом, для получения максимальной отдачи от SSE, следует использовать такие структуры данных, чтобы они максимально укладывались в эти 128-битные регистры. Если это не удается сделать изначально, то среди SSE существуют и специальные для этих целей инструкции.
Для програм с большим количеством ветвлений и условных операций рекомендуется, по возможности, заменить условные ветвления на логические и вычислительные операции.
Более подробно об этом можно прочитать в документе Using SSE and SSE2: Misconceptions and Reality на сайте Intel.
Впервые применено в SSE Intel Pentium III SSE2 Intel Pentium IV SSE3 Intel Pentium IV (Prescott) SSE4 Intel Core (Penryn) SSE
SSE включает в архитектуру процессора восемь 128-битных регистров (с xmm0 до xmm7), каждый из которых трактуется как 4 последовательных значения с плавающей точкой одинарной точности. SSE включает в себя набор инструкций, который производит операции со скалярными и упакованными типами данных.
SSE2
SSE2 использует восемь 128-битных регистров (с xmm0 до xmm7), включённых в архитектуру x86 с вводом расширения SSE, каждый из которых трактуется как 2 последовательных значения с плавающей точкой двойной точности. SSE2 включает в себя набор инструкций, который производит операции со скалярными и упакованными типами данных. Также SSE2 содержит инструкции для потоковой обработки целочисленных данных в тех же 128-битных xmm регистрах, что делает это расширение более предпочтительным для целочисленных вычислений, нежели MMX, появившийся гораздо ранее.
SSE3
Набор SSE3 содержит 13 инструкций: FISTTP (x87), MOVSLDUP (SSE), MOVSHDUP (SSE), MOVDDUP (SSE2), LDDQU (SSE/SSE2), ADDSUBPD (SSE), ADDSUBPD (SSE2), HADDPS (SSE), HSUBPS (SSE), HADDPD (SSE2), HSUBPD (SSE2), MONITOR (нет аналога в SSE3 для AMD), MWAIT (нет аналога в SSE3 для AMD).
SSE4
SSE4 состоит из 54 инструкций, 47 из них относят к SSE4.1 (только они появятся в процессорах Penryn). Ожидается, что полный набор команд (SSE4.1 и SSE4.2, то есть 47 + оставшиеся 7 команд) будет доступен в процессорах Nehalem. Ни одна из SSE4 инструкций не работает с 64-х битными mmx регистрами (только с 128-ми битными xmm0-15).
Компилятор языка Си от Intel начиная с версии 10 будет генерировать инструкции SSE4 при задании опции -QxS.
Более подробную информацию по SSE4 можно найти на сайте Intel по ссылке.
SSSE3 (Supplemental SSE3)
SSSE3 (Supplemental SSE3, то есть дополнительный SSE3) — это набор дополнительных инструкций процессора, разработанный компанией Intel в продолжение развития наборов команд SSE, SSE2 и SSE3.
По сути, это был четвертый по счету набор инструкций SSE и, по логике вещей, ему нужно бы было присвоить название SSE4. Но в Intel решили иначе, возможно, посчитав его лишь незначительным дополнением к предыдущему пакету.
На первых порах SSSE3 также назывался Merom New Instructions (MNI) по названию процессорного ядра, в котором Intel впервые намеревалась его использовать.
SSSE3 представляет собой набор из 16 новых команд, улучшающих работу с упакованными целыми. При этом, каждая из инструкций может использоваться процессором как для 64-битных, так и для 128-битных регистров. Поэтому в документации Intel речь идет не о 16, а о 32 командах SSSE3.
Инструкции SSSE3 необходимы для нормальной работы многих современных приложений, в частности программ распознавания речи, используемых алгоритм DNN (Deep Neural Network), и др.
Начало использование SSSE3 приходится на 2006 год (выход процессоров архитектуры Intel Core).
ПОДЕЛИТЬСЯ:
НАПИСАТЬ АВТОРУ
Похожие материалы
Технологии и инструкции, используемые в процессорах
Люди обычно оценивают процессор по количеству ядер, тактовой частоте, объему кэша и других показателях, редко обращая внимание на поддерживаемые им технологии.
Отдельные из этих технологий нужны только для решения специфических заданий и в «домашнем» компьютере вряд ли когда-нибудь понадобятся. Наличие же других является непременным условием работы программ, необходимых для повседневного использования.
Так, полюбившийся многим браузер Google Chrome не работает без поддержки процессором SSE2. Инструкции AVX могут в разы ускорить обработку фото- и видеоконтента. А недавно один мой знакомый на достаточно быстром Phenom II (6 ядер) не смог запустить игру Mafia 3, поскольку его процессор не поддерживает инструкции SSE4.2.
Если аббревиатуры SSE, MMX, AVX, SIMD вам ни о чем не говорят и вы хотели бы разобраться в этом вопросе, изложенная здесь информация станет неплохим подспорьем.
Таблица совместимости процессоров и материнских плат AMD
Одной из особенностей компьютеров на базе процессоров AMD, которой они выгодно отличаются от платформ Intel, является высокий уровень совместимости процессоров и материнских плат. У владельцев относительно не старых настольных систем на базе AMD есть высокие шансы безболезненно «прокачать» компьютер путем простой замены процессора на «камень» из более новой линейки или же флагман из предыдущей.
Если вы принадлежите к их числу и задались вопросом «апгрейда», эта небольшая табличка вам в помощь.
Сравнение процессоров
В таблицу можно одновременно добавить до 6 процессоров, выбрав их из списка (кнопка «Добавить процессор»). Всего доступно больше 2,5 тыс. процессоров Intel и AMD.
Пользователю предоставляется возможность в удобной форме сравнивать производительность процессоров в синтетических тестах, количество ядер, частоту, структуру и объем кэша, поддерживаемые типы оперативной памяти, скорость шины, а также другие их характеристики.
Дополнительные рекомендации по использованию таблицы можно найти внизу страницы.
Спецификации процессоров
В этой базе собраны подробные характеристики процессоров Intel и AMD. Она содержит спецификации около 2,7 тысяч десктопных, мобильных и серверных процессоров, начиная с первых Пентиумов и Атлонов и заканчивая последними моделями.
Информация систематизирована в алфавитном порядке и будет полезна всем, кто интересуется компьютерной техникой.
Таблица процессоров
Таблица содержит информацию о почти 2 тыс. процессоров и будет весьма полезной людям, интересующимся компьютерным «железом». Положение каждого процессора в таблице определяется уровнем его быстродействия в синтетических тестах (расположены по убыванию).
Есть фильтр, отбирающий процессоры по производителю, модели, сокету, количеству ядер, наличию встроенного видеоядра и другим параметрам.
Для получения подробной информации о любом процессоре достаточно нажать на его название.
Как проверить стабильность процессора
Проверка стабильности работы центрального процессора требуется не часто. Как правило, такая необходимость возникает при приобретении компьютера, разгоне процессора (оверлокинге), при возникновении сбоев в работе компьютера, а также в некоторых других случаях.
В статье описан порядок проверки процессора при помощи программы Prime95, которая, по мнению многих экспертов и оверлокеров, является лучшим средством для этих целей.
ПОКАЗАТЬ ЕЩЕSSE3 — SSE3
SSE3, Streaming SIMD Extensions 3, также известный под кодовым Название Intel Prescott New Instructions (PNI ), является третьей итерацией Набор инструкций SSE для архитектуры IA-3210>(x86). Intel представила SSE3 в начале 2004 года с версией Prescott своего процессора Pentium 4. В апреле 2005 года AMD представила подмножество SSE3 в версии E (Венеция и Сан-Диего) своих процессоров Athlon 64. Ранние наборы инструкций SIMD на платформе x86, от самых старых до новейших, — это MMX, 3DNow! (разработанные AMD, но не поддерживаемые процессорами Intel), SSE и SSE2.
SSE3 содержит 13 инструкций по сравнению с SSE2.
- 1 Изменения
- 2 ЦП с SSE3
- 3 Новые инструкции
- 3.1 Общие инструкции
- 3.2 Инструкции Intel
Изменения
Наиболее заметное изменение — это возможность работать горизонтально в регистре, в отличие от более или менее строго вертикальной работы всех инструкций SSE. Более конкретно, были добавлены инструкции для сложения и вычитания нескольких значений, хранящихся в одном регистре. Эти инструкции можно использовать для ускорения выполнения ряда операций DSP и 3D. Также имеется новая инструкция для преобразования значений с плавающей запятой в целые числа без необходимости изменения глобального округления, что позволяет избежать дорогостоящих остановок конвейера конвейера. Наконец, расширение LDDQU, альтернативная загрузка с неверно выровненным целочисленным вектором, которая лучшая производительность на платформе NetBurst для нагрузок, пересекающих границы строки кэша.
процессоры с SSE3
- AMD :
- Opteron (начиная со степпинга E4)
- Sempron (начиная с Palermo. Stepping E3)
- Athlon 64 ( начиная с Venice Stepping E3 и San Diego Stepping E4)
- Athlon 64 FX (начиная с San Diego Stepping E4)
- Athlon 64 X2
- семейство Turion
- K10 семейство
- APU семейство (в том числе без GPU)
- FX Series
- Zen
- Zen +
- Zen2
- Celeron D
- Celeron ( начиная с микроархитектуры Core)
- Pentium 4 (начиная с Prescott)
- Pentium D
- Pentium Extreme Edition (но НЕ Pentium 4 Extreme Edition)
- Pentium Dual-Core
- Pentium (начиная с Core микроархитектура)
- Core
- Xeon (начиная с Nocona)
- Atom
- C7
- Nano
Новые инструкции
Общие инструкции
- ADDSUBPD — (сложение-вычитание-упакованное-двойное)
- Ввод: ,
- Выв од:
- Ввод: ,
- Выход:
AOS (массив структур)
- HADDPD — (Horizontal-Add-Packed-Double)
- Ввод: ,
- Выход:
- Вход: ,
- Вывод:
- Ввод: ,
- Вывод:
- Ввод: ,
- Вывод:
Инструкции Intel
- MONITOR, MWAIT — оптимизируют многопоточные приложения, повышающие производительность процессоров с Hyper-threading.