Что такое центральный процессор компьютера
Перейти к содержимому

Что такое центральный процессор компьютера

  • автор:

Что такое процессор (CPU)

В этой статье мы рассмотрим, что такое процессор CPU, какие у него функции и из чего он состоит.

В каждом вычислительном устройстве (ПК, смартфон, фотоаппарат) есть центр, который отвечает за правильную работу машины ― процессор.

В широком смысле процессор ― это устройство, которое выполняет вычислительные и логические операции с данными. Чаще всего этот термин используется для обозначения центрального процессора устройства. Расшифровка CPU ― Central Processing Unit (центральное обрабатывающее устройство). Это самая важная часть компьютера. Его мозг. Он выглядит как квадрат размером приблизительно 5×5 см:

Что значит CPU на процессоре

С обратной стороны CPU находятся ножки, с помощью которых он крепится к материнской плате:

Назначение и характеристика процессора

От мощности центрального процессора зависит скорость обработки команд и продуктивность работы других составляющих компьютера. Например, можно купить современную видеокарту, но она не сможет показать свои возможности, если управляется слабым CPU.

Функции CPU

Какие функции выполняет центральный процессор CPU? Главная функция ― управление всеми операциями компьютера: от простейших сложений чисел на калькуляторе до запуска компьютерных игр. Если рассматривать основные функции центрального процессора подробнее, CPU:

  • получает данные из оперативной памяти, выполняет с ними арифметические и логические операции, передаёт их на внешние устройства,
  • формирует сигналы, необходимые для работы внутренних узлов и внешних устройств,
  • временно хранит результаты выполненных операций, переданных сигналов и других данных,
  • принимает запросы от внешних устройств и обрабатывает их.

Из чего состоит CPU

Центральный процессор состоит из 3-х частей:

  1. Ядро процессора, которое выполняет основную работу. Оно позволяет читать, расшифровывать, выполнять и отправлять инструкции. Ядро состоит из следующих частей:
  • Арифметико-логическое устройство (АЛУ). Выполняет основные математические и логические операции. Все вычисления производятся в двоичной системе.
  • Устройство управления (УУ). Управляет работой CPU с помощью электрических сигналов. От него зависит согласованность работы всех частей процессора и его связь с внешними устройствами.

Каждое ядро может выполнять только одну задачу, хоть и за долю секунды. Одноядерный процессор выполняет каждую задачу последовательно. Для современного объёма операций этого мало, поэтому ценятся CPU с более чем одним ядром, чтобы выполнять несколько задач одновременно. Например, двухъядерный выполняет две задачи одновременно, трехъядерный ― три и т. д.

  1. Запоминающее устройство. Это небольшая внутренняя память центрального процессора. Она состоит из регистров и кеш-памяти. В регистрах хранятся текущие команды, данные, промежуточные результаты операции. В кеш-память загружаются часто используемые команды и данные из оперативной памяти. Обратиться в кеш быстрее, чем в оперативную память, поэтому объём кеш-памяти влияет на скорость выполнения запросов.
  2. Шины ― это каналы, по которым передаётся информация. Они как рельсы для перевозки данных.

Главной характеристикой процессора является производительность. Она зависит от двух параметров: тактовая частота и разрядность.

Тактовая частота ― число выполненных операций в секунду. Измеряется в мегагерцах (МГц — миллион тактов в секунду ) и гигагерцах (ГГц — миллиард тактов в секунду). Чем больше тактовая частота, тем быстрее работает машина.

Разрядность ― количество информации (байт), которое можно передать за такт. Разрядность процессора бывает 8, 16, 32, 64 бита. Современные процессоры 32-х и 64-битные.

Производители CPU

На рынке есть два основных производителя центральных процессоров ― Intel и AMD.

Продукты Intel — дорогие, но имеют высокую производительность. Потребляют меньше энергии, следовательно меньше перегреваются. Имеют хорошую связь с оперативной памятью.

Продукты AMD значительно отстают от Intel, однако стоят дешевле. Они требуют много энергии и хуже взаимодействуют с оперативной памятью по сравнению с процессорами от Intel.

Подписывайтесь на рассылку нашего блога — впереди много полезных статей!

Центральный процессор

Центральный процессор (CPU) — это электронная схема, которая выполняет инструкции, составляющие компьютерную программу. Центральный процессор осуществляет арифметические, логические, управляющие операции и операции вывода (I/O), указанные инструкциями в программе [1] . В этом случае он контрастирует с внешними компонентами, такими как основная память и схемы ввода-вывода, а также специализированными процессорам (GPU). Конструкция процессоров менялась с течением времени, но их фундаментальное функционирование остается практически неизменным. Основные компоненты центрального процессора включают арифметико-логический блок (АЛУ) [2] , который выполняет арифметические и логические операции, регистры процессора, которые передают операнды в АЛУ и сохраняют результаты операций АЛУ, и блок управления, который управляет извлечением (из памяти), декодированием и выполнением (инструкций), направляя скоординированные операции ALU, регистров и других компонентов.

В настоящее время процессоры наиболее широко используются в виде интегральных схем в виде микропроцессоров [3] и микроконтроллеров во встроенных системах (например, в стиральных машинах, DVD-плеерах, смартфонах и т. д.).

В более раннем использовании термин «процессор» понимался как компонент (полупроводниковый чип в пластиковом корпусе, который вставляется в гнездо на плате), так и вычислительный логический блок. Однако сегодня многие микропроцессоры имеют несколько так называемых процессорных ядер, причем каждое ядро само по себе представляет собой (в значительной степени) отдельный логический блок. Сегодня под термином процессор обычно понимается компонент; если имеется в виду логический блок обработки данных, то обычно говорят о процессорном ядре.

  • 1 Основная информация
  • 2 История создания первых кристаллических процессоров
    • 2.1 Intel 4004
    • 2.2 Intel 8080
    • 2.3 Intel 8086
    • 2.4 Motorola 68000
    • 2.5 Intel i386

    Основная информация

    AMD Ryzen 9 5900X — вид процессора сверху

    Многие процессоры используют для управления бытовыми приборами, промышленными устройствами и т. д. В мэйнфреймах (англ. mainframes) раньше использовались собственные процессорные архитектуры производителей, такие как IBM (PowerPC), процессор Cell или SUN (процессор SPARC); сегодня используются адаптированные версии распространенных моделей процессоров для компьютера.

    Процессоры для встраиваемых систем занимают около 90 процентов рынка процессоров, причем 80 процентов из них представляют собой так называемые микроконтроллеры, которые помимо собственно процессора содержат другие функции (например, специальные аппаратные интерфейсы или непосредственно интегрированные датчики). Только около 10 процентов используются на персональных компьютеров, рабочих станциях или серверами [4] .

    История создания первых кристаллических процессоров

    Intel 4004

    Intel 4004

    Первыми однокристальными микропроцессорами считаются процессоры 4-битного Intel 4004, вышедшие 15 ноября 1971 года. Intel только начинает свой путь развития, их создатели Роберт Нойс, Эндрю Гроув, Гордон Мур потратили много сил на процесс развития. С помощью итальянского физика Федерико Фаджина инженерам компании удалось разместить ключевые компоненты на одном чипе и создать микропроцессор 4004.

    Intel 4004 производился по 10-мкм техпроцессу, насчитывал 2250 транзисторов и работал на частоте 108 кГц (проводил 92 600 операций в секунду). [5]

    Intel 8080

    В 1974 году Intel выпустила усовершенствованную версию 8-битного микропроцессора Intel 8080. Его производство было выполнено по новому 6-мкм техпроцессу с использованием технологии NMOS, позволяющей разместить 4758 транзисторов на кристалле. Тактовая частота составляла 2,5 МГц объем памяти — 64 Кб. На основе процессора Intel 8080 компания MITS создала микрокомпьютер Altai-8800. [6]

    Intel 8086

    В начале 1978 г. компания Intel выпустила первый 16-битный микропроцессор 8086. Его разработка велась более двух лет. Процессор производился по 3-мкм техпроцессу, содержал 29 000 транзисторов. Объем памяти достиг 1 Мб. На частоте 4 МГц — 10 МГц, разрядность регистров и шины данных была 16 бит, а разрядность адреса — 20 бит.

    Motorola 68000

    Motorola MC68000P8 CPU, 64-pin DIP.

    Серия CISC-микропроцесоров Motorola 68000 была представлена в 1979 году. Кристалл имел 32-битное ядро, но работал посредством 16-битных шин данных и 24-разрядной шиной адресов. Его частота составляла 8 МГц — 20 МГц, а количество транзисторов насчитывало 68 000 штук. CPU производился в форм-факторе DIP с 64 контактами. Однако существуют и модели с разъемами LCC, PGA. Он стал популярен среди многих компаний и использовался в различных ПК. Наиболее известными являются компьютеры Apple.

    Intel i386

    В 1985 году вышел 32-битный процессор с архитектурой x86 третьего поколения Intel 80386 (или i386). Производился по 1,5-мкм — 1,0-мкм техпроцессу. Тактовая частота составляла 12 МГц — 40 МГц.

    Производительность

    Производительность или быстродействие процессора зависит, среди многих других факторов, от тактовой частоты (обычно задается в кратных герцах) и количества инструкций за такт (IPC), которые в совокупности являются коэффициентами для количества инструкций в секунду (IPS), которые может выполнять процессор. Многие сообщенные значения IPS представляли «пиковые» скорости выполнения искусственных последовательностей команд с небольшим количеством ответвлений, в то время как реалистичные рабочие нагрузки состоят из сочетания инструкций и приложений, выполнение некоторых из которых занимает больше времени, чем других. Производительность иерархии памяти также сильно влияет на производительность процессора, что практически не учитывается при вычислениях MIPS. Из—за этих проблем были разработаны различные стандартизированные тесты, часто называемые «бенчмарками» для этой цели, такие как SPECint, чтобы попытаться измерить реальную эффективную производительность в часто используемых приложениях. [7]

    Вычислительная производительность компьютеров повышается за счет использования многоядерных процессоров, что, по сути, заключается в объединении двух или более отдельных процессоров (в этом смысле называемых ядрами) в одну интегральную схему. В идеале двухъядерный процессор должен быть почти в два раза мощнее одноядерного. На практике прирост производительности намного меньше, всего около 50 %, из-за несовершенных программных алгоритмов и реализации. Увеличение количества ядер в процессоре (например, двухъядерный, четырехъядерный и т. д.) Увеличивает рабочую нагрузку, с которой можно справиться. Это означает, что процессор теперь может обрабатывать многочисленные асинхронные события, прерывания и т. д. что может негативно сказаться на работе процессора при перегрузке. Эти ядра можно рассматривать как разные этажи перерабатывающего предприятия, где каждый этаж выполняет свою задачу. Иногда эти ядра будут выполнять те же задачи, что и соседние с ними ядра, если одного ядра недостаточно для обработки информации.

    Из-за специфических возможностей современных процессоров, таких как одновременная многопоточность и uncore (это термин, используемый Intel для описания функций микропроцессора, которых нет в ядре, но которые должны быть тесно связаны с ядром для достижения высокой производительности), которые предполагают совместное использование фактических ресурсов процессора с целью увеличения загрузки, мониторинг уровней производительности и использования оборудования постепенно стал более сложной задачей. В качестве ответа некоторые процессоры реализуют дополнительную аппаратную логику, которая отслеживает фактическое использование различных части центрального процессора и предоставляет различные счетчики, доступные программному обеспечению; примером может служить технология Intel Performance Counter Monitor.

    Мобильные процессоры

    В последние годы спрос на ноутбуки с процессорами ARM растет: если в 2020 году они занимали лишь 2,2 % рынка, то в конце 2022 года этот показатель составил уже 14,9 % [8] . Главная разница между процессорами ARM и Х86 заключается в меньшем энергопотреблении, поэтому ноутбуки на его основе могут работать значительно дольше от одного заряда аккумуляторов; второе преимущество — они существенно меньше греются во время работы. Это дает возможность не беспокоиться за перегрев ноутбука. В Windows 10 поддержка ARM-решений была реализована на базовом уровне, в более новой Windows 11 ситуация значительно улучшилась. [9]

    Примечания

    1. ↑Энциклопедия процессорных терминов(неопр.) . IXBT.com.
    2. ↑Процессор. Основные компоненты и их назначение(неопр.) . Perscom.ru.
    3. ↑Развитие встраиваемых систем(неопр.) . Радиосхемы.
    4. ↑Поддержка многоядерных процессоров во встраиваемых системах(неопр.) . Открытые системы.
    5. ↑Эволюция процессоров. Часть 1: 8-битная эпоха(неопр.) . Ferra.ru (13.06.2014 г.).
    6. ↑Что такое процессор? Основные характеристики процессоров(неопр.) . pc.ru.
    7. ↑Производительность процессора и в чем она измеряется(неопр.) . infotechnica.ru.
    8. ↑Ноутбуки на Arm лучше перенесут спад на рынке ПК, а через несколько лет станут популярнее моделей на AMD(неопр.) . 3dnews.ru.
    9. ↑Господству AMD и Intel приходит конец из-за устаревшей архитектуры процессоров.(неопр.) . Cnews.ru.

    Данная статья имеет статус «готовой». Это не говорит о качестве статьи, однако в ней уже в достаточной степени раскрыта основная тема. Если вы хотите улучшить статью — правьте смело!

    Из чего состоит центральный процессор?

    Центральный процессор часто называют «мозгом» компьютера, ведь он, как и человеческий мозг, состоит из нескольких частей, собранных воедино для работы над информацией. Среди них есть те, что отвечают за прием информации, ее хранение, обработку и вывод. В этой статье портал TechSpot разбирает все ключевые элементы процессора, за счет которых и работают ваши компьютеры.

    Этот текст входит в серию статей, в которых тщательно разбирается работа ключевых компонентов компьютера. Кроме того, если вы заинтересовались темой, рекомендуем ознакомиться с переводами статей серии «Как разрабатываются и создаются процессоры?».

    В этой статье будут затронуты как основы работы процессоров, так и более сложные понятия. К сожалению, без некоторой абстрактности не обойтись, но на это есть свои причины. К примеру, если взглянуть на блок питания, можно легко рассмотреть все его части — от конденсаторов до транзисторов, однако в случае с процессорами все не так просто, ведь мы физически не можем разглядеть все микросхемы, а Intel и AMD не спешат делиться подробностями работы своей продукции с широкой публикой. Тем не менее, информация, представленная в статье, применима к подавляющему большинству современных процессоров.

    Итак, приступим. Любому вычислительному устройству нужно нечто наподобие центрального процессора. По сути, программист пишет код для выполнения собственных целей, а затем процессор выполняет его для получения необходимого результата. Процессор также подключен к другим частям системы, вроде памяти и устройств ввода/вывода, чтобы обеспечить загрузку необходимых данных, но в этой статье мы не будем акцентировать на них внимание.

    Фундамент любого процессора: архитектура набора команд

    Первое, на что натыкаешься при разборе любого процессора — это на архитектуру набора команд (ISA). Архитектура является чем-то вроде фундамента работы процессора и именно от нее зависит то, как он работает и как все внутренние системы взаимодействуют друг с другом. Существует огромное количество архитектур, но самыми распространенными являются x86 (преимущественно в стационарных компьютерах и ноутбуках) и ARM (в мобильных устройствах и встроенных системах).

    Чуть менее распространенными и более нишевыми являются MIPS, RISC-V и PowerPC. Архитектура набора отвечает за ряд основных вещей: какие инструкции процессор может обрабатывать, как он взаимодействует с памятью и кэшем, как задача распределяется по нескольким этапам обработки и др.

    Чтобы лучше понять устройство процессора, разберем его элементы в том порядке, по которому выполняются команды. Различные типы инструкций могут следовать разными путями и использовать разные компоненты ЦП, поэтому здесь они будут обобщены, чтобы охватить максимум. Начнем с базового дизайна одноядерных процессоров и постепенно будем переходить к более продвинутым и сложным экземплярам.

    Блок управления и исполнительный тракт

    Элементы процессора можно разделить на два основных: блок управления (он же — управляющий автомат) и исполнительный тракт (он же — операционный автомат). Говоря простым языком, процессор — это поезд, в котором машинист (управляющий автомат) управляет различными элементами двигателя (операционного автомата).

    Исполнительный тракт подобен двигателю и, как следует из названия, это путь, по которому данные передаются при их обработке. Он получает входные данные, обрабатывает их и отправляет в нужное место после завершения операции. Блок управления, в свою очередь, направляет этот поток данных. В зависимости от инструкции, исполнительный тракт будет направлять сигналы к различным компонентам процессора, включать и выключать различные части пути, а также отслеживать состояние всего процессора.

    Блок-схема работы базового процессора. Черными линиями отображен поток данных, а красными — поток команд.

    Цикл выполнения команд — Выборка

    Первое, что должен сделать процессор — определить, какие команды необходимо выполнить следующими, а затем переместить их из памяти в блок управления. Команды создаются компилятором и зависят от архитектуры набора (ISA). Наиболее распространенные типы базовых инструкций (например, «загрузка», «хранение», «сложение», «вычитание» и др.) общие для всех ISA, но существует множество дополнительных, специальных типов команд, уникальных для конкретной архитектуры набора. Блок управления знает, какие сигналы и куда нужно направить для выполнения определенного типа команды.

    К примеру, при запуске .exe файла в Windows, код этой программы отправляется в память и процессор получает адрес, с которого начинается первая команда. Процессор всегда поддерживает внутренний реестр, отслеживающий откуда должна будет выполняться следующая команда. Этот реестр называется счетчиком команд.

    После того, как процессор определил точку, с которой нужно начинать цикл, происходит перемещение команды из памяти в вышеупомянутый реестр — этот процесс называется выборкой команды. По-хорошему, команда, скорее всего, уже находится в кэше процессора, но этот вопрос будет рассмотрен чуть позже.

    Цикл выполнения команд — Декодирование

    Когда процессор получает команду, ему нужно точно определить тип этой команды. Данный процесс называется декодированием. Каждая команда обладает особым набором битов, опкодом, который дает возможность процессору распознать ее тип. Примерно по тому же принципу работает распознавание компьютером различных расширений файлов. К примеру, .jpg и .png — форматы изображений, но каждый из них обрабатывает данные по-разному, поэтому компьютеру и нужно точно распознавать их тип.

    Стоит отметить, что сложность декодирования может зависеть от того, насколько продвинутой является архитектура набора команд процессора. У архитектуры RISC-V, к примеру, несколько десятков команд, а у x86 — несколько тысяч. У типичного процессора Intel x86 процесс декодирования является одним из сложнейших и занимает огромное количество памяти. Чаще всего процессоры декодируют команды, связанные с памятью, арифметическими вычислениями и переходом.

    3 основных типа команд

    Команда памяти может представлять собой нечто вроде «прочтите значение из адреса памяти 1234 вместо значения А» или «запишите значение Б в адрес памяти 5678». Арифметические команды имеют вид в духе «добавьте значение А к значению Б и сохраните результат в значении В». Инструкции перехода, в свою очередь, похожи на «выполните этот код, если значение В положительное, или выполните другой код, если значение В отрицательное». Зачастую в программах используется цепочка сразу из нескольких вышеупомянутых примеров, из-за чего конечный результат выглядит примерно так: «добавьте значение адреса памяти 1234 к значению адреса памяти 5678 и сохраните его в адресе памяти 4321, если результат положительный, либо в адрес 8765, если результат отрицательный».

    Перед тем, как перейти к выполнению декодированной команды, давайте уделим немного внимания регистрам.

    Регистрами называются немногочисленные, но крайне быстрые фрагменты памяти процессора. У 64-битных процессоров каждый из них вмещает 64 бита, а всего их может быть несколько десятков на одно ядро. Регистры используются для хранения используемых в данный момент значений и их можно считать чем-то вроде кэша нулевого уровня. В приведенных выше примерах команд значения А, Б и В будут сохранены именно в регистре.

    Арифметико-логическое устройство

    Вернемся к этапу выполнения команд. Сразу отметим, что он отличается для всех трех вышеупомянутых типов команд, поэтому давайте рассмотрим каждый их них.

    Самыми простыми для понимания являются арифметические команды. Эти команды отправляются в арифметическо-логическое устройство (ALU) для последующей обработки. Устройство представляет собой цепь, которая чаще всего работает с двумя значениями, отмеченными сигналом, и выдает результат.

    Представьте себе обычный калькулятор. Для любого вычисления вы вводите значения, выбираете необходимую арифметическую операцию и получаете результат. Арифметическо-логическое устройство (ALU) работает по похожему принципу. Тип операции зависит от опкода команды, который управляющий автомат отправляет в ALU и которое в дополнение к базовой арифметике может производить со значениями такие битовые операции, как AND, OR, NOT и XOR. Кроме того, арифметическо-логическое устройство выводит информацию о проведенном вычислении для управляющего автомата (например, оказалось ли оно положительным, отрицательным, равным нулю или вызвало переполнение).

    Несмотря на то, что арифметическо-логическое устройство чаще всего связано именно с арифметическими операциями, оно находит свое применение и в инструкциях памяти или перехода. Например, если процессору нужно вычислить адрес памяти, заданный в результате прошлого вычисления, либо в случае необходимости вычислить переход для добавления в счетчик программ, если инструкция того требует (пример: «если предыдущий результат отрицателен, перейти на 20 команд вперед»).

    Команды и иерархия памяти

    Чтобы лучше понять принцип работы команд, связанных с памятью, стоит обратить внимание на концепцию иерархии памяти — связь между кэшем, оперативной памятью и главным запоминающим устройством. Когда процессор работает с командой памяти, данных о которой у него еще нет в регистре, он будет продвигаться по иерархии памяти, пока не найдет нужную информацию. Большинство современных процессоров имеют три уровня кэша: первый, второй и третий. Сначала процессор проверит наличие необходимых команд в кэше первого уровня — самом маленьком и быстром из всех. Зачастую этот кэш разделен на две части: первая отведена под данные, а вторая — под команды. Помните, команды извлекаются процессором из памяти так же, как и любые другие данные.

    Типичный кэш первого уровня может состоять из нескольких сотен килобайт. Если процессор не найдет в нем то, что нужно, то перейдет к проверке кэша второго уровня (размером в несколько мегабайт), а затем — третьего (уже занимающего десятки мегабайт). В случае, если необходимых данных не будет и в кэше третьего уровня, то поиск будет производиться в оперативной памяти, а затем в накопителях. С каждым подобным «шагом», увеличивается не только объем доступных данных, но и задержка.

    После того, как процессор нашел необходимые данные, он отправляет их вверх по иерархии памяти для сокращения время поиска, на случай, если они понадобятся в дальнейшем. Для справки: процессор может считывать данные во внутреннем регистре всего за один-два цикла, в кэше первого уровня понадобится немногим больше, в кэше второго уровня уже около десяти, а третьего — несколько десятков циклов. Если приходится задействовать память или накопители, то процессору может понадобятся десятки тысяч, а то и миллионы циклов. В зависимости от системы, у каждого ядра процессора может быть собственный кэш первого уровня, общий с другим ядром кэш второго уровня и кэш третьего уровня у группы из четырех или более ядер. Более подробно речь о многоядерных процессорах пойдет позже.

    Команды перехода и ветвления

    Последняя из трех основных типов команд — это команда ветвления. Команды современных программ постоянно переходят с одного потока процессов на другой, а это значит, что процессор крайне редко выполняет более дюжины смежных команд без перехода. Команды ветвления происходят от элементов программирования, таких как код IF, FOR и RETURN. Все они используются для прерывания выполнения программы или переключения на другую часть кода. Кроме команд ветвления существуют и команды перехода, которые отличаются от первых тем, что они всегда участвуют в процессе выполнения программы.

    Кроме обычных команд перехода, существуют и условные переходы, с которыми процессору работать особенно сложно, поскольку он может выполнять несколько инструкций одновременно и конечный результат всей ветки может быть нельзя определить пока не начата работа над выполнением связанных команд.

    Чтобы понять, почему процессору трудно работать с условными переходами, стоит обратить внимание на такое понятие, как вычислительный конвейер. Каждый шаг в выполнении какой-либо команды может занимать несколько циклов, а это значит, что арифметико-логическое устройство могло бы простаивать без дела пока происходит выборка команды. Чтобы максимизировать эффективность вычислительной мощности процессора, каждая стадия разделяется на несколько частей — в процессе, который называется вычислительным конвейером (конвейерной обработкой).

    Самой простой аналогией будет процесс стирки. Предположим, что у вас достаточно вещей на две полные загрузки стиральной машины, а стирка и сушка каждой партии занимает по часу. Вы вполне можете загрузить в стиральную машину первую партию вещей, а потом переместить на сушилку, а когда они высохнут — заняться второй партией. Это займет четыре часа. Однако, если вы разделите процесс на этапы и начнете стирку второй партии вещей, пока сушится первая, вы сможете выполнить всю работу за три часа. Сокращение времени зависит от количества загружаемых вещей и количества стиральных/сушильных машин. Для выполнения отдельной загрузки в любом случае понадобится два часа, но в приведенном примере накладывание процессов увеличивает общую пропускную способность с 0,5 загрузки/час до 0,75 загрузки в час.

    Графическое представление конвейера, используемого в ядрах процессоров AMD Bobcat (2011). Обратите внимание, как много в нем различных элементов и стадий.

    Процессоры используют тот же принцип для повышения пропускной способности команд. Конвейеры современных процессоров на архитектуре ARM или x86 могут использовать свыше 20 стадий вычислительного конвейера, а это значит, что ядро процессора одновременно обрабатывает свыше 20 различных команд. Процессоры могут отличаться по разделению этих стадий под различные нужды, но в одном из примеров, принцип работы которого находится в открытом доступе, имеется 4 цикла для выборки, 6 циклов для декодирования, 3 цикла для выполнения команд и 7 циклов для отправки результатов в память.

    Возвращаясь к теме, теперь вы можете понять в чем проблема. Если процессор не определил тип команды до десятого цикла, то он начнет работу уже над 9 новыми командами, которые могут оказаться ненужными, если ветка команд уже не работает. Чтобы этого не происходило, процессоры оборудованы сложным механизмом, который называется модулем предсказателем переходов. По принципу работы этот механизм схож с машинным обучением. Детальное описание работы модуля предсказателя переходов — это тема для отдельной статьи, поэтому придется обойтись довольно простым объяснением: данный механизм отслеживает статус предыдущих переходов, чтобы определить, будет ли задействован следующий переход или нет. Современные предсказатели переходов могут обеспечить точность в 95% и выше.

    После того, как точно станет известен результат перехода (т.е. завершился конкретный этап на конвейере), счетчик команд обновится и процессор приступит к выполнению следующей операции. Если же результат не совпал с тем, который предугадал предсказатель команд, процессор сбросит все команды, которые начал выполнять по ошибке, и запустит работу с правильной точки.

    Внеочередное исполнение

    Теперь, когда вы знаете принцип работы трех наиболее распространенных типов команд, давайте уделим внимание более продвинутыми функциям процессоров. Практически все современные модели ЦП фактически исполняют команды не в порядке их получения. Существует такая функция, как внеочередное исполнение, призванная сократить время простоя процессора во время ожидания завершения остальных команд.

    Если процессор понимает, что следующей команде необходимы данные, для поиска которых понадобится больше времени, он может изменить порядок команд, начав работу над не связанной командой, пока происходит поиск. Внеочередное исполнение команд — необычайно полезная, но далеко не единственная вспомогательная функция процессора.

    Еще одной крайне полезной особенностью процессора является предвыборка. Если засечь время, необходимое для выполнения случайной инструкции от начала и до конца, то можно обнаружить, что большую часть времени занимает доступ к памяти. Блок предварительной выборки — элемент в ЦП, который рассматривает команды, находящиеся в очереди, и определяет, какие данные им потребуются. Если он замечает, что для операции нужны данные, которые еще не находятся в кэше процессора, то он извлечет их из оперативной памяти и в кэш. Отсюда и его название.

    Ускорители и будущее процессоров

    Еще одна важная функция, которая все чаще появляется в процессорах — ускорители для конкретных задач. Эти ускорители представляют собой небольшие схемы, главная цель которых — как можно быстрее выполнить определенную задачу. Этой задачей может быть шифрование, кодирование данных или машинное обучение.

    Конечно, процессор может делать все это самостоятельно, но созданный конкретно для этой цели блок будет намного более эффективен. Наглядным показателем мощностей ускорителей будет сравнение встроенного графического процессора с дискретной видеокартой. Разумеется, процессор может выполнять вычисления, необходимые для обработки графики, но наличие отдельного блока обеспечивает намного более высокую производительность. С ростом числа ускорителей фактическое ядро центрального процессора может занимать всего лишь небольшую часть чипа.

    На первом рисунке снизу изображено устройство процессора Intel, выпущенного более десяти лет назад, где большая часть занята ядрами и кешем, а на втором показан гораздо более современный чип от AMD. Как мы видим, во втором случае большая часть кристалла отведена не под ядра, а под другие компоненты.

    Кристалл процессора Intel первого поколения архитектуры Nehalem. Обратите внимание: ядра и кэш занимают подавляющее часть площади.

    Кристалл системы на чипе от AMD. Много места отведено под ускорители и внешние интерфейсы.

    Многоядерность

    Последняя особенность процессоров, которая будет рассмотрена в этой статье — то, как можно объединить несколько отдельных процессоров для получения многоядерного. Это не просто объединение нескольких копий одного ядра, ведь как нельзя просто превратить однопоточную программу в многопоточную, так нельзя и провернуть подобное с процессором. Проблема возникает из-за зависимости ядер.

    В случае с четырьмя ядрами процессору необходимо отправлять команды в 4 раза быстрее. Также нужно четыре раздельных интерфейса для памяти. Именно из-за наличия нескольких ядер на одном чипе, потенциально работающих с одними и теми же частями данных, возникает проблема слаженности и согласованности их работы. Предположим, если два ядра обрабатывали команду, использующую одни и те же данные, то как процессор определяет, у которого из них правильное значение? А что, если одно ядро модифицировало данные, но они не успели вовремя дойти до второго ядра? Поскольку у них есть отдельные кэши, в которых могут храниться пересекающиеся данные, для устранения возможных конфликтов необходимо использовать сложные алгоритмы и контроллеры.

    Чрезвычайно важную роль в многоядерных процессорах играет и точность прогнозирования переходов. Чем больше в процессоре ядер, тем выше вероятность того, что одной из исполняемых команд будет именно команда перехода, способная в любое время изменить общий поток задач.

    Как правило, отдельные ядра обрабатывают команды из разных потоков, тем самым снижая зависимость между ядрами. Поэтому, открыв диспетчер задач, вы чаще всего видите, что загружено лишь одно ядро процессора, а другие едва работают — многие программы попросту изначально не предназначены для многопоточности. Кроме того, могут быть определенные случаи, в которых эффективнее использовать только одно ядро процессора, а не тратить ресурсы на попытки разделить команды.

    Физическая оболочка процессора

    Несмотря на то, что большая часть этой статьи была посвящена сложным механизмам работы архитектуры процессора, не стоит забывать и о том, что все это должно быть создано и работать в виде реального, физического объекта.

    Для того, чтобы синхронизировать работу всех компонентов процессора, используется тактовый сигнал. Современные процессоры обычно работают на частотах от 3.0 ГГц до 5.0 ГГц, и за последнее десятилетие ситуация особо не изменилась. При каждом цикле внутри чипа включаются и выключаются миллиарды транзисторов.

    Такты важны для того, чтобы обеспечить идеальную работу каждой стадии вычислительного конвейера. Количество команд, обрабатываемых процессором за каждую секунду, зависит именно от них. Частоту можно увеличить путем разгона, сделав чип быстрее, но это в свою очередь повысит энергопотребление и тепловыделение.

    Фото: Michael Dziedzic

    Тепловыделение — главный враг процессоров. Когда цифровая электроника нагревается, может начаться разрушение микроскопических транзисторов. Это в свою очередь может привести к повреждению чипа, если тепло не отвести. Чтобы этого не произошло, каждый процессор оборудован термораспределителями. Сам кристалл может занимать всего 20% площади процессора, ведь увеличение площади позволяет более равномерно распределять тепло по радиатору. Кроме того, дополнительно увеличивается количество имеющихся ножек процессора (контактов), предназначенных для взаимодействия с другими компонентами компьютера.

    На современных процессорах может располагаться свыше тысячи входных и выходных контактов на задней панели. Мобильный чип может быть оснащен всего несколькими сотнями, поскольку большинство вычислительных элементов расположены уже внутри чипа. Независимо от дизайна, около половины из них предназначены для распределения питания, а остальные — для передачи данных с оперативной памяти, чипсета, накопителей, устройств PCIe и др. Высокопроизводительным процессорам, потребляющим сто и более ампер при полной нагрузке, нужны сотни ножек для равномерного распределения тока. Обычно они покрываются золотом для улучшения проводимости. Стоит отметить, что разные производители располагают ножки по-разному во всей своей многочисленной продукции.

    Подытожим на примере

    Чтобы подвести итоги, кратко рассмотрим архитектуру процессора Intel Core 2. Это было еще в 2006 году, поэтому некоторые детали могут быть устаревшими, но информации о новых разработках отсутствуют в публичном доступе.

    На самом верху располагается кэш команд и буфер ассоциативной трансляции. Буфер помогает процессору определить, где в памяти располагаются необходимые команды. Эти инструкции хранятся в кэше команд первого уровня, а после этого отправляются в предекодер, так как из-за сложностей архитектуры x86 декодирование происходит во множество этапов. Сразу же за ними идет предсказатель переходов и предвыборщик кода, которые снижают вероятность возникновения потенциальных проблем со следующими командами.

    Далее команды отправляются в очередь команд. Вспомните, как внеочередное исполнение позволяет процессору выбрать именно ту команду, которую практичнее всего выполнить в конкретный момент из очереди текущих инструкций. После того, как процессор определил нужную команду, та декодируется во множество микроопераций. В то время как команда может содержать сложную для ЦП задачу, микрооперации представляют собой детализированные задачи, которые процессору легче интерпретировать.

    Затем эти инструкции попадают в таблицу псевдонимов регистров, переупорядочивающий буфер и станцию резервации. Подробно расписать их принцип работы в одном абзаце, увы, не получится, так как это — информация, которую обычно подают на последних курсах технических вузов. Если в двух словах, то все они используются в процессе внеочередного исполнения для управления зависимостями между командами.

    На самом деле, у каждого ядра процессора множество арифметическо-логических устройств и портов памяти. Команды отправляются в станцию резервации, пока не освободится устройство или порт. Затем команда обрабатывается с помощью кэша данных первого уровня, а полученный результат сохраняется для дальнейшего использования, после чего процессор может приступать к следующей задаче. На этом все!

    Пусть эта статья и не предназначалась для того, чтобы служить исчерпывающим руководством по тому, как работает каждый из процессоров, она должна дать вам базовое представление об их внутренней работе и сложности. К сожалению, о том, как действительно работают современные процессоры, знают лишь работники Intel и AMD, поэтому информация, описанная в этой статье — лишь вершина айсберга, ведь каждый пункт, описанный в тексте — это результат огромного количества исследований и разработок.

    Другие материалы по теме

    Если вам хочется узнать больше о том, как создаются различные компоненты, описанные в этом тексте, то настоятельно советуем обратить внимание на вторую часть серии статей «Как разрабатываются и создаются процессоры?». Если же вы больше заинтересованы в том, как производятся физические оболочки процессоров, то вам стоит ознакомиться с третьей статьей той же серии.

    Центральный процессор

    Одним из важнейших компонентов компьютера является центральный процессор (CPU — англ. central processing unit — «центральное вычислительное устройство»). Характеристики и тип процессора в первую очередь определяют производительность компьютерной системы в целом.

    Центральный процессор (CPU — central processing unit) — это устройство компьютера, предназначенное для выполнения арифметических и логических операций над данными, а также координации работы всех устройств компьютера.

    Современные процессоры для персональных компьютеров выполняются в виде отдельных микросхем. Рассмотрим логическую схему процессора (см. изображение ниже)

    Логическая схема процессора

    Основной элемент процессора — ядро. Этот элемент содержит основные функциональные блоки процессора и осуществляет выполнение одного потока команд. Современные процессоры могут иметь несколько ядер и способны выполнять одновременно несколько потоков команд.

    Основные характеристики процессора

    • Тактовая частота (определяется генератором тактовой частоты, установленным на системной плате).
    • Разрядность процессора (определяет количество битов данных, которые он может принять и обработать одновременно).
    • Объем кэш-памяти (сверхбыстрая память, хранящая содер­жимое наиболее часто используемых ячеек оперативной памяти, а также части программы, к которым процессор обратится с наи­большей долей вероятности).
    • Количество ядер .
    • Технологические нормы (технологические нормы определяют расстояние между соседними транзисторами).

    Copyright © 2014-2021, Урок информатики
    Все права защищены

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *