Lynnfield какое поколение
Перейти к содержимому

Lynnfield какое поколение

  • автор:

Как работает Turbo Mode

Оба главных производителя потребительских x86-совместимых CPU методом проб и ошибок нашли тот разумный максимум тепловыделения, превышать который не следует. Печальный опыт с Intel Prescott показал, что CPU, выделяющий более 130 Вт, чересчур горяч для ATX корпуса. Именно поэтому сегодняшние топовые процессоры обладают TDP на уровне 120-140 Вт, тогда как тепловой пакет мейнстрим CPU обычно ограничен 95 Вт.

Однако в эту, казалось бы, идеальную картину, вкрадывается противоречие. Ведь количество ядер, в отличие от частоты их работы, не влияет прямо пропорционально на производительность. Есть приложения, плохо оптимизированные под многопоточные вычисления. Есть приложения, вообще не поддающиеся распараллеливанию. В таком случае, скажем, два ядра из четырех в CPU простаивают. Конечно, в состоянии покоя они не выделяют много «лишнего тепла», однако процессор работает медленнее своего двухядерного коллеги, у которого тактовая частота при одинаковом TDP выше. Отсюда пользователям приходится прикидывать, в каких приложениях им придется работать чаще, и от чего будет больший выигрыш – от более высокой частоты двухядерного CPU, или же от количества вычислительных потоков четырехядерного.

Умный процессор теоретически смог бы понять, что скорость работы ядер ограничена не частотой (штатные частоты современных 45 нм CPU далеки от предельных), а значением TDP, за которое нельзя выходить. Более того, тогда бы чип мог увеличивать при необходимости частоты активных ядер, если есть незадействованные (а значит и запас по тепловыделению).

Оказывается, такой процессор теперь есть. И имя ему – Lynnfield.

В прошлом году с анонсом Nehalem Intel представила одно очень существенное нововведение, которое за блеском впечатляющей производительности осталось незамеченным многими. Внимание энтузиастов было сконцентрировано на размерах кэшей, производительности самого CPU и латентности памяти, а вот Power Gate Transistor остался на втором плане.

Как известно, транзисторы работают как небольшие переключатели – преграждая путь току в закрытом состоянии, и пропуская в открытом. Одним из побочных эффектов постоянного уменьшения размеров транзисторов с совершенствованием технологического процесса производства и ростом скорости их переключений, является возрастание токов утечки. Это значит, что транзистор начинает пропускать небольшой ток и в выключенном состоянии. Хотя эти токи и невелики, в случае, когда кристалл состоит из нескольких сотен миллионов транзисторов, энергетическая эффективность существенно страдает. Можно уменьшить эти токи утечки, но в таком случае пострадает производительность – невозможно одновременно добиться высокой тактовой частоты и ничтожно малых токов утечки.

Однако в лабораториях Intel сумели найти выход из данной непростой ситуации. Используя определенные «умные» материалы, они создали транзистор специального типа с минимальным сопротивлением, который мог эффективно отключать схемы, находящиеся за ним, от энергетических потоков. Таким образом, стало возможно полностью отключать неиспользуемые ядра с помощью Power Gate Transistor.

В случае с четырехядерным Phenom II, когда два ядра остаются без нагрузки, специальный управляющий блок отключает их. Однако даже в таком состоянии из-за существующих токов утечки они продолжают потреблять энергию. В случае с Nehalem благодаря Power Gate неиспользуемая пара ядер может быть отключена практически полностью – так, что токи утечки будут пренебрежительно мало. Именно благодаря этому показатели энергопотребления Nehalem в состоянии покоя так впечатляют:

Мы выяснили, что Nehalem способен эффективно отключать неиспользуемые ядра в состоянии покоя. Зачем это необходимо? Ответ прост – так создается запас относительно номинального TDP, который можно эффективно использовать. Речь идет о повышении частот активных ядер таким образом, чтобы одновременно увеличить скорость исполнения плохо распараллеленных задач и остаться в рамках заявленного TDP.

Именно для этих целей в каждом производимом на данный момент Nehalem (включая Bloomfield) существует специальный блок, состоящий приблизительно из 1 миллиона транзисторов (сравнимо со сложностью Intel 486), чья единственная задача – менеджмент питания процессора. Именно Power Control Unit следит за энергопотреблением, отключает полностью или снижает частоты неактивных ядер, постоянно отслеживая нагрузку и состояние CPU. В Lynnfield применен модернизированный относительно Bloomfield блок PCU, однако его архитектура в целом осталась неизменной. Внимательные читатели уже наверняка догадались, что именно блок PCU в Lynnfield помимо всего прочего обучен повышать частоты активных ядер в случае с отсутствием нагрузки на все четыре ядра. Данное технология носит уже знакомое нам название Turbo Mode. [N10-Производительность Lynnfield в TM – до 17% прироста!] Справедливости ради стоит отметить, что технология Turbo Mode не нова. Мы уже встречались с первым вариантом ее реализации в Bloomfield, однако тогда она не особо впечатляла и была всего лишь одной из списка интересных технологий новинки. Производительность в лучшем случае увеличивалась на 2-5%. TDP всех Bloomfield был заявлен в 130 Вт, и у каждого ядра было лишь совсем немного запаса по тепловыделению для повышения частоты. В Lynnfield же значение TDP было снижено на 27%, а значит, каждое ядро стало более холодным (чем ниже TDP, тем больше потенциал для Turbo). Этот факт в сочетании с целым годом, который инженеры Intel потратили на внесение мелких улучшений и оптимизаций в существующие Nehalem, позволил новому, более агрессивному Turbo Mode превратиться из незначительной возможности в один из ключевых плюсов нового процессора.

SYSMark 2007: Overall Dawn of War II Sacred 2 World of Warcraft
Intel Core i7 870 БЕЗ Turbo 206 74.3 FPS 84.8 FPS 60.6 FPS
Intel Core i7 870 С Turbo 233 81.0 FPS 97.4 FPS 70.7 FPS
% прироста 13.1% 9.0% 14.9% 16.7%

Как вы можете видеть, в отдельных случаях режим Turbo в Lynnfield может давать до 17% дополнительной производительности относительно работы четырех ядер на штатной частоте. Согласитесь – это значимая величина, недооценивать которую нельзя. По следующей таблице хорошо видно, что наилучшие результаты с Turbo достижимы в приложениях, интенсивно использующих одно или два ядра:

Штатная частота Активны 4 ядра Активны 3 ядра Активны 2 ядра Активно 1 ядро
Intel Core i7 870 2.93 ГГц 3.20 ГГц 3.20 ГГц 3.46 ГГц 3.60 ГГц
Intel Core i7 860 2.80 ГГц 3.06 ГГц 3.06 ГГц 3.33 ГГц 3.46 ГГц
Intel Core i5 750 2.66 ГГц 2.93 ГГц 2.93 ГГц 3.06 ГГц 3.20 ГГц

Если бы Intel обладала технологией, схожей по концепции и уровню реализации с сегодняшней Turbo Mode, во времена внедрения двухядерных CPU, было бы на порядок меньше споров по поводу необходимости перехода на мноядерные процессоры. Сегодня же при запуске однопоточного приложения на четырехядерном Lynnfield, мощнейший зверь из 774 млн. транзисторов попросту отключит три своих ядра, и автоматически разгонит оставшееся активное вплоть до 3.6 ГГц (в зависимости от модели). В таком режиме CPU окажется быстрее, чем любой из представленных на рынке Core 2 Duo.

WoW

Можно ли считать, что задача достижения оптимальной производительности в любом режиме выполнена? Отчасти это верно. Lynnfield является очень мощным и гибким процессором, который, как покажет наше тестирование, отлично справляется с любыми бенчмарками, получая высокие баллы. Условно говоря, покупая Core i7 870, вы приобретаете быстрый 3.46 ГГц двухядерный процессор, который в случае необходимости может исполнять хорошо распараллеленные приложения с помощью всех доступных четырех активных ядер на чуть меньшей частоте в 2.93 ГГц.

Однако нельзя рассматривать эту технологию как финишную черту, которую в Intel хотели достичь и остановиться после этого. По сути, вторая версия TM в Lynnfield является лишь очередным шагом к унификации CPU и GPU, которая, возможно, ждет нас в будущем. Совсем немного времени осталось до того момента, когда на одной подложке или даже кристалле будут располагаться и центральный, и графический процессоры. А ведь в таком случае их TDP также не должен будет выходить за разумные рамки. Как быть в такой ситуации? Так же, как и в случае с незадействованными ядрами Lynnfield – в случае большой потребности в мощности CPU отключать простаивающие блоки GPU, и, соответственно, наоборот. Такая система будет одновременно производительной, многопрофильной, экономичной, и, главное – сможет в реальном времени мгновенно подстраиваться под запросы пользователя. Именно это является целью, которая стала чуть ближе благодаря выходу нового поколения 45 нм Nehalem в свет. [N11-Скоростные ограничения: что может препятствовать работе Turbo Mode] Каким бы прекрасным ни был Turbo режим, к сожалению, он не может функционировать 100% времени. Есть целый ряд причин и факторов, которые могут препятствовать активации TM, и самые главные из них – качество охлаждения и смесь из множества исполняемых инструкций в большом числе потоков.

Тип исполняемых инструкций во многом определяет аппетиты CPU в каждом конкретном приложении. Так, в случае с кодированием видео, когда задействованы специализированные наборы SSE, сами ядра не используются на полную мощность, что позволяет экономить энергию. Однако сжатие видео – ресурсоемкая операция, при которой нет нужды «соблюдать диету» и держать CPU в экономичном режиме, здесь важна именно производительность. Значит, можно поднять частоту ядер. Кстати говоря, по словам Intel, при кодировании видео и прочих операциях, использующих наборы команд SSE различных версий, Turbo режим работает особенно эффективно.

А вот операции с плавающей запятой, напротив, серьезно нагружают все части ядер. Здесь вряд ли стоит ожидать увеличения частоты более чем на одну ступень (133 МГц), если вообще PCU посчитает возможным активацию Turbo Mode. Иными словами – невозможно просто определить эффективность TM, узнав количество исполняемых программой потоков. Характер команд в этих потоках так же очень важен.

Нельзя забывать и о том, что, помимо запускаемого пользователем основного приложения, в фоновых процессах может быть активно много скрытых процессов, например, порожденных самой операционной системой. Хотя обычно фоновые приложения являются однопоточными, их количество может исчисляться десятками, или даже сотнями. Всего лишь несколько из них, которые планировщик задач «повесит» на отключенные ядра, могут вынудить PCU включить неиспользуемые ядра ради минимальной нагрузки, а это ограничит возможности Turbo. Отрадно, что в Windows 7 уделили существенное внимание данной проблеме (как известно, работа C’n’Q в Phenom первой версии из-за особенностей диспетчера задач Windows Vista существенно снижала производительность процессора, вынуждая CPU постоянно включать и отключать ядра), и Lynnfield не должен страдать от этой проблемы при использовании «семерки».

Но не все так неоднозначно. Если контролировать смесь потоков, инструкций и данных, количество исполняемых нитей в приложении и многие другие факторы затруднительно, охлаждение процессора напрямую зависит от пользователя. Безусловно, ни о каком повышении частот относительно номинала и речи быть не может, если CPU работает в предельном температурном режиме. Наоборот – следует помнить, что непродуманная циркуляция воздуха в системном блоке, тесный корпус, некорректно установленный кулер или множество незакрепленных проводов на пути воздушных потоков, могут вынудить PCU снизить частоты ядер, чтобы избежать физического повреждения процессора.

Боксовый кулер, который поставляется в комплекте с Core i7, довольно мал по размерам. Он способен отводить тепло от процессора в штатных режимах и даже позволяет Lynnfield иногда переходить в Turbo режим. Тем не менее, его эффективности недостаточно, чтобы дать процессору раскрыться полностью. Как и в случае с Core i7 LGA1356 мы рекомендуем для LGA1156 устанавливать более производительные охлаждающие устройства от сторонних производителей. [N12-Lynnfield – создан для Windows 7 (или наоборот)]
Среди новых возможностей Windows – специальная функция Core Parking, которая по умолчанию активируется во всех многосокетных или многоядерных машинах, а так же на тех, чьи CPU поддерживают Hyper Threading (например, Pentium 4, Atom, Core i7). Данное нововведение было призвано бороться со случаями неправильной работы диспетчера задач, из-за действий которого исполняемый поток перебрасывался с ядра на ядро. Иногда это приводило к потерям производительности, или же неоптимальной работе технологий энергосбережения. В Windows 7 описанных случаев быть не должно – специально созданная интеллектуальная система будет решать, к какому ядру должна быть привязана конкретная нить.

Если говорить техническим языком, Core Parking помогает в тех случаях, когда ОС хочет перебросить исполняемую задачу с реального ядра на виртуальное. Так же усовершенствование должно помочь в тех ситуациях, когда на многосокетных машинах происходит перетасовка потоков между физическими процессорами (а это может сильно сказаться на скорости работы, ведь дополнительно с инструкциями перемещаются и данные из кэшей, информация в памяти – ведь каждый ИКП работает со своими физическими модулями DIMM).

Как и в случае с любой другой сложной технологией, не обошлось с Core Parking и без исключений, в которых технология бессильна. Например, если в программе вручную прописано назначение ветвей исполнения на определенные ядра, Core Parking бессильна. Поэтому в некоторых программах даже в среде Windows 7 от включения Hyper Threading все равно наблюдается падение производительности. В нашем тестовом марафоне к таким были причислены AutoCAD 2010 и World of Warcraft.

В общем и целом – с новым алгоритмом распределения задач в Windows 7 программистам теперь несколько облегчили жизнь, ведь ОС теперь достаточно умна, чтобы самостоятельно справляться с работой на мультисокетных конфигурациях, или на ПК с активным Hyper Threading. [N13-Lynnfield Uncore: быстрее, чем у большинства Bloomfield] Несколько лет назад AMD впервые представила концепцию размещения процессорного кэша третьего уровня L3 как бы вне ядер, на одном уровне с контроллером памяти. Первый Phenom был построен именно по такому принципу. Это было продиктовано многими причинами, в частности, экономическими, и вопросами энергоэффективности.

В случае с Nehalem Intel взяла на вооружение идею AMD и развила ее. Процессоры Intel последнего поколения разделены на две условных части – Core, и Uncore. В условной части Core расположены непосредственно ядра CPU и их выделенные кэши первого и второго уровней (L1/L2). В Uncore сосредоточились дополнительные модули, внесенные на кристалл CPU, будь то массив L3, линки QPI в Bloomfield, или контроллеры DMI и PCI Express в Lynnfield.

Вообще говоря, производительность Uncore части не особенно критична для общей скорости работы CPU, но она состоит из сотен тысяч транзисторов; примерно 400 миллионов в случае с Bloomfield/ Lynnfield (и даже больше, если брать во внимание PCIe контроллер последнего). Поэтому в Intel решили использовать более медленные транзисторы с меньшими токами утечек, чем для Core части. Это вполне логично – раз производительность страдает несильно, значит, можно подумать об экономичности. В результате Uncore не может работать на такой же частоте, как основные ядра, и множитель относительно базового тактового генератора снижен.

Взять хотя бы для примера Bloomfield Core i7 975. Ядра этого быстрейшего CPU имеют множитель 25x BCLK (25 x 133 МГц = 3.33 ГГц), однако Uncore работает на 20x BCLK (20 x 133 МГц = 2.66 ГГц). Все другие чипы, включая Lynnfield, имеют более низкую частоту работы:

Процессор Сокет Частота Core Частота Uncore
Intel Core i7 975 Extreme LGA1356 3.33 ГГц 2.66 ГГц
Intel Core i7 965 Extreme LGA1356 3.20 ГГц 2.66 ГГц
Intel Core i7 950 LGA1356 3.06 ГГц 2.13 ГГц
Intel Core i7 940 LGA1356 2.93 ГГц 2.13 ГГц
Intel Core i7 920 LGA1356 2.66 ГГц 2.13 ГГц
Intel Core i7 870 LGA1156 2.93 ГГц 2.40 ГГц
Intel Core i7 860 LGA1156 2.80 ГГц 2.40 ГГц
Intel Core i7 750 LGA1156 2.66 ГГц 2.13 ГГц

Вот и еще одна область, в которой Lynnfield превосходит Bloomfield нижнего уровня: часть Uncore нового процессора работает на 2.40 ГГц вместо 2.13 ГГц. Исключением здесь является Core i5 750, у него частота Uncore сохранена на уровне 2.13 ГГц. Конечно, «экстремальные» Bloomfield быстрее по этому параметру, но ведь должна же платформа LGA1356 соответствовать своей существенно более высокой цене. [N14-Контроллера памяти Lynnfield – так же быстрее Bloomfield] Официально для Bloomfield Intel декларировала поддержку лишь двух типов трехканальной памяти DDR3: DDR3-800 и DDR3-1066. На самом деле более скоростные модули так же поддерживаются, однако мы говорим о штатных режимах работы, предусмотренных и протестированных производителем.

[N15-Открытие: пара каналов контроллера памяти не хуже тройки] Согласно информации, официально распространяемой Intel, для того, чтобы полностью загрузить работой двухканальный контроллер памяти DDR3-1333 в Lynnfield, требуется чрезвычайно интенсивная работа как минимум трех ядер. Как показывает практика, это очень жесткое требование. В подавляющем большинстве случаев отсутствие третьего 64-битного контроллера памяти в новом Core i7 никоим образом не вредит его производительности.

Если говорить о переходе к 6 или даже 8 ядрам, здесь не может быть вариантов. Третий канал памяти жизненно необходим для эффективной работы таких систем под нагрузкой. Но именно поэтому данные CPU мы увидим лишь в LGA1366 варианте. Как предполагается, материнским платам на базе X58 будет необходим лишь обновленный BIOS для корректной работы с шестиядерными 32 нм Gulftown, которые будут выпущены уже в следующем году. А вот для LGA1156/P55 мы вряд ли увидим CPU с числом ядер более четырех. Каждый сам определит, насколько данное положение дел его устраивает или не устраивает. Но, положа руку на сердце, многим ли домашним пользователям в повседневной жизни необходимы те дополнительные два ядра, которые будут в распоряжении Gulftown?

В подтверждение наших слов приведем результаты теста Everest по пропускной способности и задержкам памяти для Core i7 975 Extreme, и Core i7 870 (Lynnfield):

задержки памяти

Для того, чтобы проверить на практике, изменилось ли что-нибудь в Lynnfield, мы провели несколько игровых тестов в Windows 7. Среди конкурентов были оставлены лишь Lynnfield (конечно же), Bloomfield, Penryn и Deneb.

Dawn of War II

Вряд ли можно сказать, что в Dawn of War II произошло что-то неожиданное. Благодаря TM, старший Lynnfield занимает отличные позиции в таблице, однако его производительности недостаточно, чтобы обогнать более дорогого Bloomfield. В свою очередь, если посмотреть на младшие процессоры из линеек, Core i5 750 несколько проигрывает Core i7 920. Но что особенно интересно – обратите внимание на минимальный фреймрейт! В обоих случаях платформы с Lynnfield показывают лучший результат, чем конкурирующие системы Bloomfield. Похоже, что именно это важное преимущество (согласитесь, хотя среднее количество кадров в секунду очень важно, минимальное их число влияет на комфортность игрового процесса ничуть не меньше) обусловлено агрессивной работой Turbo Mode в Lynnfield.

Еще один интересный момент – самый медленный четырехядерный Lynnfield оказался быстрее самого производительного двухядерника Intel: Core 2 Duo E8600.

Sacred 2

Sacred 2 является еще одной игрой, в которой наблюдается схожая с DoW II картина производительности. Все так же Lynnfield в целом не может одолеть Bloomfield, а Core i5 даже несколько уступает AMD Phenom II X4 965 BE.

Народный Nehalem. Первое знакомство с процессором Core i7-800 и материнской платой на базе чипсета P55 Express

После выхода в 2008 году платформы Nehalem появление более доступных продуктов на базе новой микроархитектуры стало вопросом времени, и по истечению почти года, 8 сентября, компания Intel представила недорогие решения для массового рынка — процессоры серии Core i7-8xx и Core i5-7xx и необходимый для их работы чипсет P55 Express.

Как и у предшественников Core i7-9xx, новинки получили 8-мегабайтную кэш-память третьего уровня и встроенный контроллер памяти, но с некоторыми изменениями. Также модели 800-серии продолжили поддержку некогда забытой технологии Hyper-Threading, которая позволяла операционной системе видеть физическое ядро как два логических, за счет чего увеличивалась производительность в многопоточных приложениях. Из особенностей отметим использование нового процессорного разъема — LGA1156, количество контактов которого составляет 1156 штук.

Процессоры Core i7-800 и Core i5-700

Компания Intel представила сразу три процессора — Core i7-870, Core i7-860 и Core i5-750 — которые отличаются тактовыми частотами, режимами работы технологии Turbo Boost и поддержкой технологии Hyper-Threading.

Intel Core i7-9xx Intel Core i7-870 Intel Core i7-860 Intel Core i5-750 Intel Core 2 Quad
Архитектура Nehalem Nehalem Nehalem Nehalem Penryn
Ядро Bloomfield Lynnfield Lynnfield Lynnfield Yorkfield
Разъем LGA1366 LGA1156 LGA1156 LGA1156 LGA775
Техпроцесс 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков
Число ядер 4 (8 потоков) 4 (8 потоков) 4 (8 потоков) 4 (4 потока) 4 (4 потока)
Номинальная частота 3,33-2,66 ГГц 2,93 ГГц 2,8 ГГц 2,66 ГГц 3,2-2,33 ГГц
Hyper-Threading + + +
Turbo Boost (шаг поднятия частоты в зависимости от загрузки I/II/III/IV ядер) 2/1/1/1 5/4/2/2 5/4/1/1 4/4/1/1
Объем L1 кэша 4 x (32+32) КБ 4 x (32+32) КБ 4 x (32+32) КБ 4 x (32+32) КБ 4 x (32+32) КБ
Объем L2 кэша 4 x 256 КБ 4 x 256 КБ 4 x 256 КБ 4 x 256 КБ 2 х 3/6 МБ
Объем L3 кэша 8 МБ 8 МБ 8 МБ 8 МБ
Множитель х25-x12, заблокирован на повышение кроме процессоров Extreme Edition х22-x9, заблокирован на повышение х21-x9, заблокирован на повышение х20-x9, заблокирован на повышение х9-х6, заблокирован на повышение кроме процессоров Extreme Edition
Контроллер памяти Трехканальный Двухканальный Двухканальный Двухканальный
Поддерживаемый тип памяти DDR3 1333/1066/800 DDR3 1333/1066 DDR3 1333/1066 DDR3 1066
Шина для связи с чипсетом QPI DMI DMI DMI FSB
PCI Express 2.0 x16/x8+x8 x16/x8+x8 x16/x8+x8
Пропускная способность QPI (в процессорах LGA1156 шина для связи процессора и встроенного контроллера PCI Express 2.0) или частота FSB 6,4/4,8 ГТ/с 4,8 ГТ/с 4,8 ГТ/с 4,8 ГТ/с 1600/1333 МГц
Номинальное напряжение 1,2 В 1,02 В 1,02 В 1,02 В 1,25 В
TDP 130 Вт 95 Вт 95 Вт 95 Вт 136-65 Вт
Стоимость $999-284 $562 $284 $196 $1038-163

Архитектурно процессоры семейства Core i7-800 и Core i5-700 (кодовое имя Lynnfield, 45 нм) по сравнению с Core i7-900 на базе ядра Bloomfield претерпели некоторые изменения. В первую очередь это встроенный двухканальный контроллер памяти DDR3, вместо трехканального, и поддержка 16 линий интерфейса PCI Express 2.0 силами самого процессора — теперь северный мост полностью интегрирован в CPU, а чипсет отвечает лишь за коммуникационные возможности системы. Последнее позволяет упростить разводку материнских плат, благодаря уменьшению количества микросхем в системной логике — вместо привычных MCH и ICH на платах теперь будет присутствовать PCH (Platform Controller Hub).

Intel Lynnfield

Для связи процессора с PCH предусмотрена шина DMI (Direct Media Interface, по сути — это четыре линии PCI Express), которая ранее уже использовалась между северным и южным мостами в чипсетах Intel еще в 900-й серии. Интерфейс QPI (Quick Path Interconnect), присутствующий в процессорах Bloomfield и отвечающий за связь с чипсетом и аналогичным процессором (серверный вариант), упразднен как основная шина, и теперь в его функции входит лишь обеспечение передачи данных между CPU и контроллером PCI Express. Ранее QPI серьезно сдерживала разгон процессоров Core i7, так как ее частота достигала предельной отметки 4 ГГц при номинальных 2,4-3,2 ГГц (множители х18, х20 и х24), что соответствовало около 222 МГц по Bclk. Как известно, частоты всех блоков процессора, памяти и QPI являются производными определенных коэффициентов и базовой частоты, равной по умолчанию 133 МГц. Некоторые коэффициенты умножения зафиксированы на очень больших значениях, которые не позволяют значительно поднимать частоту того или иного узла системы, а это уже сказывается на уровне разгона. Процессоры Lynnfield дополнительно к множителю x18 поддерживают еще и х16 (эффективные х36 и х32), позволяющий достигать отметки 250 МГц по тактовому генератору. Во всяком случае, теперь шина QPI перестает быть ограничивающим фактором при оверклокинге.

Частота контроллера памяти и L3-кэша в Core i7-800 и Core i5-700, в отличие от процессоров 900-й серии, уже не зависит от частоты памяти — она жестко зафиксирована множителем х18 для старших моделей и х16 для младших. Такое ограничение позволяет с одной стороны использовать высокочастотные модули, не создавая нагрузку на контроллер памяти, а с другой — стать ограничением при разгоне системы после достижения частоты Bclk свыше 210-220 МГц при использовании восьмисотых моделей и 240-250 МГц — семисотых. Из поддерживаемой памяти заявлена DDR3-1333/1066 для моделей серии Core i7-800 и DDR3-1066 для Core i7-700. Но, как правило, коэффициенты умножения памяти не ограничены официальными спецификациями, и вполне нормально можно использовать планки частотой 1600 МГц и выше.

За счет перехода к поддержке двухканального режима количество контактов в процессорном разъеме удалось снизить с 1366 до 1156 шт., и теперь процессоры Lynnfield по размерам соответствуют решениям LGA775.

Процессоры Core 2 Duo, Core i7-860 и Core i7-965

Процессоры Core 2 Duo, Core i7-860 и Core i7-965

Intel Core i7-860 в центре

Конструктивно LGA1156 напоминает старшего брата, но в отличие от него, механизм разъема немного изменен: верхняя рамка поднимается и закрывается за счет рычажка; защелкивание рамки происходит за один из монтажных винтов усиливающей пластины.

Socket LGA1156

Socket LGA1156

Пользователей, которые приобрели системы охлаждения с универсальным креплением для процессоров LGA775 и LGA1366, ждет разочарование, так как расстояние между монтажными отверстиями в LGA1156 не совпадает ни с тем, ни с другим — оно находится как раз между расстояниями в этих разъемах (72, 75 и 80 мм). В итоге придется либо искать новое крепление, либо кулер.

Из других особенностей новых процессоров отметим отсутствие поддержки Hyper-Threading в процессорах серии Core i5-700, которая не так критична для домашнего пользователя, и новые режимы работы технологии Turbo Boost, позволяющей поднимать частоту CPU при работе приложений, слабо оптимизированных под многопоточность. Если ранее частота поднималась на один или два пункта для всех или одного ядра соответственно (133 и 266 МГц), то теперь разгон может достигать 4-5 пунктов для одного ядра, т.е. 532-665 МГц.

Для процессора Core i5-750 характерна формула 4/4/1/1 (множитель процессора увеличится на 4 для одного или двух ядер, на 1 для трех или четырех), для Core i7-860 — 5/4/1/1, а для Core i7-870 еще выше — 5/4/2/2, т.е. частота последнего процессора в большинстве случаев будет составлять 3,2 ГГц, а иногда доходить до 3,6 ГГц. И это официальный разгон! Наш тестовый процессор Core i7-860 степпинга B1 в большинстве случаев работал на частоте 2,93 ГГц, вместо номинальных 2,8 ГГц. Если бы его температура или потребляемая сила тока вышла за пределы допустимого, то технология Turbo Boost, как того требуют защитные средства CPU, естественно, не работала бы.

Intel Core i7-860

Как уже отмечалось выше, частота процессора микроархитектуры Nehalem, его внутренних блоков и памяти формируется за счет определенного коэффициента, умноженного на частоту тактового генератора, равную в номинале 133 МГц — в этом плане новинки нисколько не изменились. Частота шины QPI в Core i7-8xx по дефолту равна 2400 МГц (133х18), но при желании ее можно снизить до 2140 МГц за счет доступного более низкого множителя х16. Такие же множители присутствуют в процессорах Core i5-7xxx. Блок Uncore, а это контроллер памяти и L3-кэш, работает в Core i7-8xx на частоте 2400 МГц, но в отличие от QPI его множитель заблокирован на х18.

Intel Core i7-860

Даже если сменить память с DDR3-1333 на DRR3-1600, частота контроллера (NB Frequency в CPU-Z) по-прежнему будет 2,4 ГГц.

Intel Core i7-860

Для моделей 700-й серии коэффициент умножения контроллера памяти ниже и равен x16.

Как видим, несмотря на общую между новыми процессорами и 900-й серией микроархитектуру, модели Core i7-8хх и Core i5-7хх получили достаточное количество изменений, чтобы упростить и удешевить готовые изделия. Конечно, некоторые новшества не особо понравятся оверклокерам, но в целом, разгонять стало лучше, разгонять стало проще! Или нет?

Intel P55 Express

С перенесением всего северного моста в новые процессоры Core i7 (а это контроллеры памяти и шины PCI Express) необходимость в двух микросхемах чипсета отпала и фактически набор системной логики представляет собой обычный южный мост, так как он отвечает сугубо за коммуникационные возможности.

Intel P55 Express

Для связи между чипом PCH, а именно так теперь называется микросхема, и процессором используется шина DMI, знакомая еще по 900-серии чипсетов Intel, что еще больше роднит P55 с южным мостом.

Intel P55 Express

Intel P55 Express на плате Gigabyte GA-P55-UD3

Набор системной логики P55 Express поддерживает четырнадцать портов USB 2.0, шесть каналов SATA II, с возможностью организации RAID-массивов 0, 1, 5 и 10, четыре слота PCI и восемь линий PCI Express, причем второй генерации (правда, пропускная способность осталась на прежнем уровне, и соответствует версии 1.1) — данной функциональности более чем достаточно для использования в системных платах любого уровня.

Кроме того материнские платы на базе P55 могут без проблем поддерживать технологии ATI CrossFireX и NVIDIA SLI, при этом видеокарты смогут работать по формуле «х8+х8».

Gigabyte GA-P55-UD6

Для тестирования процессора Intel Core i7-860 использовалась материнская плата Gigabyte GA-P55-UD6, которая является топовой в линейке продуктов на базе чипсета P55 Express. Плата попала к нам в обычном антистатическом пакете, поэтому сразу перейдем к рассмотрению данной модели.

Модель GA-P55-UD6
Чипсет Intel P55 Express
Socket LGA 1156
Процессоры Core i5, Core i7
Память 6 DIMM DDR3 SDRAM 2600+/2200/1333/1066/800 (16 GB max)
Слоты PCI-E 3 PCI Express x16 (SLI и CrossfireX в режиме 8+8)
2 PCI Express x1
Слоты PCI 2
Количество подключаемых вентиляторов 6 (2x 4-pin, 4x 3-pin)
Порты USB 2.0 14 (8 USB и 2 eSATA/USB Combo разъемов на задней панели)
Порты PS/2 1
Порт LPT
Порт COM 1
Порты FireWire 3 (2 разъема на задней панели)
ATA-133 1 канал (два устройства, GIGABYTE SATA2)
Serial ATA 6 каналов SATA II (Intel P55)
2 канала SATA II (GIGABYTE SATA2)
2 канала SATA II (JMicron JMB362)
2 eSATA (JMicron JMB362)
RAID 0, 1, 5, 10 для P55 и 0, 1, JBOD для GIGABYTE SATA2 и JMicron JMB362
Встроенный звук Realtek ALC889A (7.1, HDA)
S/PDIF Коаксиальный + оптический
Встроенная сеть 2 x RTL8111D (Gigabit Ethernet)
BIOS Award
Форм-фактор ATX
Размеры, мм 305 x 244
Дополнительно Кнопки Power, Reset, Clear CMOS, POST-индикатор, Dual-BIOS

GA-P55-UD6 относится к серии Ultra Durable 3, что подразумевает использование только высококачественных компонентов и увеличенную толщину медных слоев питания и заземления, и выполнена в традиционных для Gigabyte синих тонах, начиная от текстолита и заканчивая большинством разъемов и декоративных элементов системы охлаждения. Слегка выбиваются из этой гаммы два оранжевых PCI Express х16 и пара желтых USB-разъемов.

Gigabyte GA-P55-UD6

Gigabyte GA-P55-UD6

Несмотря на встроенный двухканальный контроллер памяти в процессорах LGA1156, плата оснащена шестью слотами DIMM с поддержкой модулей частотой вплоть до 2600 МГц — прям как решения на X58, кроме частоты памяти, естественно.

Расположение разъемов довольно удобное, почти все они сконцентрированы у краев платы, так что шлейфы не будут мешаться при сборке.

Gigabyte GA-P55-UD6

Некоторые претензии можно лишь предъявить к расположению кнопок Power, Reset и Clear CMOS, которые рассредоточены по всей материнской плате, а не собраны в одном месте.

Gigabyte GA-P55-UD6

Gigabyte GA-P55-UD6

В самом углу платы, возле разъемов SATA установлен POST-индикатор, по которому можно определить процесс загрузки системы.

Рассматриваемая модель может похвастаться мощной системой питания процессора, построенной по «24-фазной» схеме, и по этому параметру она пока что является рекордсменом среди решений под Socket LGA 1156.

Gigabyte GA-P55-UD6

Из-за сложной схемотехники питающей цепи часть стабилизаторов вынесена на обратную сторону GA-P55-UD6.

Gigabyte GA-P55-UD6

Чтобы повысить энергоэффективность при низких нагрузках часть фаз отключается, а о количестве активных фаз сигнализирует блок светодиодов, расположенных возле слотов памяти.

Система охлаждения платы выглядит довольно внушительно. Большие радиаторы накрывают силовые элементы питающей цепи и соединяются тепловой трубкой с радиатором на чипсете. Кстати, как вы могли заметить, из-за двух радиаторов может создаться обманчивое впечатление использование двух микросхем («северного» и «южного» мостов, как на старых платформах) чипсета или какого-нибудь чипа, вроде nForce200. На самом деле никакие дополнительные чипы на плате не используются (тем боле, что все функции «южного» моста выполняет непосредственно Intel P55), просто нижний радиатор накрывает два контроллера — GIGABYTE SATA2 и один JMicron JMB362. Учитывая, что данные чипы спокойно могут обходиться без дополнительного охлаждения, наличие радиатора необходимо лишь для увеличения площади рассеивания тепла для всей системы охлаждения.

Функциональность GA-P55-UD6 находится на высоком уровне: три слота PCI-E x16 (x16, x8 и x4), два PCI-E x1, два PCI, десять каналов SATA II (шесть реализовано за счет P55, два за счет GIGABYTE SATA2 и два — JMicron JMB362), один канал IDE и COM-порт. На задней панели присутствуют универсальный порт PS/2, оптический и коаксиальный S/PDIF, два порта FireWire (обычный и мини), восемь портов USB 2.0 (еще четыре на плате), два RJ45 (Realtek RTL8111D) и шесть аудиоразъемов — в качестве HDA-кодека используется чип Realtek ALC889A.

Gigabyte GA-P55-UD6

Кроме того на панели есть два универсальных разъема eSATA/USB, которые позволяют подключать любые из устройств, рассчитанных на один из этих интерфейсов.

Одной из особенностей платы является одновременная поддержка технологий ATI CrossFireX и NVIDIA SLI. Если устанавливать всего одну карту, то она будет «общаться» с процессором за счет шестнадцати линий PCI Express 2.0, но при использовании двух акселераторов плата автоматически переведет их в режим «х8+х8». На данный момент такая формула не особо влияет на производительность видеоподсистемы по сравнению с «х16+х16», но через одно-два поколения видеокарт, возможно, уже восемь линий PCI-E 2.0 будет недостаточно для каждой карты при постройке тандемов.

BIOS

BIOS платы Gigabyte GA-P55-UD6 основан на микрокоде Award и позволяет достаточно тонко произвести настройку системы. Производители все чаще стали располагать раздел для оверклокинга на первом месте среди пунктов меню BIOS Setup и Gigabyte в этом плане не стала исключением.

BIOS Gigabyte GA-P55-UD6

Все интересующие нас пункты для разгона сосредоточены в разделе MB Intelligent Tweaker (M.I.T.). Здесь можно выбрать частоту тактового генератора (от 100 до 1200 МГц), множитель процессора и шины QPI, настроить режим работы памяти и выбрать основные напряжения.

BIOS Gigabyte GA-P55-UD6

Дополнительные пункты сосредоточены в подразделах, например, в Advanced CPU Features все необходимое для настройки работы процессора. Это коэффициент умножения, активация/деактивация Turbo Boost и Hyper-Threading, а также различных энергосберегающих технологий и виртуализации.

BIOS Gigabyte GA-P55-UD6

В UnCore & QPI Features дублируется настройка шины QPI и тут же показывается частота и множитель контроллера памяти и L3-кэша.

BIOS Gigabyte GA-P55-UD6

Advanced Clock Control отвечает за частоту Bclk, PCI Express (от 90 до 150 МГц), амплитуду частоты шин, связывающие чипсет с процессором и PCI Express, и задержку по времени между тактовыми сигналами процессора и чипсета. Тут же можно выбрать один из режимов динамического разгона.

BIOS Gigabyte GA-P55-UD6

Как в основном разделе, так и в подразделе Advanced DRAM Futures коэффициент умножения памяти можно менять от 6 до 12 (тут он эффективный), что соответствует 800-1600 МГц, активировать профиль XMP и получить информацию по напряжениям на памяти и контроллере, а не гадать какой сюрприз преподнес производитель модулей. Так же можно изменять тайминги, причем, для каждого канала в отдельности.

BIOS Gigabyte GA-P55-UD6

BIOS Gigabyte GA-P55-UD6

BIOS Gigabyte GA-P55-UD6

В Advanced Voltage Control есть возможность изменить режим работы Load-Line Calibration и все необходимые для разгона напряжения: на процессоре, контроллере памяти, чипсете и памяти.

BIOS Gigabyte GA-P55-UD6

Все значения напряжений сведены в следующую таблицу:

Параметр Диапазон изменений
CPU Vcore 0,5-1,9 В с шагом 0,00625 В (не рекомендуемое с 1,55 В, опасное — 1,6 В)
QPI/Vtt Voltage 0,8-1,94 В с шагом 0,02 В (не рекомендуемое с 1,36 В, опасное — 1,6 В)
PCH Core 0,85-1,05 с шагом 0,05 В и 1,08-2,08 с шагом 0,02 В
CPU PLL 1,5-1,8 В с шагом 0,1 В и 1,82-2,64 с шагом 0,02 В
DRAM Voltage 1,3-2,6 В с шагом 0,02 В (не рекомендуемое с 1,66 В, опасное — 1,88 В)
DRAM Termination 0,49-1,195 В с шагом 0,02-0,025 В (не рекомендуемое с 0,92 В, опасное — 1,02 В)
Ch-A Data VRef. 0,49-0,94 с шагом 0,01 В (не рекомендуемое с 0,9 В)
Ch-В Data VRef. 0,49-0,94 с шагом 0,01 В (не рекомендуемое с 0,9 В)
Ch-A Adress VRef. 0,68-0,94 с шагом 0,01 В (не рекомендуемое с 0,9 В)
Ch-B Adress VRef. 0,68-0,94 с шагом 0,01 В (не рекомендуемое с 0,9 В)

Мониторинг скуден: напряжение на процессоре и памяти, +5V, температура CPU и платы, а также скорость вращения четырех вентиляторов. В этом же разделе можно настроить сигнализацию при остановке вентиляторов и управлять режимом работы вентилятора на процессорном кулере.

BIOS Gigabyte GA-P55-UD6

Для тех, кто постоянно обновляет прошивку BIOS, пригодится встроенная утилита Q-Flash, которая присутствует в каждой материнской плате плат Gigabyte, тем самым избавляя пользователя делать загрузочную «флэшку».

Тестовые конфигурации

  • Процессор: Intel Core i7-860 (2,8 ГГц, 8 МБ кэш L3, ES)
  • Материнская плата: Gigabyte GA-P55-UD6 (Intel P55);
  • Кулер: Noctua NH-U12P с модифицированным креплением LGA1366 Mounting-Kit;
  • Оперативная память: G.Skill F3-12800CL6T-6GBTD (3×2048 МБ, DDR3-1600);
  • Видеокарты: ASUS EAH4890/HTDI/1GD5/A (Radeon HD 4890);
  • Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);
  • Блок питания: Tagan BZ 1300W (1300 Вт);
  • Операционная система: Windows Vista Ultimate x86 SP2;
  • Драйвер чипсетов: Intel Chipset Software Installation Utility 9.1.1.1012;
  • Драйвер видеокарт: Catalyst 9.8.

В операционной системе брандмауэр и Windows Defender отключались, файл подкачки устанавливался в размере 4096 МБ. Настройки видеодрайвера не изменялись.

  • Процессор: Intel Core i7-965 (3,2 ГГц, 8 МБ кэш L3);
  • Материнская плата: Intel DX58SO (Intel X58);

Разгон

Прежде, чем перейдем к результатам тестирования, скажем пару слов о разгоне. Практически он ничем не отличается от такового на платформе LGA1366 — так же необходимо снижать все множители, кроме процессорного, повышать напряжения, отключать технологию Turbo Boost и, если понадобится, Hyper-Threading. Судя по тестам в Сети можно сказать, что потенциал процессоров LGA1156 находится чуть выше, чем у первых представителей архитектуры Nehalem, но ниже уже давно выпускающихся Core 2 Quad. В нашей лаборатории процессор Intel Core i7-860 пробыл всего около суток, и за это время нам его удалось разогнать лишь до 4 ГГц, как по Bclk 200 МГц с множителем х20, так и по Bclk 190 МГц с множителем х21, при этом технологию Hyper-Threading пришлось отключить. Температура ядер с таким разгоном достигала 72 °C.

Разгон Core i7-860

В одном из будущих материалов мы вернемся к теме разгона новых процессоров, и тогда постараемся уделить этому больше внимания, чем в этот раз.


Результаты тестирования

Подсистема памяти

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Как видим, Core i7-965 обгоняет младшую модель на частоте 2,8 ГГц, но в разгоне до 3,67 ГГц преимущество уже на стороне Core i7-860. Режим Turbo Boost на производительности подсистемы памяти почти не сказывается.

Результаты тестирования Core i7-860

А вот в этом тесте изначально лучший результат у Core i7-860.

Архивирование

Результаты тестирования Core i7-860

В этом архиваторе на частоте 2,8 ГГц без Turbo Boost Core i7-860 отстает от собрата на Socket LGA 1366 на целых 14%, но при разгоне разница между различными процессорами уже мизерная (0,4%).

Рендеринг

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Снова наблюдается интересная ситуация, когда на низкой частоте Core i7-860 отстает (до 16%), но разгон все различия между процессорами сводит практически к нулю.

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Примерно такая же ситуация и в приложении POV-Ray, на частоте 3,67 ГГц снова оба процессора демонстрируют одинаковые результаты.

Математические расчеты

Результаты тестирования Core i7-860

И снова 14% разницы без Turbo Boost на частоте 2,8 ГГц, и лишь 0,4% отставания на 3,67 ГГц.

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

В Prime на низкой частоте ситуация практически не меняется, а вот в разгоне Core i7-860 даже умудряется показать немного лучший результат чем старший процессор на такой же частоте.

Игровые приложения

Для начала взглянем на результаты процессоров в тестовых пакетах 3DMark.

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Снова наблюдается почти стабильная разница в 14% между процессорами на низких частотах, которая полностью нивелируется при разгоне до 3,67 ГГц.

Результаты тестирования Core i7-860

В реальной игре результаты Core i7-860 выглядят еще даже лучше. В режиме Turbo Boost он уже сравнивается с Core i7-965 на 2,8 ГГц без Turbo Boost. А в разгоне до 3,67 ГГц на младшей модели минимальный fps оказывается даже немного выше, чем на Core i7-965.

Результаты тестирования Core i7-860

Игра Crysis демонстрирует уже чуть большее преимущество процессора Core i7 LGA1366, но в разгоне все равно лидерство, пусть и не большое, остается за младшим процессором.

Тестирование CrossFire

Мы решили дополнительно сравнить производительность двух видеокарт в режиме CrossFire на разных платформах Intel, чтобы выявить возможные различия между ними. Напомним, что на плате Gigabyte GA-P55-UD6 две видеокарты работают в режиме «х8+х8», а на Intel DX58SO в режиме «х16+х16», так что теоретически на мощных видеокартах мы должны увидеть преимущество платформы Socket LGA 1366.

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

В синтетических тестах наибольшая разница в результатах у процессоров на частоте 2,8 ГГц, что вполне ожидаемо, ведь по предыдущим данным мы видели, что именно на низкой частоте архитектурные различия в процессорах обуславливают наибольшую разницу в производительности. А вот при 3,67 ГГц, что с одной картой Radeon HD 4890, что с двумя в режиме CrossFire, разница оказывается столь мизерной, что никаких весомых преимуществ платы Intel DX58SO с ее формулой «х16+х16» мы просто не видим. В 3DMark 2006 две карты на этой модели демонстрируют лучший результат, но одиночная оказывается быстрее на Gigabyte GA-P55-UD6. В 3DMark Vantage вообще за платой Gigabyte остается лидерство в обоих режимах при частоте 3,67 ГГц, но опять же, все различия настолько минимальны, что их можно списать и на погрешность измерений.

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

Результаты тестирования Core i7-860

В реальных игровых приложениях две карты на X58 почти всегда оказывается немного быстрее режима CrossFire на Gigabyte GA-P55-UD6 при частоте процессоров 3,67 ГГц, при этом по минимальному fps между ними разницы нет. При использовании одиночной карты никаких различий между платами тоже не заметно, что вполне естественно, ведь они обе уже работают в режиме х16. Стоит отметить, что в одной игре (H.A.W.X.) преимущество в режиме CrossFire осталось все же за Gigabyte GA-P55-UD6.

Выводы

С выходом процессоров под Socket LGA1156 практически каждый желающий сможет позволить себе систему на базе платформы Nehalem, чем не могли похвастаться первые представители нового поколения микроархитектуры Intel. Несмотря на некоторые упрощения конструкции (отсутствие третьего канала в контроллере памяти, отказ от шины QPI для связи с чипсетом), которые положительно скажутся на цене готовых изделий, новые CPU не особо уступают по производительности моделями серии Core i7-900 и вскоре смогут вытеснить решения LGA775 в сектор начального уровня. Пожалуй, у процессоров под LGA1366 появился серьезный конкурент — скорее всего, полноценный Nehalem займет теперь узкую нишу игровых hi-end-систем или рабочих станций, где требуется высокая пропускная способность памяти и шины PCI Express при использовании режимов CrossFireX и SLI. Для массовых ПК выбор процессоров серий Core i7-800 и Core i5-700 на базе ядра Lynnfield будет однозначен, естественно, когда они немного потеряют в цене, как и платы на базе чипсета P55 Express.

Что касается разгона новинок, то потенциал их находится на уровне Core i7-9xx, а сам процесс поднятия частоты процессора не сильно отличается от такового при разгоне старших моделей. Использование двухканального контроллера памяти с фиксированным множителем позволяет без проблем устанавливать память частотой 2000-2200 МГц, чего на платформе LGA1366 проблематично было сделать.

Минусов связка Lynnfield+P55 также не лишена. Это и другое крепление для кулера — теперь придется сменить СО или искать новое крепление, и узкая шина PCI Express при использовании режима CrossFireX или SLI — с выходом видеокарт нового поколения падение производительности, возможно, будет достигать процентов 10-15. Но в целом, платформа LGA1156 удалась, и новые процессоры имеют все шансы стать хитом продаж, тем более, что альтернативы вскоре не будет никакой.

Intel откладывает выход Lynnfield, а с ним и чипсет P55

По данным источника, компания Intel хочет отложить выход массовых процессоров следующего поколения — Lynnfield, а вместе с ними и отсрочить выход чипсета под кодовым именем Р55.

Вкратце напомним, что Lynnfield — упрощенное решение с микроархитектурой Nehalem для массового рынка, которое будет продаваться под брендом Core i5. В отличие от CPU топ-уровня (Bloomfield) в сокете для него не 1366 выводов, а только 1156, контроллер памяти — только двухканальный (для DDR3). С чипсетом (P55 и другие возможные модели) процессор Lynnfield будет связываться по интерфейсу DMI (Direct Media Interface).

Отсрочка для выпуска этих решений — конец августа — начало сентября этого года или даже чуть далее по календарю, в зависимости от ситуации на рынке. Такая информация получена источником от производителей системных плат на Тайване.

Изначально же, в планах по выпуску связки Lynnfield + P55 у Intel числился июль, но у производителей плат в связи с кризисом скопились большие складские запасы чипов системной логики и ставить на поток еще и решения на базе Р55 в их планы пока не входит.

С выпуском же чипсета Р55 компания Intel намерена избавиться от решений P45 и P43, которые не оборудованы встроенным видео. Таким образом четвертое поколение чипсетов перейдет в «низшую лигу» и будет ориентировано уже на системы начального уровня.

Секретное оружие Lynnfield – Turbo режим

Известно, что в сегодняшних Core i7 все частоты формируются относительно базового генератора в 133 МГц. Core i7 920, обладая тактовой частотой ядер в 2.66 ГГц, имеет соответствующий множитель 20x, i7 965 же, например, ─ 3.20 ГГц и 24x. При этом если у процессора при работе есть резерв по TDP, i7 увеличивает множитель на единичку, тем самым поднимая частоту ядер на 133 МГц. Если же приложение к тому же и однопоточное, множитель может быть увеличен на два пункта, то есть прибавка составит уже 266 МГц.

Хотя Turbo режим в Bloomfield работает хорошо, давая среднюю прибавку производительности в 3-4%, функциональность встроенного бустера довольна ограниченна. Тесты показали, что Core i7 без каких-либо ухищрений вроде повышения напряжения или установки особенно мощного охлаждения в состоянии работать на частотах вплоть до 3.8 ГГц на всех ядрах при полной нагрузке, включая разнообразные стресс-тестирования. Хотя, принимая во внимание то, что Nehalem являлся новой для Intel архитектурой, понять осторожность с режимом Turbo для Bloomfield можно.

С развитием и обкаткой Nehalem, улучшались и характеристики процессоров в состоянии активированного бустера. Как это ни странно, второе поколение Turbo режима было представлено на серверных high-end процессорах Xeon. Тогда как Xeon, рассчитанные на работу в однопроцессорных конфигурациях, вели себя точно так же, как и десктопные CPU, Xeon для многосокетных систем повышали частоты более агрессивно.

Так, Xeon E5520, E5530 и E5540 могут повышать множитель на один пункт при активных 3 или 4 ядрах, или же на два при активных 1 или 2. Серия X5000 разгоняется повышением множителя на 2 пункта при активных 3 или 4 ядрах, и на 3 ─ при 1 или 2, а это, между прочим, дополнительные 400 МГц. Конечно, с ручным оверклокингом получаемые частоты все равно сравнивать бессмысленно, однако прибавку в 400 МГц не заметить трудно.

В Lynnfield же присутствует уже третья по счету, еще более мощная реализация Turbo режима.

Попавшие к нам слайды с презентаций Intel говорят о том, что принадлежащие к семейству Core i7 Lynnfield будут способны повышать множитель на целых пять пунктов, давая результирующую прибавку в частоте до 667 МГц (для Core i5 ─ 4 пункта и 533 МГц). Эти цифры достоверны, однако они приведены для одного активного ядра. Как будет вести себя Lynnfield при большей нагрузке, нам пока остается только догадываться, однако уже сейчас можно с достаточно высокой степенью вероятности сделать некоторые предположения на основании статистики по другим CPU:

Процессор Стандартная частота ядер 4 ядра активно 3 ядра активно 2 ядра активно 1 ядро активно
Intel Xeon X5570 2.93 ГГц 3.20 ГГц 3.20 ГГц 3.33 ГГц 3.33 ГГц
Intel Core i7 940 2.93 ГГц 3.06 ГГц 3.06 ГГц 3.06 ГГц 3.20 ГГц
Intel Lynnfield (предполагаемо) 2.93 ГГц 3.20 ГГц 3.20 ГГц 3.60 ГГц 3.60 ГГц

С учетом того, как работает Turbo режим в Intel Xeon X5570 и схожести TDP этих процессоров, можно ожидать от 2.93 ГГц Lynnfield следованию схожей схеме подъема множителя 2/2/3/3. Хотя с другой стороны, мы точно не знаем, как поведет себя Lynnfield при паре загруженных ядер. Опять же ─ если следовать порядку для Xeon, частота при одном и двух активных ядрах будет одинаковой, в нашем случае 3.60 ГГц. Но вполне может быть, что для двух ядер мы увидим менее впечатляющие 3.33 ГГц, или 3.46 ГГц.

Какими бы в итоге ни были зафиксированы промежуточные частоты Turbo режима Lynnfield, подтвержденная информация о 3.60 ГГц при одном активном ядре и высокие базовые частоты гарантируют пользователям высочайшую производительность в любых режимах работы. Забудьте о том, что перед нами просто четырехъядерный процессор; Lynnfield ─ CPU, оптимизированный для работы с максимально возможной производительностью при энергопотреблении до 95 Вт. Это ─ будущее многоядерных процессоров. Неважно, какое количество ядер располагается на кристалле ─ в зависимости от потребностей исполняемого программного обеспечения, CPU будет подстраиваться под текущие нужды. Если программисты не озаботились оптимизацией приложения под многопоточность ─ будет активно одно ядро на максимально возможной частоте, если требуются 8 вычислительных потоков ─ они будут предоставлены, пусть и с чуть меньшей удельной эффективностью у каждого. Только представьте, как будет выглядеть четвертое или пятое поколение Turbo режима! Для Bloomfield повышение множителя на один-два пункта можно было считать пробой пера. Для Lynnfield ─ это уже существенная функция, серьезно влияющая на производительность процессора, и один из факторов оправданности вывода нового CPU на рынок. Для тех, кто еще сомневается в целесообразности Lynnfield, это вполне может стать весомым аргументом (тут уже скорее Core i7 920, не так давно являвшийся оптимальным процессором для рачительных пользователей LGA1366, начинает казаться бессмысленным). [N5-Новый сокет и материнские платы] К сожалению, на сегодняшний момент мы связаны соглашением NDA, поэтому представить полноценные фотографии и описания используемых при тестировании материнских плат не представляется возможным. Тем не менее, фотографию нового LGA1156 мы уже привели выше (черным на фотографии закрашены области специально, дабы не показывать материнскую плату). Конструктивно этот разъем ничем не отличается от LGA775 или LGA1366, ножки все так же расположены внутри LGA, процессор прижимается к разъему металлической планкой. Разве что вместо четырех болтов крепления к материнской плате на LGA1366 отныне используется три, но вряд ли это может каким-то образом повлиять на надежность фиксации.

К сожалению, для нового процессорного разъема предусмотрен очередной стандарт крепежа кулеров. Велосипед изобретать не стали, это все те же привычные четыре отверстия в текстолите платы, однако расположены они по-новому, тем самым необходимы специальные пластины крепления для охлаждающих устройств. Дело в том, что для LGA1156 отверстия разнесены уже, чем для LGA1366, но и одновременно шире, чем для LGA775. Сложно объяснить, зачем понадобилось создавать дополнительную головную боль как производителям плат, кулеров, так и самим пользователям (особенно с учетом фактического равенства площади CPU для LGA775 и LGA1156). Но факт остается фактом ─ даже если у вас уже есть хороший радиатор/водоблок для какой-либо из систем, всё равно придется озаботиться либо поиском/изготовлением нового крепления, либо заменой кулера на новый.

Thermaltake SpinQ

Thermaltake SpinQ

Thermaltake SpinQ

Lynnfield (спереди) vs. Bloomfield (сзади)

Lynnfield (спереди) vs. Bloomfield (сзади)

Lynnfield – предварительный обзор обновленной архитектуры Intel

Lynnfield – предварительный обзор обновленной архитектуры Intel

Тем не менее, текущие возможности материнских плат позволили нам поднять Bclock со 133 до 166 МГц, что выразилось в результирующей тактовой частоте 2.66 ГГц. Turbo режим от этого, правда, все равно не смог заработать лучшим образом (никакие наши старания для этого не помогли), так что показанная сегодня Lynnfield производительность в одно- и двухпоточных приложениях ниже той, на которую стоит рассчитывать в реальности.

Результаты, которые будут представлены на последующих страницах, отражают полученные данные с трех конфигураций ─ Lynnfield, работающего на 2.13 ГГц с включенным Hyper-Threading, 2.66 ГГц с активированным HT и 2.66 ГГц без виртуализации процессорных ядер. Именно последний вариант будет максимально близок к той производительности, которую покажет Lynnfield Core i5 в скором будущем (все так же за исключением неработающего должным образом Turbo). Прочие результаты были включены в таблицы скорее из спортивного интереса и для полноты картины, чтобы оценить, насколько еще Intel могла бы опустить частоты новинки, оставаясь при этом конкурентоспособной.

Скажем сразу ─ если вы думали, что Nehalem крайне необходим Hyper-Threading, чтобы демонстрировать по-настоящему впечатляющую производительность, вы были в корне не правы.

Пожалуй, перед тем как перейти непосредственно к тестированию, стоит сказать еще пару слов о степени готовности Lynnfield. Кажущиеся простыми на словах фразы об интеграции контроллера PCIe на кристалл, или модификации ИКП, на самом деле скрывают за собой сложнейшую инженерно-техническую работу. Сейчас неработоспособны ни в каком виде технологии multi-GPU, материнские платы откровенно “сырые” и требуют доработки, сам процессор пока не достигает при разгоне частот даже своих старших собратьев Bloomfield и требует для стабильной работы довольно высокого напряжения ─ словом, работы перед выводом новинки на рынок предстоит сделать еще очень много. Ожидать появления новых Core i5/i7 в продаже раньше сентября не стоит, так что наш обзор носит сугубо предварительный характер и будет обновлен по первой возможности с результатами серийных процессоров на отлаженных материнских платах. А сейчас перейдем к доступной на данный момент тестовой платформе для Lynnfield, ведь, согласитесь, что, несмотря ни на какие трудности, очень интересно узнать, что же предложит Intel в скором времени для среднего сегмента десктопных CPU. [N7-Тестовая конфигурация и программы]

Материнская плата Материнская плата на базе P55, Intel DX58SO, Gigabyte GA-MA790FX-UD5P
Чипсет Intel P55, Intel X58, AMD790 FX
Память Qimonda DDR3 1066 4x 1 Гб (7-7-7-20), Corsair DDR3 1333 2x 2 Гб (7-7-7-20)
Видеокарта eVGA GeForce GTX 280
Накопитель Intel X25-M SSD (80 Гб)
ОС Windows Vista Ultimate SP1 x32 (SYSMark), x64
Разрешение рабочего стола 1920×1080
Драйверы чипсета и видео Intel 9.1.1.1012, AMD 8.12, NVIDIA 180.43

[N8-Тестирование – SYSMark]

Тестирование – SYSMark

С места ─ в карьер! Так можно охарактеризовать производительность Lynnfield в первом тесте из нашей стандартной линейки, который призван показать общую производительность системы, не вдаваясь в подробности, а ранжируя испытуемых по совокупности показателей в разнообразной синтетике. Удивительно, но даже предсерийный семпл без активированного Turbo смог оказаться быстрее, чем Core i7 920! Хорошо видно, что наличие третьего дополнительного канала памяти у Bloomfield в данном конкретном случае не принесло вообще никаких дивидендов. Что касается работы процессора с Hyper-Threading и без, то SYSMark является примером не очень хорошо распараллеленного приложения. К тому же не стоит забывать, что даже четыре нити потоков исполнения команд выделить в программе можно не всегда, чего уж говорить о восьми. [N9-Тестирование – Adobe Photoshop CS3]

Тестирование – Adobe Photoshop CS3

В крайне интенсивном бенчмарке Retouch Artists, Lynnfield не смог продемонстрировать уверенной победы над i7 (хотя и отставание оказалось крайне небольшим), но при этом оказался быстрее Q9650, работающего на большей тактовой частоте. Помимо чрезвычайно высоких запросов к производительности используемого накопителя, тест способен полностью загрузить многоядерные процессоры, и тут уже видна разница между CPU с включенным HT и без него. [N10-Тестирование – DivX 8.5.3 с Xmpeg 5.0.3]

Тестирование – DivX 8.5.3 с Xmpeg 5.0.3

Менее четырех процентов отделяют равночастотные Lynnfield и Bloomfield друг от друга. Учитывая то, что у реального Core i5 частота работы ядер под нагрузкой будет выше, можно ожидать победы над Core i7 при кодировании видео с помощью DivX. Даже сейчас процессоры фактически равны (а ведь мы сравниваем серийный отлаженный CPU с ранним предварительным экземпляром!), но при этом Core i7 стоит существенно дороже. Этот факт, пожалуй, стоит принять во внимание тем, кто собирается собирать платформу LGA1366 с нуля с младшим из предлагаемых в линейке процессоров… [N11-Тестирование – кодирование видео x264 HD]

Тестирование – кодирование видео x264 HD
Тестирование – кодирование видео x264 HD

Не стоит ориентироваться на результаты первого прохода теста, реальный процесс кодирования видео начинается именно во второй части работы алгоритма сжатия x264. И, пожалуй, это еще одно приложение, получающее существенную выгоду от использования HT. Судите сами ─ 2.13 ГГц Lynnfield с активированным Hyper-Threading оказывается быстрее 2.66 ГГц варианта с отключенным HT. Налицо хорошие оптимизации под многопоточные вычисления. Результаты в тесте x264 могут служить хорошим объяснением тому, почему Intel решила выделить младший Lynnfield в группу Core i5, лишив его HT, а модели с Hyper-Threading оставить в линейке Core i7. [N12-Тестирование – Windows Media Encoder 9 x64 Advanced Profile]

Тестирование – Windows Media Encoder 9 x64 Advanced Profile

А вот для Windows Media никакой разницы количество ядер в системе не имеет. Вместе с тем Lynnfield и Bloomfield, с включенным HT или без него, показывают практически одинаковые результаты, первый даже оказывается немного впереди. [N13-Тестирование – 3dsmax 9 — SPECapc 3dsmax CPU рендеринг]

Тестирование – 3dsmax 9 - SPECapc 3dsmax CPU рендеринг

У нас уже накопилась достаточная статистика по тестам, и можно сделать некоторые выводы о производительности и расстановке тестируемых процессоров.

  1. Hyper-Threading позволяет на равной частоте превосходить i7 920 младшего Lynnfield на величину до 18% (не забывайте ─ хотя на наших графиках и присутствует 2.66 ГГц версия с активированным HT, серийные процессоры будут лишены восьми виртуальных ядер).
  2. Даже с отключенным HT младший Lynnfield стабильно опережает более высокочастотного Penryn (при том, что Core i5 стоит $196*, а Q9650 ─ $316*!). Lynnfield безоговорочно является прекрасной заменой существующим процессорам Core 2 Quad.
  3. Активировав HT для всех Lynnfield, Intel могла бы выпустить на рынок Core i5 с еще меньшей тактовой частотой, заткнув при этом за пояс все существующие Core 2 и Phenom 2. Что и говорить ─ архитектура Nehalem получилась еще более совершенной, чем и без того удачная Conroe/Penryn.

[N14-Тестирование – Cinebench R10]

Тестирование – Cinebench R10

Однопоточный вариант теста Cinebench показывает, насколько мощными получились ядра в Nehalem. Хорошо видно, что удельная производительность даже одного из четырех вычислительных блоков в новых процессорах выше, чем у Core 2. Даже без агрессивного Turbo режима 2.66 ГГц Nehalem вновь быстрее, чем 3.00 ГГц Q9650. Ориентируясь на эти результаты можно предположить, насколько производительными получатся, например, ноутбучные 32 нм двухядерные версии Westmere, которые будут доступны к концу 2009-началу 2010 года.

Тестирование – Cinebench R10

Работая же в родной для себя многопоточной среде, Nehalem раскрывается в полную силу. Самый слабый Lynnfield без HT опережает при существенно более низкой частоте Phenom II X4 955 всего на 3.4%. Если бы в арсенале серийного процессора существовал Hyper-Threading, превосходство увеличилось бы до 16%, и в таком случае Core i5 был бы медленнее Bloomfield всего на 5%. Кстати, из тестов хорошо видно, что даже в самых ресурсоемких приложениях польза от дополнительного третьего канала памяти в Core i7 довольно мала. [N15-Тестирование – POV-Ray 3.73 beta 23 Ray Tracing]

Тестирование – POV-Ray 3.73 beta 23 Ray Tracing

POV-Ray только подтверждает описанную выше картину. [N16-Тестирование – Microsoft Excel 2007]

Тестирование – Microsoft Excel 2007

Microsoft Excel может служить мощнейшим математическим инструментом, и бенчмарк Monte Carlo это с успехом доказывает. Впервые за весь наш марафон 2.66 ГГц Lynnfield без HT не смог опередить самого быстрого из четырехядерных Penryn. Тем не менее, превосходство в скорости над Core 2 Quad со схожей ценой очевидно. [N17-Тестирование – Sorenson Squeeze: создание FLV]

Тестирование – Sorenson Squeeze: создание FLV

И снова результаты 2.13 ГГц Lynnfield с HT подтверждают, что не зря Intel вернула технологию времен Pentium 4 в новые процессоры (пусть и в существенно доработанном варианте). С выключенной виртуализацией ядер 2.66 ГГц вариация Core i5 оказывается на уровне 3.20 ГГц Phenom II, с включенной же ─ почти догоняет более дорогой i7 920. [N18-Тестирование – создание архива в WinRAR]

Тестирование – создание архива в WinRAR

Никаких откровений WinRAR не преподносит, все ожидаемо и предсказуемо. [N19-Игровая производительность – Fallout 3]

Игровая производительность – Fallout 3

Предостерегаем вас от неверных выводах по игровой производительности Lynnfield на основании этой игры от Bethesda. Движок Fallout 3 создавался без оглядки на многоядерные процессоры, поэтому результаты перед нами соответствующие (фактически, решающим фактором здесь явилась частота CPU, зависимость от архитектуры вообще минимальна). Как раз для таких приложений Intel и продумали более агрессивный Turbo режим. Вряд ли серийный семпл Lynnfield оказался бы на позиции ниже топ-3 нашего виртуального пьедестала почета. [N20-Игровая производительность – Far Cry 2]

Игровая производительность – Far Cry 2

А вот в более современном Far Cry 2 наблюдается уже вполне реалистичная и соответствующая действительности расстановка сил. [N21-Игровая производительность – Crysis Warhead]

Игровая производительность – Crysis Warhead

Очевидно, что в Crysis ограничивающим производительность узким горлышком стала скорость работы видеокарты. [N22-Энергопотребление] Для того чтобы обеспечить стабильность функционирования рассматриваемого экземпляра процессора на частоте 2.66 ГГц, нам потребовалось несколько повысить напряжение. Это поставило бы процессор в изначально менее выгодные условия по сравнению с соперниками, поэтому было решено измерить энергопотребление семпла 2.13 ГГц с включенным HT без разгона.

Процессор Режим покоя Под нагрузкой
Intel Lynnfield 2.13 ГГц 94.0 Вт 160-173 Вт
Intel Core 2 Quad Q8400 2.66 ГГц 126.3 Вт 170.9 Вт

Пожалуй, особенно впечатляющими выглядят результаты процессора в режиме покоя. Показанное энергопотребление очень низко, в нашей тестовой лаборатории еще не было четырехядерных процессоров со столь скромным энергетическим аппетитом. Похоже, что в случае с активным использованием 1-2 ядер, Lynnfield будет радовать очень низкой потребляемой мощностью благодаря работе технологии Power Gates от Intel. [N23-Финальные слова и выводы] Оказывается, не так просто четко разобраться в позиционировании Lynnfield в линейке CPU Intel, как могло показаться в начале.

Средний $284* процессор с 2.80 ГГц будет очень и очень мощным. Похоже, что даже в приложениях, не оптимизированных под многопоточность, этот Lynnfield за счет Turbo режима будет быстрее любого из высокочастотных Core 2 Duo. В тоже время в интенсивно использующих несколько вычислительных потоков программах за счет более высокой частоты этот CPU окажется впереди и Core i7 920.

Дешевый $196* Lynnfield, тактованный на 2.66 ГГц, от идеала отделяет только заблокированная на аппаратном уровне поддержка Hyper-Threading. В большинстве случаев производительность этого чипа сравнима с i7 920, однако в хорошо распараллеленных программах более дорогие LGA1156/1366 процессоры показывают за счет поддержки HT лучшую производительность. Нет, мы отнюдь не хотим сказать, что лишение данного CPU HT равноценно концу света, но с этой прогрессивной технологией демонстрируемые результаты могли бы быть только лучше.

Что у Intel однозначно удалось с самым бюджетным Lynnfield, так это представить сравнительно дешевый четырехядерный CPU с архитектурой Nehalem, быстрый настолько, чтобы, не сильно напрягаясь, конкурировать с самыми производительными Phenom II, и при этом обеспечить лучшее соотношение цена/качество, нежели существующие сейчас Core 2 Quad. Но четкая граница между ним и более дорогими Lynnfield, которые будут продаваться под брендом Core i7, все же сохраняется. Не зря для нового процессорного ядра был введен специальный бренд ─ Core i5.

Благодаря отличной масштабируемости Nehalem, стратегия Intel может быть очень гибкой, пространство для маневров впечатляет. Компания в состоянии легким движением руки вывести на рынок более дешевые низкочастотные Lynnfield с активированным HT, которые будут чрезвычайно конкурентоспособны в своих ценовых нишах. Нельзя забывать и о Turbo режиме, благодаря которому новые процессоры будут хороши не только в многопоточной среде, но и в обычных, неоптимизированных для многоядерных CPU приложениях.

  1. Поддержка Gulftown. Полноценный шестиядерный (двенадцатипоточный) процессор будет доступен только для LGA1366, в первой половине 2010 года. Для массового LGA1156 такого CPU не запланировано.
  2. Более разгоняемые CPU. Самые лучшие результаты разгона процессоров будут получены именно на этой платформе. Ожидать прироста частоты от процессоров Lynnfield более чем в 1 ГГц не имеет смысла.
  3. Больше пропускной способности для слотов PCIe. Сегодня запросы видеокарт существенно ниже предоставляемых X58 возможностей, однако в скором времени с приходом GPGPU, DirectX 11 и OpenCL все может измениться. Но, несмотря ни на что, это пока еще дело завтрашнего дня.
  • 2
  • 3
  • 4
  • 5
  • 6
  • следующая >>

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *