Два года назад мы стали свидетелями выхода на рынок новых процессоров Intel Core 2 Duo, основанных на архитектуре Conroe. И вот, нынешней осенью, свет увидели новые процессоры Core i7, основанные на архитектуре Nehalem. В чем же преимущества этих новых процессоров, чем нас удивит новая архитектура?
Для начала можно сказать, какие недостатки были предыдущей архитектуры, Conroe. Во-первых, эта архитектура разрабатывалась в спешке, в связи с тем, что поколение процессоров Pentium D уже не могло конкурировать с более успешными продуктами конкурентов, доля рынка Intel стала уменьшаться, так как процессоры AMD были на тот момент более холодными, менее прожорливыми, и основывались на более удачной архитектуре.
Выход процессоров Core 2 Duo, конечно, расставил все на свои места – Intel восстановил свои несколько утраченные позиции, и снова воцарился на рынке, но тем не менее, недостатки у этих процессоров были, и никуда не делись. В первую очередь, это слабая модульность, что на практике означало малое различие между процессорами в разных категориях (мобильные, настольные, серверные) – везде был фактически один и тот же чип. Во-вторых, архитектура Conroe не была рассчитана на четырехядерные процессоры, что привело к необходимости использовать два чипа в одном корпусе, в случае четырехядерных Core 2 Quad и Core 2 Extreme. В-третьих, шина FSB в многопроцессорных конфигурациях являлась узким местом при операциях с памятью. И наконец, технология, позволяющая объединять две инструкции x86 в одну, работала только в 32-битном режиме, а в 64-битном (обычном для серверов) не работала.
Таким образом, при разработке архитектуры Nehalem надо было учесть все особенности трех сегментов (мобильного, настольного и серверного), доработать модульность структуры, учесть развитие многоядерности, и конечно принять во внимание все удачные разработки за эти годы. При первом взгляде, архитектура Nehalem очень напоминает архитектуру Barcelona (у процессоров AMD). Она исконно четырехъядерная, обладает кэш-памятью трех уровней, встроенным контроллером памяти, и высокоскоростными шинами точка-точка между процессорными ядрами. Однако, различия есть, и они кроются в деталях. Что же было привнесено нового в архитектуру Nehalem, и что было улучшено?
Возвращение Hyper-Threading.
О том, что это такое можно прочитать на нашем сайте http://cn.moy.su/ статья " Hyper-threading - Гиперпоточность, торговая марка компании Intel "
Та же технология, что имелась еще в Pentium 4, испытала реинкарнацию в новых процессорах. Она призвана уменьшить количество простаивающих исполняющих блоков процессора, в каждый конкретный момент времени. Осуществляется это с помощью распараллеливания процессов и приложений, каждая «нить» которых может выполняться на отдельном логическом ядре процессора. Таким образом, пользователь в диспетчере устройств будет видеть в два раза больше ядер процессора (логических), чем имеющееся у него количество физических ядер. Улучшенное исполнение инструкций. Во-первых, объединение двух инструкций в одну теперь работает и для 64-битного режима. Во-вторых, был улучшен Loop Stream Detector, суть которого сводится к отключению лишних блоков при обнаружении циклов, что приводит к увеличению быстродействия и снижению энергопотребления.
Улучшенный механизм предсказаний. Теперь блоки предсказаний двухуровневые, обеспечивающие большую точность и более высокую эффективность выявления наиболее вероятных инструкций, данных, которые потребуются исполняющим блокам в последующие моменты времени. Набор инструкций SSE 4.2. Набор SSE 4.1, применяемый в процессорах на технологии Penryn, был расширен семью дополнительными инструкциями. Главные улушения, по словам Intel, лежат в области ускорения операций с XML-файлами, распознавания голоса и построения цепочек ДНК.
Улучшение энергоэффективности. Очень важным моментом в работе процессора является его энергоэффективность, как можно меньшее потребление при как можно большем КПД. Теперь в процессоры на архитектуре Nehalem встроен специальный микроконтроллер, PCU, на который возложены функции постоянного контроля за температурой ядер, и который может полностью отключать их, когда в них нет необходимости. Кроме того, имеется специальный турбо-режим, позволяющий увеличивать частоту работы ядер процессора, когда их рассеиваемая мощность находится ниже определенного показателя (TDP).
QPI – замена FSB. Шина Front Side Bus являлась соединением между центральным процессором и северным мостом чипсета. Эта технология уже стала «бутылочным горлышком», и ее необходимо было сменить. Теперь контроллер памяти встроен в центральный процессор, что позволяет ему гораздо быстрее работать с оперативной памятью, а соединение каждого ядра процессора между собой и с северным мостом теперь осуществляется с помощью высокоэффективного соединения QPI по типу «точка-точка». Таким образом, каждое ядро может обращаться к северному мосту и другим ядрам независимо. Эффективность шины QPI по сравнению с FSB повышена более чем в 2 раза.
Встроенный контроллер памяти. Ранее мы могли наблюдать применение встроенного контроллера памяти в процессорах AMD, теперь же он есть и в процессорах Core i7. Однако, по сравнению с двухканальным контроллером памяти DDR2 у AMD, у процессоров Intel этот контроллер трехканальный, и поддерживает память DDR3-1333. Общая пропускная способность может достигать 32 ГБ/c. Кроме самого расширения пропускной способности, применение встроенного контроллера памяти снижает латентность (задержки) доступа к ней. Кэш 3го уровня. Ранее, в архитектуре Conroe, каждое ядро процессора имело свою собственную кэш-память 1го уровня, и общую для всех ядер кэш-память 2го уровня. Теперь же каждое ядро будет иметь собственную кэш-память 1го и 2го уровней, и общую для всех ядер кэш-память 3го уровня. Объем этой кэш-памяти 3го уровня – 8 МБ. Каждому ядру, в зависимости от его нужд в данный момент времени, динамически выделяется нужный объем кэш-памяти 3го уровня.
Какие можно сделать выводы, глядя на особенности новой архитектуры Nehalem? Во-первых, она гораздо более модульная и расширяемая, чем предыдущая архитектура Conroe. Это вполне может гарантировать успех новых процессоров во всех трех основных рыночных сегментах. Новведения в большинстве качественные, нежели количественные, что является показателем уровня разработки новой архитектуры (обратим особое внимание на QPI, встроенный контроллер памяти). Применение Hyper-Threading обеспечивает значительный прирост быстродействия по сравнению с равночастотными процессорами предыдущей архитектуры. Наконец, наибольший прирост от новых процессоров будет в тех ситуациях, где узким местом являлась оперативная память.
  |