Тик-так...Intel Nehalem

PCMagazine, Брой 10
Категория: Хардуер , Процесори
Етикети: Intel , процесори , Nehalem
Добрил Доков
15.10.2008

Тик-так...Intel Nehalem

Когато Intel анонсираха, че преминават към нова политика на производство и разработване на своите процесори, доста хора не смятаха, че фирмата ще успее да се справи с нея. Периодите между „тиктаканията“ на Intel бяха доста кратки, а разработката на нова процесорна архитектура отнема доста време, особено като се включи и периодът до започването на практическото й производство. Както се видя с излизането на Penryn, Intel успяха да направят „тик“, а сега сме все по-близо до дългоочакваното „так“ – съвсем скоро ще станем свидетели на следващото поколение на Intel – ядрото Nehalem.

За разлика от Penryn Nehalem представлява изцяло нова архитектура, която може да се похвали със сериозни промени в сравнение с вече поостарялата концепция, използвана при процесорите Core 2 Duо. Дали процесорите с ядро Nehalem ще са по-бързи или по-бавни от тези с Penryn е все още твърде рано да се каже, но пък за сметка на това имаме достатъчно информация, за да разгледаме в подробности архитектурата на първите.

На теория, разглеждайки новата архитектура, бихме могли да си направим съответните изводи за производителността на новото ядро, но както много често се случва в живота, теорията и практиката се разминават доста сериозно. Единственото, което ни остава, е да чакаме датата на официалния анонс и да видим резултатите от реалните тестове на Nehalem, а дотогава нека все пак разгледаме и архитектурата му.

 

Ядрото
Преди да пристъпим към разглеждане на отделните модули в Nehalem, трябва да уточним една подробност. Според новото разпределение на Intel силициевият кристал на процесора включва два типа модули – самите ядра и нещо, наречено un-core. Колкото и странно да звучи, четирите ядра на Nehalem според Intel вече се водят фактически ядра на процесора, докато всички останали модули (сред които са QPI, контролерът на паметта и т.н.) влизат в графата un-core. Идеята зад това разграничение може би цели улесняване на производството на Nehalem, но засега е все още твърде рано да се каже.

Както може да се види на общата снимка на кристала, Nehalem ще включва общо четири ядра. Извън тях ще се намират I/O модулите, шините за връзка между ядрата, контролерът на паметта и общият за всички ядра L3 кеш. Конкретно що се отнася до QPI интерфейса, той е първата от големите разлики на новата архитектура на Intel в сравнение с досегашните модели. Използваният до момент шаблон включваше използване на морално остарялата FSB шина, чиято структура ограничаваше значително възможностите на процесора. Според плановете на Intel процесорите Nehalem от сървърен клас ще притежават по два QPI модула, докато десктоп вариантите им ще имат само по един.

В допълнение към QPI (Quick Path Interconnects) Nehalem притежава нещо, което до момента беше присъщо единствено на процесорите на AMD – вграден в кристала контролер на паметта. Едва ли има нужда да се изяснява, че подобна стъпка на теория ще доведе до значително скъсяване на лага при достъп до паметта от страна на кое да е от ядрата. На практика обаче процесорите с ядро Penryn и предходните на тях реално нямаха нужда от вграждането на контролера на паметта в кристала, тъй като използваният при тях кеш от първо и второ ниво беше достатъчно бърз, за да маскира закъсненията при достъпа. Причината Intel да направи тази стъпка с Nehalem се крие в използването на кеш от трето ниво – нещо, което последно беше използвано от AMD в процесорите К6 преди много време (и разбира се, отново в процесорите Phenom).

 

Споменатият кеш от трето ниво значително допринася за закъсненията на отделните ядра до паметта, ето защо Intel най-сетне предприема стъпката по вграждането на контролера за достъпа в ядрото. Добавеният кеш от трето ниво има обем от 8МВ, който може и да се окаже недостатъчен за някои от по-сериозните приложения. Кешът от второ ниво вече се намира максимално близо до ядрото на всеки от процесорите в кристала, като за сметка на изключително високата си скорост (едва 10 такта време за достъп) е с доста малък обем – 256 килобайта.

Според визията на Intel в Nehalem L2 кешът служи не толкова като кеш на процесора, колкото като своеобразен буфер, облекчаващ натоварването над кеша от трето ниво. Като подпомагане на тази схема се явява фактът, че при Nehalem Intel отново използва схема на кеша от тип inclusive, което според компанията спестява време за достъп и доставяне на информацията.

Quickpath Interconnect и вграденият контролер на паметта
Нека започнем с вградения контролер за паметта. За разлика от използвания при процесорите на AMD шаблон високият клас чипове на Intel ще използват нещо, което до момента не съществуваше като понятие – триканална памет. Освен високия клас при десктоп моделите триканална DDR3 памет ще се използва и при сървърните модели, което означава, че производителите на памет тепърва ще започнат предлагането на подобни комплекти. Що се отнася до обикновените потребители от среден и нисък клас, предполагам, те ще са щастливи да разберат, че моделите в този сегмент ще разполагат с класическо двуканално разположение на паметите, които ще са тип DDR3.

Като стана въпрос за типа памет, употребата на DDR3 в Nehalem има като краен резултат изключително сериозно повишение на пропускателната способност на шината за комуникация между паметта и ядрата. За разлика от моделите с ядро Conroe и Penryn, Nehalem ще може да се възползва от наистина бърза памет, която няма да ограничава „гладните“ за данни ядра. Резултатът от по-сериозната пропускателна възможност на шината е, че за разлика от Conroe Nehalem може да си позволи употребата на по-агресивни prefetch модули, които да доставят данните от паметта, без при това да се задръсти шината.

Наред с вградения контролер на паметта Quickpath Interconnect е другата сериозна стъпка от прехода на Intel към новата архитектура. Подобно на шината HyperTransport при AMD QPI представлява двупосочен сериен интерфейс за връзка с огромна пропускателна способност. Всеки QPI интерфейс се състои от две двойки от по 20 линии, като всеки от комплектите от 20 линии притежава еднопосочна пропускателна способност от около 12.8 GB/s. Сумарно това ни дава ниво на трансфер от 25.6 GB/s за една QPI линия. При процесорите Nehalem от среден и нисък (доколкото все пак ще го има) клас QPI ще е представена от една шина, докато при високия клас и сървърните процесори ще имаме налице две.

Вездесъщата консумация на енергия
След като Intel си размени мястото с AMD по отношение на консумацията на енергия от процесорите, явно фирмата е решила да вземе доста на сериозно по-нататъшното оптимизиране на процеса. Наред с Atom Nehalem е първият десктоп процесор на Intel, който е изработен със следването на едно много просто правило – за всеки 1% увеличение на консумацията на енергия Nehalem трябва да осигури твърдо 2% повишение на производителността си.

За да оптимизира консумацията на енергия при Nehalem, Intel отделя над един милион транзистори (почти колкото за един процесор клас 80486) специално за създаването на модул, наречен Power Control Unit. В допълнение към този модул Intel проектира Nehalem по такъв начин, че да стане възможно индивидуалното изключване на различните ядра, когато те не се използват. Макар в момента процесорите Phenom на AMD да могат да изключват някои от ядрата си, реално погледнато, нито един от произвежданите в момента процесори не може да прави това в реално време, докато работи.

При Nehalem всяко от ядрата разполага със собствен PLL, което позволява на PCU да контролира не само дали и кога някое от тях да е изключено, но и на какво напрежение да работи. Благодарение на тази промяна възможността за активна регулация на напрежението на процесора по време на работа става много по-бързо. В допълнение към това значително се опростява захранващата схема на процесора, намираща се на дънната платка, което на свой ред снижава цената й.

Подобно на Penryn в Nehalem ще се използва разработената от Intel технология, позволяваща влизането на процесора в режим Turbo. За тези от вас, които не знаят, този режим най-общо позволява на процесора да изключи едно или повече от ядрата си при наличие на еднонишково натоварване, тъй като то може да се изпълнява само от едно ядро. Изключването на ядрата пък позволява на процесора да снижи своето TDP, което на свой ред дава възможност за лек овърклок на работещото ядро, чрез което се цели повишаване на еднонишковата производителност.

За съжаление при Penryn използването на този режим беше рядко срещано, основно поради принципа на разпределение на задачите между ядрата при ОС от типа на Vista или ХР. Тъй като Vista и ХР се стремят да разпределят задачите относително поравно между ядрата, често пъти се получава така, че процесорът не може да влезе в режим Turbo. Дори и когато този проблем се реши, често пъти ОС (особено Vista) активира нови и нови нишки дори когато процесорът не е натоварен. Според Intel тези проблеми вече са преодолени в Nehalem, благодарение на което ще е възможно адекватното използване на режима Turbo.

 

Наличност?
Както вероятно вече сте забелязали, Nehalem ще се изработва по 45 nm технология, подобно на предходния Penryn. Това си има както своите плюсове, така и своите минуси. В случая плюс се явява фактът, че Intel успя да усъвършенства своя 45 nm производствен процес, което повишава добива от една силициева пластина и като цяло понижава процента на бракуваните кристали.

Лошото в случая се явява разликата между Penryn и Nehalem – поради L3 кеша и 4-те си ядра вторият има значително по-големи размери на кристала, което на свой ред усложнява производствения процес. Като комбинираме сложния процес с по-големите размери на чипа, съвсем логично стигаме до извода, че първите произведени серии на Nehalem ще имат сравнително висок процент брак, което на свой ред ще доведе до сериозна цена.

За момента Intel възнамерява да стартира три модела Nehalem под марката Intel Core i7 с работни честоти съответно 2.66 GHz, 2.93 GHz и 3.2 GHz, всеки от които с по 8МВ кеш от трето ниво. Какви ще са техните цени, както и каква ще е производителността им, предстои да разберем съвсем скоро.

Conroe умря, да живее Conroe!
За разлика от прехода Pentium 4 – Conroe, където разликите в архитектурите на двата процесора бяха огромни, разликите между Conroe и Nehalem могат да се нарекат по-скоро допълнително „тунинговане”. За момента Intel явно счита, че суперскаларността на Conroe е достатъчна, тъй като реалната възможност на процесора е изпълняване на до 4 инструкции на такт за ядро. Тази възможност остава непроменена в Nehalem, като се запазва и разработената в предишното поколение технология за macro-op и micro-op fusion, което позволяваше в някои случаи процесорът да изпълнява две инструкции за време, което нормално отнема изпълнението само на една.

Към т.нар. тунинговане на Nehalem можем да причислим добавянето на още х86 инструкции, които могат да бъдат подлагани на операцията сливане и общо изпълнение, което вероятно до известна степен ще повиши производителността на новата архитектура. Освен няколкото нови операнда Nehalem за пръв път включва възможността за осъществяването на macro- и micro-op fusion върху 64-битови инструкции – нещо, което до момента не беше възможно с Conroe. Очевидно е, че подобна възможност ще донесе известно повишение на производителността в 64-битов режим, което ще е от значение при сървърния пазар.

Една от другите добавки, която ще е особено полезна за сървърния пазар, е допълнителният модул за предсказване на преходите. До момента Penryn разполагаше с един модул, който при Nehalem ще бъде подсилен с втори. За разлика от първия обаче той ще притежава значително по-дълбок ресурс за запис и оценяване на преходите, което ще му позволява по-правилна преценка. Естествено поради по-големия обем информация, който ще трябва да се обработва от втория модул за предсказване, той ще работи по-бавно, но все пак, в случай че първият допусне грешка, вторият ще се намеси, преди отражението от тази грешка върху общата производителност да е станало прекалено голямо.

Завръщането на технологията Hyper-Threading
Технологията Hyper-Threading беше една от запазените марки на Intel за процесорите от поколението на Pentium 4. Макар и да се радваше на сравнително голям успех, преходът към по-малък производствен процес и излизането на високопроизводителния Conroe с малък кристал до голяма степен обезсмислиха използването на НТ. С прехода към Nehalem, изглежда, Intel решава да възроди тази технология, тъй като за пръв път тя ще е налична в продуктите, използващи новото поколение архитектура, базирана на Conroe. Реално погледнато, това означава, че потребителите, притежаващи Nehalem с 4 ядра, след активирането на НТ ще получат процесор с общо 8 ядра!

 

За разлика от употребата на Hyper- Threading в процесорите Pentium 4 включването им в Nehalem ще има значително по-сериозен ефект върху производителността му поради две причини. Първата от тях е значително по-голямата широчина на Nehalem – за разлика от Pentium 4 в общия случай Nehalem може да изпълнява едновременно до 4 инструкции за такт. Тъй като този случай все пак се появява относително рядко, на практика винаги разполагаме с неупотребена част от процесора. В допълнение към това Nehalem разполага със значително по-широка шина за комуникация с кеша, а вграждането на контролера на паметта редуцира времето за достъп до системната памет.

Според данните, публикувани от Intel, активирането на Hyper-Threading в Nehalem води до сериозно повишение на производителността, което не е за пренебрегване. Като допълнителен бонус потребителите (отново плюс от сървърна гледна точка) получават тази по-голяма производителност без сериозно повишаване на енергоконсумацията.

Съдържание: