Phenom II – нещо повече от оптично свиване
Представянето на Barcelona беше едно от най-очакваните събития на миналата година. За съжаление нещата не се развиха както се очакваше от AMD и в крайна сметка се получиха редица неприятни забавяния и проблеми с новите процесори, които станаха причина фирмата да загуби известен дял както в потребителския, така и в сървърния сегмент. Доколко е подобно положението в момента? Моята лична гледна точка е – доста! Макар и вече доста от потребителите да не възлагат такива надежди за успех на Shanghai, истината е, че повечето от феновете на AMD стискат палци фирмата да предложи нещо, което да я върне на челните места в надпреварата с „вечния“ й конкурент Intel.
Преди да подложим на тест възможностите на новото поколение процесори, които AMD ще предлага, нека отделим малко време и разгледаме разликите между него и предишно- то му „прераждане“ – Barcelona. Напърво място (и най-главно, разбира се), това е производственият процес. Докато при Barcelona той беше 65 nm SOI (Silicon-On-Insulator), при Shanghai компанията е направила буквално качествен скок към изцяло нова технология – 45 nm Immersion Litography, отново комбинирана със SOI.
Течностна литография – що е то?
Както можем да се досетим още от името на тази технология, този тип литографска обработка на силиция включва използването на флуид и по- специфично – чиста дестилирана (и дейонизирана) вода. Идеята зад това начинание накратко е следната – за да произвеждаме чипове с все по-малки „шарки“ (тоест транзистори), трябва да използваме съответната светлина, която е с малка дължина на вълната. Проблемът идва от това, че използваната при литографията светлина(ултравиолетова) има дължина на вълната от 300 до 121 nm. Това означава, че без използване на допълнителни методи можем да постигнем ефективни модули с размери, равни на най-мал- ката възможна дължина на вълната – около 120 nm.
За да се компенсира този дефект на процеса, фирмите разработват и внедряват различни методи, като един от най-ефективните (засега) и перспективни се очертава именно течностната литография.Тя се базира на ефекта на пречупване и промяна на дължината на светлинния лъч при прехода му между различни фази (в случая въздух-вода). Преходът на AMD към новия процес далеч не е продиктуван само от необходимостта – според представители на фирмата при по-нататъшната надпревара към по-малък производствен процес (например 32 nm) не само се препоръчва, а дори вече ще се изисква използва- нето на течностна литография.
Barcelona + Immersion Litography = Shanghai? Не точно...
Ако в този момент си мислите, че ядрото Shanghai представлява просто оптично свиване (shrink) на Barcelona, ще грешите доста сериозно. Работата е там, че AMD не само са осъществили преход към по-малък производствен процес (който между другото е изцяло нов като технология), но и са променили изцяло дизайна на процесора, добавяйки още L2 и L3 кеш към него, и са усъвършенствали някои от модулите.
Нека започнем отзад напред – усъвършенстваните модули. Всъщност тук няма кой знае какво да се каже, тъй като от самите AMD все още не са изнесли твърде много детайли около Shanghai. Основното, около което се набляга, са наличието на контролер за паметта, съвместим с DDR3, и подобрено ниво на IPC. Конкретно що се отнася до DDR3 паметта, макар поддръжката й да е вече налична на ниво контролер, реалната й употреба ще започне едва с излизането на дъната и процесорите за Socket AM3, тъй като за Socket AM2+ няма възможност за използването на такава памет.
Очевидно благодарение на новия, по-малък производствен процес ядрото Shanghai може да се възползва не само от по-ниско ниво на консумация на енергия и отделяне на топлина, но и на по-голям брой „излишни“ транзистори. Обикновено в един процесор кеш паметите представляват най-големите консуматори на транзистори. Тъй като при Barcelona четирите ядра „консумираха“ доста голям брой от транзисто-рите, в крайна сметка за общия L3 кеш останаха достатъчно за формирането на скромните 2 MB, които са напълно недостатъчни.
След прехода към 45 nm производствен процес нещата вече стоят по съвсем друг начин – редуцирането на размерите на транзисторите дава достатъчно място на AMD да разположат три пъти по-голям кеш от трето ниво – 6 МВ срещу 2-та налични в Barcelona. Доколко повечето кеш ще се отрази положително на производителността, ще открием при тестовете на процесора по-късно в статията. Както може да се види от снимката, сравнението между кристалите на Barcelona и Shanghai показва също, че реално промени по архитектурата (освен увеличения L3 кеш) или подредбата на елементите в ядрото няма.
Подобно на Barcelona новото ядро отново разполага с поддръжка на nested page tables с тази разлика, че според AMD тук превключванията между режимите на процесора стават с около 25% по-бързо. Казано по-просто, Shanghai ще може да преминава от режим на виртуализирана ОС към режим на хипервайзър (и обратно) по-бързо, отколкото това ставаше при Barcelona. Разбира се, това ускорение засега касае основно сървърните приложения на новото ядро.
Една от новите функции, които си струва да се отбележат, е т.нар. SmartFetch, която, макар и да не може да се разбере от името, всъщност касае енергийната ефективност. Както добре знаем, структурата на процесорните кешове при AMD е ексклузивна, тоест съдържанието на дадено ниво на кеша (L1, L2, L3) не се копира в другите нива. От една страна, това е добре за процесора, тъй като означава, че той може да използва цялостния обем на кеша, с който разполага, но, от друга, има негативен ефект върху консумацията на енергия.
Ако се чудите защо, отговорът е много прост. При Barcelona преходът дори само на едно от четирите процесорни ядра към режим на пълно изключване беше невъзможен, тъй като намиращата се в неговия L2 кеш информация можеше да бъде потребна на другите ядра. По тази причина се налагаше ядрата, които в момента не работят, да продължат да бъдат активни, макар и с по-ниска тактова честота, което беше чисто разхищение на енергия. При Shanghai функцията Smart Fetch представлява просто следното действие – когато ядрото преминава в sleep режим, съдържанието на неговия L2 кеш се премества в общия L3 кеш и то напълно се изключва, с което се постига по-добро енергоспестяване. Според AMD благодарение на Smart Fetch Shanghai успява да постигне с около 21% по-ниска консумация на енергия спрямо Barcelona.
И така стигаме до най-основната промяна в Shanghai спрямо Barcelona – прехода към нов, по-малък производствен процес. Както самите AMD казват, новият Immersion Litography процес позволява изработката на толкова прецизни елементи и модули при 45 nm, че фирмата повишава честотите на предлаганите модели Opteron от 2.5 нa 2.7 GHz. Съпоставено като чисти числа, Shanghai включва 758 милиона транзистора срещу едва около 463 милиона за Barcelona. Въпреки почти двойното нарастване в броя на транзисторите размерите на кристала, на който са изработени, са по-малъки – 258 кв.мм за Shanghai срещу 283 при Barcelona.
Реални тестове и резултати
И така стигнахме до най-интересното – реалните тестове и възможностите нановия процесор на AMD. Процесорът и дъното, които тествахме, ни бяха предоставени за тази цел от AMD и представляваха напълно стандартни производствени образци, без никакви специфични промени. Дънната платка беше MSI DKA790GX Platinum, използваща чипсет AMD 790GX + SB750 за южният мост, като според MSI е напълно сертифицирана за поддръжка и използване на процесорите Phenom II на AMD.
![]()
Самият процесор беше, разбира се, Phenom II Х4 940 с ядро Deneb. Фабричната му тактова честота е 3 GHz при захранващо напрежение на ядрото 1.35 V. Честотата на NB-CPU шината изглежда, е останала непроменена при процесорите Phenom II, тъй като тук тя отново беше 1.8 GHz въпреки надеждите да бъде повишена поне до 2или 2.2 GHz.
Кешовете на процесора от първо и второ ниво са както и при предишното поколение Phenom-и – 2х64 КВ 2-way set асоциативен кеш от първо ниво – един за данни и един за инструкции. Кешът от второ ниво е с обем 512 КВ и е индивидуален за всяко ядро, като тук той е 16-way set асоциативен с широчина 64 байта. Кешът от трето ниво (48-way set асоциативен с широчина 64 байта), който се явяваше слабо място на предишното поколение процесори Phenom, вече е претърпял известни промени. Освен повишения обем (вече 6 МВ) той вече е с по-ниска латентност, чрез което се цели повишаване на про- изводителността.
За охлаждането на процесора използвах охладител, предоставен ни от Vantec – моделът беше Vantec AeroFlow FX 92, който като дизайн напомня до известна степен АС Freezer 64 с тази разлика, че тук топлопроводите са по-дебели. Захранването на системата ни беше осигурено от фирма „Солитрейд“ и беше Corsair TX750W с мощност 750 W и беше напълно достатъчно за захранването на системата плюс графичната карта независимо дали при фабрични честоти или след сериозен овърклок (за това по-късно). Самата видеокарта отново ни беше предоставена от AMD за тестовете и беше Sapphire Radeon HD 4870X2 с 2x1 GB GDDR5 памет, т.е. по 1 GB за всяко от графичните ядра. Паметта на системата беше тип DDR2-800 с обем 2 GB и работеше в двуканален режим.
По време на работа при фабричните честоти процесорът е доста хладен дори и без активиране на опцията Cool’n’Quiet – температурата, около която той „гравитираше“, беше 38-42 градуса без товар, като след натоварване тя се повишавашедо около 50 градуса. Активирането на Cool’n’Quiet променя нещата драстично – температурата на всяко от ядрата спадаше до около 20 градуса, а на процесора като цяло се задържа около 25-29 градуса. Определено може да се каже, че в това отношение новият производствен процес се е отразил отлично на Phenom II.
За тестовете използвах операционна система Microsoft Windows Vista Ultimate Edition и „комплект“ от програми и игри, с които да проверим какви са възможностите на новия процесор. По отношение на програмите в групата влизат програмите Sciencemark 2, Cinebench R10, Mr. H CPU Benchmark, POV Ray SSE-2, Fritz Chess Benchmark, собственият тест на WinRAR версия 3.7b3 и тестовете за трансфер на паметта на Everest Ultimate 4.60.1500.
Тестовете с игрови заглавия включваха програмите 3DMark Vantage и 3DMark 2006 на Futuremark, както и игрите Crysis, World in Conflict, Call of Juarez, Lost Planet: Extreme Condition - Colonies Edition, FarCry 2 и Call of Duty 4: Modern Warfare. Настройките на изображението за графичната карта бяха зададени през контролния панел Catalyst Control Center, който беше версия 8.12. Самите настройки включваха форсирана 16-кратна анизотропна филтрация на текстурите, максимално качество на тяхната филтрация и на обработката на изображението.
За сравнение на възможностите на новия процесор на AMD използвах система, базирана на процесор Intel Nehalem Core i7 965 Extreme Edition, който беше комбиниран с 3 GB DDR3 памет и дънна платка на Intel с чипсет Intel X58. От една страна, не може да се спори, че при фабрични настройки двете системи ще имат доста различна производителност, но все пак е факт, че те представляват сегашните „върхови“ предложения на двете фирми – AMD и Intel.
Възможностите на новия Phenom при тестовете с програми са доста интересни. От една страна, се вижда, че преходъткъм по-високо ниво на IPC и повишената честота се отразяват много добре на новия процесор, но въпреки това той не успява да достигне производителността на модела на Intel. Разбира се, тук имаме налице няколко доста сериозни разлики, които не са за пренебрегване, най-основните от които са наличието на HyperThreading и DDR3 памет със значително по-висока пропускателна способност. Последното се вижда много добре на тестовете на паметта с Everest Ultimate, където пропускателната способност на паметта на системата с Phenom II е повече от два пъти по-ниска от тази на Core i7. Същото важи и за нейната латентност – отново се наблюдава разлика от почти два пъти – 64.2 ns за Phenom II и DDR2 срещу 37.7 ns при Core i7 и DDR3.
Тази разлика няма как да не се отрази и на програмните тестове – както се вижда от графиките, многозадачните приложения дръпват напред доста сериозно при наличието на HyperThreading. Интересното е, че при Cinebench R10 се наблюдва ситуация, при която очевидно HT не успява да бъде от толкова голямо значение и платформата с процесор Phenom II успява да се доближи до Core i7 965 EE.
Като стана дума за доближаване, не е зле да обърнем внимание и на ценовите разлики между двете платформи. В случая използвам именно думата платформи, тъй като разликите в цените не обхващат само процесорите, но и техните дънни платки и паметта, която се използва при тях. Докато при Core i7 имаме дънна платка с изцяло нов цокъл и чипсет, при AMD можем да продължим да използваме старата си дънна платка, стига тя да притежава Socket AM2+. Същото важи и за паметта – ценовите разлики между DDR2 и DDR3 са доста сериозни и не са за пренебрегване, ако решим да мигрираме към платформа, базирана на новия тип памет.
Резултатите на Phenom II в игрите са по-добри от тези на предишното поколение процесори Phenom вероятно основно поради повечето и по-бърз кеш от трето ниво. Конкретно що се отнася до Crysis, Phenom II изостава в про- изводителността си от възможностите на Core i7 965, както може да се види от съответните графики. Очевидно повишението на IPC и обема на кеша не успява да компенсира разликата в производителността между процесора на AMD и този на Intel. Доколко преходът към DDR3 памет и нов тип чипсет ще промени нещата, е твърде рано да се каже, но едва ли скокът в производителността ще надвиши 10%.
В Call of Juarez и World in Conflict e подобна, като особено при втората игра не е новост, че тя е силно процесорно зависима. Разликите между двете платформи са доста значителни и едва ли преходът към DDR3 памет ще успее да ги компенсира. Твърде вероятно е използването на по-бързата памет да не може да разкрие пълните възможности на новия процесор, ако повишеният трансфер бъде спънат от ограничената честотна лента между ядрата и техния L2 кеш, каквото е положението в момента.
При Call of Duty 4: Modern Warfare разликата в резултатите между двете платформи е изключително малка, като не се променя дори след овърклок на процесора, което твърде вероятно се дължи на факта, че системата „опира“ във възможностите на графичната карта. Подобна е ситуацията и при Lost Planet Colonies, където разликата отново е доста малка и не се променя дори след солиден овърклок на процесора.
FarCry 2 беше една от игрите, които успяха да се възползват от повишената честота на процесора, като системата дори успя да задмине постигнатото от Core i7 EE след овърклок. Разбира се, добре е да не забравяме, че Core i7 също може да се овърклоква (при това доста добре), коетона свой ред ще промени резултата.
Последната серия от тестове, които ще разгледаме, са с продуктите на Futuremark. При 3DMark 2006 систе- мите бяха относително близки една до друга, като изненадващо след овърклок резултатите на платформата с Phenom II успя да изпревари дори базираната на Intel Core i7 965 система. Очевидно причината за това се дължи на факта, че 3DMark 2006 има система за отчитане на точките, при която процесорните тестове имат по-голяма тежест, отколкото при 3DMark Vantage. При последната повишението в резултата на процесора (след овърклок) не доведе до почти никаква промяна на цялостния резултат на системата, което всъщност не е изненадващо, тъй като все пак 3DMark Vantage е по-скоро тест на видеокартата, отколкото на процесора.
Овърклок
Нарочно реших да отделя частта за овърклока на системата, тъй като предишното поколение процесори Phenom определено не се славеха с добри постижения в това отношение. За разлика от тях новите Phenom, изработени по 45 nm процес, ще могат да се похвалят с доста по-добри (макар и не впечатляващи) резултати в това отношение. Благодарение на по-прецизния производственпроцес обаче процесорът остава доста хладен дори след сериозен овърклок, като при максималната стабилна честота, която постигнах, температурата му не прехвърли 60 градуса.
Максималната стабилна честота на процесора, която постигнах, беше 3720 MHz при напрежение на процесорното ядро 1.583 V. За целта използвах честота на шината 240 MHz при множител 15.5, a честотата на NB-CPU шината беше фиксирана на 1944 MHz. Интересното е, че процесорът вероятно би могъл да постигне още по-високи честоти, тъй като успях да стартирам ОС и при 15.5 х 255 MHz, но за съжаление се наблюдваха известни нестабилности за чието отстраняване би се изисквало повишаване на захранващото напрежение. Прехвърлянето на 1.58 V границата едва ли е особено разумна постъпка, особено като се вземе предвид 45 nm производствен процес – доста вероятно е подобни свръхвисо- ки волтажи да доведат до постепенното „деградиране“ на процесора и неговото окончателно повреждане.
Очевидно и при новите процесори Phenom честотата на NB-CPU модула ще е един от основните ограничителни фактори, които ще спират по-сериозния овърклок на системата, тъй като при покачване на честотата на системнаташина тази на NB-CPU също се покачва сериозно. Вследствие на това се стига до момент, в който системата не успява да „запали“ – в този ред на мисли е добре, когато се занимавате с овърклок на Phenom II (a и не само), да фиксирате честотата на NB-CPU на 1.8 или 2 GHz.
Що се отнася до това какви ще са средните честоти, които ще се постигат при овърклок на процесорите от серията Phenom II, моето лично мнение е, че при тях честотите от порядъка 3.6-3.8 GHz няма да са рядко явление. С втората ревизия на маската по-късно тази година (2009) вероятно ще можем да се зарадваме и на още по-високи стабилни честоти, постижими с въздушно охлаждане.
Заключение
И така стигаме до финалния момент в статията. Какво може да се каже за новите Phenom II на AMD в няколко изречения? На първо място, нека си припомним, че AMD вече набляга не толкова на отделните си продукти, колкото на комбинирането им в платформи като Spider и Dragon. До момента предложенията на фирмата включваха чипсета AMD 790GX и графичните карти от серията Radeon HD 4000, които предлагаха сериозна производителност на феновете на фирмата, но все пак нещо липсваше...
Това нещо са именно новите процесори, комбиниращи в себе си ниска температура, подобрено управление на консумацията на енергия, адекватна производителност и (това предстои да се види, особено що се отнася до нашия пазар) привлекателни цени. За ентусиастите не бива да се пропуска и възможността за овърклок, която, макар да не ни гарантира 5-6 GHz, не е за пренебрегване.
Очевидно следващата година ще е от огромно значение за AMD и фирмата ще направи всичко възможно да си възвърне поне част от своите клиенти – Phenom II е само началото на тези опити. Моето мнение е, че от случващото се през следващата година потребителите (в това число и аз) можем само да спечелим. Лично аз с нетърпение ще очаквам продължението...
Тъй като Phenom II предлага на потребителите комбинация от висока производителност, многоядреност и ниска температура (да не забравяме и новият производствен процес), той определено представлява доста сериозна крачка напред за AMD. По тази причина и поради отличното съотношение цена/производителност, новият процесор Phenom II получава призът „Избор на редактора“.