По-добре късно, отколкото никога – Nvidia GF100 най-сетне се появи!




По-добре късно, отколкото никога – Nvidia GF100 най-сетне се появи!

PCMagazine, Брой 5
Категория: Хардуер , Графични карти
Етикети: графични карти , Nvidia GF100
PC MAGAZINE
11.5.2010

По-добре късно, отколкото никога – Nvidia GF100 най-сетне се появи!

Вероятно почти всички в един или друг момент вече сте се сблъсквали с истинската сапунена опера, заобикаляща графичните карти на Nvidia от следващо поколение. В последните шест месеца станахме свидетели на изтъкване на какви ли не аргументи от страна на Nvidia като оправдание за доста сериозното закъснение на графичния й процесор, както и забавен (не и за Nvidia) опит за представяне на отрязана като с трион платка като реален работещ прототип. Но всичко това вече е минало – компанията най-сетне представи официално своето ново творение и дори нещо повече: то вече може да се намери официално в продажба. Остава обаче дребният въпрос за неговата производителност спрямо моделите на ATI, срещу които е позиционирано – а отговорът на този въпрос няма да е никак лесен...

Определено може да се каже, че раждането на GF100 беше съпроводено от доста трудности, касаещи неговото производство не само в обеми, заслужаващи си влизане в продажба, но и изобщо постигането на достатъчен брой работоспособни чипове. Причините за това са доста комплексни и се дължат на стечението на редица обстоятелства, неблагоприятни за GF100. На първо място, това е скокът на Nvidia не само към нова архитектура, но и към изцяло нов (за нея) производствен процес като при това става въпрос за чип с наистина масивни размери. Втора неблагоприятна подробност се явяват проблемите в производството на 40 nm чипове от страна на TSMC – факт, който също не е за пренебрегване и със сигурност е предизвикал доста главоболия в Nvidia.

 

В крайна сметка като краен резултат имаме не само доста солидно закъснение на официалното представяне на GF100, но и изключително хилав старт на новата фамилия видеокарти, като според някои източници броят на всички произведени работоспособни карти е под 10 хиляди в целия свят! За щастие налице е доста силна конкуренция от страна на ATI, което не позволи на Nvidia да постави реалните производствени цени като търговска стойност на своите видеокарти, което обаче съвсем не означава, че тя все пак не се опитва да ги продаде за повече, отколкото струват – но на това ще се върнем по-късно. Преди това нека разгледаме промените в архитектурата, направени от Nvidia в GF100, и какво я различава толкова много от предходните поколения.

Организация на графичното ядро

За разлика от предходните модели графични процесори на Nvidia в GF100 подходът на компанията буквално е с размах. Освен с промените в архитектурно отношение графичният процесор може да се похвали и с два пъти повече шейдърни ядра, които от Nvidia за пореден път са решили да преименуват – тук те вече носят името CUDA ядра (CUDA Cores). Ако съпоставим пряко броя на шейдърите, без да се съобразяваме с останалите промени в архитектурата, ще открием, че при търговската версия на GF100 броят им е точно два пъти по-голям, отколкото при GT200, използван при GeForce GTX 285. При GF100 CUDA ядрата са 480 (при 512 обявени първоначално), докато при GT200 те са 240. Очевидно от Nvidia са решили да играят на едро, увеличавайки значително изчислителните възможности на чипа в допълнение към промените, довели неговия вид доста по-близо до този на специализираните процесори.

Ако започнем от най-високото ниво на организация на GF100, ще открием, че промените обхващат дори и модулите, намиращи се тук. Нареченият от Nvidia GigaThread Engine служи като своеобразен диспечер, разпределящ задачите между SM (Streaming Multiprocessors) блоковете, съдържащи CUDA ядрата. 16-те SM блока са обединени в четири макроблока, наречени Graphics Processing Clusters, или GPC. Четирите GPC или всички SM като цяло имат достъп до шест контролера напаметта, осигуряващи поддръжка на GDDR5 памет и работа с 384-битова шина за достъп (320-битова в случая на GTX 470). Всеки GPC блок разполага със собствен растеризиращ модул, обработващ данните от CUDA ядрата и PolyMorph Engine.

Слизайки една стъпка надолу в организацията, стигаме до SM блоковете. Всеки от 16-те SM блока съдържа в себе си CUDA ядрата плюс наречената от Nvidia PolyMorph Engine, четири TMU модула и има достъп до обединения кеш от второ ниво – последният е уникален за процесор от подобен тип и показва доста сериозната изчислителна насоченост на Fermi.

Вътре в самите SM модули на практика се намират основните модули на GF100. Всеки SM блок съдържа в себе си 32 CUDA ядра, състоящи се от целочисления и FP процесор, съответните за тях LOAD/STORE контролери, както и общо четири SFU (Special Function Unit) модула обслужващи сложните операции като блендинг, синус, косинус и т.н. Освен изчислителните процесори в SM блоковете се намират също така кешът от първо ниво, свързващото опроводяване и обработващата логика, в която се включват TMU модулите и PolyMorph системата.

Последната всъщност е особено интересна, тъй като на практика съдържа в себе си причината Nvidia да разработи изцяло нова архитектура, вместо просто да „лепне“ на GT200 възможността за теселация. Според изследванията на компанията добавянето на теселиращи модули към GT200 би създало тясно място за геометричните изчисления, спъвайки графичния процесор. По тази причина компанията е добавила теселиращ модул във всеки SM блок, което автоматично означава, че GF100 на практика разполага с 16 модула за теселация, което би трябвало да доведе до добра производителност при тежко използване на тази функция. Освен теселатора в PolyMorph Engine блока се намират също така и останалите модули за обработка.

Освен големия брой теселатори използването на независим модул от тях за всеки SM блок означава, че GF100 ще може да запази относително висока производителност в теселирането дори и при орязаните си версии с по-малък брой SM блокове и CUDA ядра като цяло. Засега все още не е ясно какво е нивото на гранулация на новата архитектура – т.е. какъв е минималният обем на блоковете, които могат да се „отрязват“ от чипа. Това е доста важна подробност, тъй като изясняването на този детайл ще ни даде представа за бъдещите чипове от по-нисък клас, които бихме могли да очакваме. Например, ако най-ниското ниво на редукция е SM блокът, това автоматично означава, че освен с по-малко CUDA ядра един дериват ще разполага и с поне 4 TMU блока по-малко.

Както може да се види от теорията, разработената от Nvidia архитектура за GF100 притежава доста потенциал. Тепърва обаче предстои да разберем как стоят нещата в реалния живот, тъй като подобен огромен чип не е никак лесен за производство, особено отчитайки спецификацията, на която следва да отговаря.

GeForce GTX 470/480 – Fermi в реалността

Проблемите пред GF100 включват не само закъснението от над 6 месеца, дължащо се на доста комплексни фактори, но и факта, че дори след неговото официално представяне картата всъщност изобщо не беше налична за реална покупка. „Хартиеният старт“, предприет от Nvidia, всъщност целеше просто да покаже на света, че компанията все още съществува и продължава с разработката на чипа, както и, разбира се, нещо много по-важно – да отклони поне част от вниманието на потребителите от предложенията на AMD. Така или иначе факт е, че Nvidia все още имат изключително сериозни проблеми с доставките на реални работещи бройки графични карти с GF100, което съвсем естествено води и до доста повишените цени на моделите. За да повиши добива на графичните чипове, използвани в топмодела GeForce GTX 480, компанията дори редуцира броят на CUDA ядрата с 32 до 480 вместо проектираните първоначално 512, но това пак не помогна на картата да достигне планираните работни честоти или да увеличи значително добива.

 

Реално погледнато, цените на моделите GeForce GTX 470 и GeForce GTX 480 са такива, че ги поставят като почти преки конкуренти на предложенията Radeon HD 5870 и Radeon HD 5970 на AMD/ATI. Не е много ясно какво е позиционирането на същите тези модели от страна на Nvidia, която сигурно не би останала особено доволна от резултатите от подобна съпоставка, особено като вземем предвид първоначалната ПР кампания, проведена от нея при старта на GF100. След като най-сетне можем да съпоставим моделите рамо до рамо с реалните им ценови конкуренти, нека видим какви ще са и резултатите от това сравнение.От гледна точка на хардуерните характеристики на картата, която ще тестваме (Palit GeForce GTX 470), тя разполага с 1280 МВ GDDR5 памет и графично ядро с 448 CUDA ядра. Тактовите честоти са съответно 607 MHz за ядрото, 1215 MHz за шейдърите и 3.35 GHz за паметта. Шината за комуникация с паметта има широчина 320 бита, а ROP и TMU модулите са съответно 40 и 56.

Тестове и резултати

Тестовата система се състои от дънна платка MSI P55GD80 с процесор Intel Core i7-870, работещ при честота от 3.85 GHz. Паметта на конфигурацията е 2 GB DDR3-1333 MHz и твърд диск Seagate Barracuda 7200.9. Предвид доста солидната консумация на енергия от страна на графичните карти (особено Nvidia) захранващият блок беше малко поспециален. Тъй като видеокартата Palit GeForce GTX 470 ни беше предоставена за тестовете от фирма Multirama, тя беше окомплектована и с допълнително предоставен захранващ блок Antec TruePower Quattro с мощност 850 W. Въпросният захранващ блок има доста уникални характеристики и независимо от своята огромна мощност е изключително тих дори и при сериозно натоварване. От страна на AMD конкурентната карта беше Gigabyte Radeon HD 5870 с 1 GB GDDR5 памет, предоставена ни за тестовете от фирма Argus Computers.

 

 

 

 

 

 

 

 

Използваните и при двете видеокарти драйвери бяха последните налични както при Nvidia, така и при AMD – за Nvidia това беше версия 197.41 а за ATI – Catalyst 10.3. Операционната система представляваше Microsoft Windows 7 Ultimate Edition, като тестовите програми и игри включваха 3DMark 2006, 3DMark Vantage (Performance и Extreme варианти), Unigine Heaven Demo, STALKER Call of Pripyat, Metro 2033, Resident Evil 5, Lost Planet Colonies Edition, Crysis Warhead, FarCry 2, World in Conflict, Just Cause 2 и Call of Juarez. Използваните настройки и нива на детайлност са обозначени за всяка от игрите в графиката с резултатите, като общо за всички тях бяха форсирането на 16-кратната AF филтрация и максимално ниво на качеството на изображението през контролния панел на драйверите. Последното е доста важна подробност, тъй като по подразбиране при Nvidia вместо High Quality настройката на филтрация е просто Quality, докато при ATI не е така.

Както може да се види от резултатите в 3DMark 2006 и 3DMark Vantage, GeForce GTX 470 изостава доста забележимо от Radeon HD 5870 в синтетичните тестове. В разбивката на също толкова синтетичните отделни тестове на 3DMark Vantage се виждат и областите, в които двете видеокарти реално имат преимущество. В Unigine Heaven Demo дори и при активирана теселация изненадващо GeForce GTX 470 отстъпва на RadeonHD 5870. Това е изненадващо, защото имаше доста слухове, че теселацията в този тест нарочно е направена максимално натоварваща именно за да изпъкнат възможностите на GF100.

Тестовете в STALKER Call of Pripyat показват също преимущество за Radeon HD 5870. Тук прави впечатление скалирането на двете видеокарти при прехода от DirectX 10.1 към DirectX 11 – при ATI спадът в производителността е значително по-малък, отколкото при Nvidia. Активирането на АА се отразява негативно и на двете видеокарти, но Radeon HD 5870 отново запазва по-добра производителност въпреки по-малкия обем на паметта и по-тясната си шина спрямо GeForce GTX 470.

В игрите Lost Planet Colonies и Resident Evil 5 се запазва същата тенденция за разлика между двете карти със солидно превъзходсто на Radeon-a, като тук правят впечатление резултатите в Crysis Warhead. Очевидно при повишаване на резолюцията в комплект с 8хАА филтрацията по-малкият обем на паметта на Radeon-a става недостатъчен, при което спадът в производителността става огромен. Не така стоят нещата при GeForce GTX 470 обаче, която е облагодетелствана от малко по-големия си обем на паметта.

Metro 2033 несъмнено е една от най-очакваните игри за тази година, като се взема предвид зашеметяващата графика, предложена от нея в комплект с използването на теселация и DirectX 11. За това заглавие също се носеха слухове, че ще фаворизира картите на Nvidia, и като гледаме резултатите, нищо чудно това да е истина – преходът от DirectX 10 към DirectX 11 се отразява доста негативно на Radeon HD 5870 без особено видима разлика във визуално отношение (и при двете карти). Независимо от това в DirectX 11 GF100 показва своя потенциал – макар и да не успява да осигури необходимата производителност за игра при 1920х1200 пиксела, GeForce GTX 470 повежда при 1680x1050.

FarCry 2 е едно от заглавията, което използва изключително много възможностите на ROP/TMU модулите при графичните карти и както може да се види от резултатите, се радва на техния брой при GeForce GTX 470. Тук първото място убедително е заето от GF100 независимо от резолюцията и използването на 8хАА. Тестовете с Just Cause 2 използваха ниво, при което силно се набляга на геометричните възможности на видеокартите, без при това да се използва теселация (DirectX 10). Очевидно GeForce GTX 470 е по-ограничена в тази област в сравнение с Radeon HD 5870, защото изостава доста солидно от своя конкурент в тези тестове.

Заключение

В крайна сметка, ако трябва да обобщим изводите от всички тестове, те едва ли ще се харесат на Nvidia, но така или иначе са следните: макар и доста интересна от архитектурна гледна точка, GF100 за съжаление е силно възпрепятствана да покаже своя потенциал. Вина за това имат както пресилените амбиции на Nvidia, така и неуспехът й да се сработи по ефективен начин с TSMC, за да се възползва максимално от 40 nm процеса. Според някои от непотвърдените данни допуските в работните параметри на транзисторите дори в един чип GF100 са толкова големи, че е почти невъзможно той да заработи на първоначално проектираното захранващо напрежение.

В допълнение към лошите добиви идва и липсата на опит – компанията избра да скочи директно към нов процес и изцяло нова архитектура (нова производствена маска) и това за съжаление й изигра лоша шега. Наистина за една и съща цена в сравнение с конкуренцията от страна на Radeon HD 5000 получавате поддръжката на CUDA, PhysX и 3D Vision. Ако трябва да сме честни обаче, от последното най-вероятно ще си докарате главоболие, докато приложението на CUDA и PhysX все още е доста скромно и трудно забележимо в игрите. За сметка на това гарантирано ще получите огромен и горещ чип (над 90 градуса при интензивно натоварване!), който е труден за охлаждане, но пък за сметка на това при работа охлаждането му е твърде шумно.

Естествено не всичко е загубено – Fermi притежава потенциал да се превърне в една чудесна архитектура при следващия производствен процес на TSMC. Въпросът е – колко ли ще трябва да чакаме този път? – Добрил Доков


Съдържание: