Коли у будь-якої компанії виходить новий продукт, природно піднімається досить великий галас навколо цієї події. По крайней мере, зазвичай відбувається саме так, незалежно від того, які зусилля вживає компанія для розкрутки новинки. Минулого тижня компанія NVIDIA надійшла злегка інакше, здійснивши "тихий" запуск відеокарти під назвою GTX 460 SE, і мало хто знав, що це продукт, створений сумлінно і якісно, поки сама відеокарта не з'явилася раптово на прилавках партнерських онлайн-магазинів.
І дійсно - навіщо потрібно кожен раз влаштовувати маскарад, який часто коштує більше, ніж розробка і виробництво нового технічного рішення? GTX 460 SE - це так званий "віртуальний продукт", відомий в певних дистриб'юторських колах. Це означає, що для даної відеокарти не існує еталонної версії, і всі партнери NVIDIA можуть розробляти свої версії, керуючись вільним набором специфікацій. Звичайно, вказані мінімальні тактові частоти, яких потрібно дотримуватися, але в кінці кінців, компанії, такі як EVGA, Gigabyte, ASUS і інші, отримали право розробляти свої версії такими, якими вони їх бачать. Про GTX 460 SE можна думати як про варіант на тему HD 5830 від NVIDIA, але з набагато меншою помпезністю уявлення новинки публіці. Дійсно, деякі компанії за весь час свого існування, не випустили жодного продукту з доповненням "SE"
Вся сіль GTX 460 SE 1 Гб полягає в незначній таємничості навколо цінової політики - ціни на новинку такі ж як і на GTX 460 768 Мб, але її специфікації значно урізані, якщо порівнювати. Представники NVIDIA стверджують, що новинка вартістю 159 у.о. націлена на ринок споживачів, які хочуть кращу якість зображення, ніж може забезпечити буфер кадрів об'ємом 768 Мб, однак при цьому не хочуть витрачати 200 доларів на якусь GTX 460 1Гб. На додаток до всього вищесказаного, можна стверджувати, що ціни можуть коливатися як в позитивну, так і в негативну сторону.
З огляду на, що даний реліз може залишатися самим тихим дуже довгий час, присутній певний інтерес в питанні - яка ж насправді продуктивність у GTX 460 SE? На папері, принаймні, можна побачити потенціал, властивий традиціям найбільш популярних продуктів NVIDIA Fermi
Коли справа дійшла до "стиснення" GF100, на якому побудовані GTX 480, GTX 470 і GTX 465, інженери NVIDIA переглянули архітектуру і вирішили внести деякі зміни в кількість зон. З метою збереження масштабності і пропорцій, в розташування елементів GF100 були принесені певні жертви. Головна проблема GF100 - це дійсний недолік текстурних блоків. Подобається вам це л немає, але продуктивність в обробці текстур - це все ще вузьке місце сучасних ігор, і якщо так і буде продовжуватися, то продуктам NVIDIA буде важко конкурувати з серією HD 5000.
Одним з головних питань за лаштунками розробки GF104 була необхідність зменшення тепловиділення і енергоспоживання архітектури Fermi за допомогою виробництва більш компактного ядра. Це не тільки полегшує і зменшує вартість процесу виробництва, але також дозволяє продуктам NVIDIA обіймати певні цінові ніші, в яких продукція ATI ще не зміцнила позиції
Різниця між компонуванням GF100 і GF104 починається з потокового мультипроцессора, який вміщує ядра CUDA, текстурні чіпи, поліморфний движок, схеми завантаження / збереження, планувальники відхилень, SFU. Спробуємо розібрати все по порядку.
Замість двох блоків диспетчеризації, до кожного з яких здійснювався доступ власним планувальником відхилень, в GF104 використовується схема 2 до 1, в той час як кількість блоків спеціальних функцій зросла в два рази. В результаті цього, продуктивність трансцендентних інструкцій збільшилася в порівнянні з GF100, навіть незважаючи на те, що кількість паралельних потоків залишилося таким же.
Головна зміна в SM (потоковому Мультипроцесори) полягає в збільшенні кількості ядер CUDA, і, відповідно, кількості текстурних блоків. Замість звичних 32 ядер на SM, в GF104 використовується структура, яка дозволяє 48 ядер разом з 16 блоками завантаження / збереження і 8 блоками спеціальних функцій. Само по собі це вже дивно, але справжня різниця криється в кількості текстурних блоків, які знаходяться в кожному потоковому мультипроцесорі. Карти GF100 мають по 4 текстурних блоки на кожен процесор, в той час, як в GF104 інженери NVIDIA заклали по 8 текстурних блоків в кожен процесор. Це може і бут вести до значного збільшення продуктивності, грати в ігри на DX10 і DX9 буде набагато приємніше.
Як і GF100, в GF104 використовується 4 потокових мультипроцессора і пов'язаних з ними поліморфних движка із загальним растрових движком. Різниця в компонуванні самих процесорів дає збільшення потужності, про який GF100 залишається тільки мріяти
Трохи вище можна побачити зображення повного ядра GF104 - особливу увагу потрібно звернути на компонування і кількість ядер, яке міститься в межах двох GPC. В цілому можна знайти 384 ядра, 64 текстурних блоки, 32 ROP, кеш рівня L2 об'ємом 512 Кб і 4 64-бітових контролера пам'яті. Цілком очевидно, що навіть незважаючи на те, що структура потокового мультипроцессора GF104 злегка більшого розміру, ROP, кеш і контролери пам'яті збереглися в тому ж вигляді, що і в GF100.
Очевидно, що розробники NVIDIA витягли урок і зробили висновки з досвіду GF100 і направили отриманий досвід на розробку ядра, набагато більш пристосовується для пристроїв цінової категорії "до 250 у.о.". GF104 не тільки більш компактно, ніж старший брат (в GF104 міститься 1.95 мільярдів транзисторів, а в GF100 - 3 мільярди), але воно до того ж більш ефективно. Єдиний факт, який може перешкодити GF104 в обгоні GF100 - це максимальна кількість поліморфних движків, рівне восьми, що важливо для продуктивність додатків в DX11. Чи вплине зменшення кількості поліморфних движків негативно на продуктивність DX11? Час покаже.
В рамках ринкового позиціонування, GTX 460 SE була представлена не як заміна деякої існуючої відеокарти, а скоріше, як доповнення існуючої лінійки NVIDIA в ціновій категорії, яка є найбільш популярною. З орієнтовною ціною близько 160 у.о. ця карта має стати прямим конкурентом AMD HD 5770, яка в даний час коштує від 140 до 150 у.о.
Тактові частоти - це одне з головних відмінностей між іншими відеокартами в серії GTX 460 і цієї. Ядро SE працює на тактовій частоті, яка на 25 МГц вище, ніж у продуктів більш високого класу, але головна відмінність в більш повільної пам'яті. Навіть незважаючи на те, що пропускна здатність збільшилася завдяки набору характеристик 1 Гб / 256-bit, тактова частота пам'яті 3400 МГц злегка уповільнює роботу, що робить цю карту не надто конкурентоспроможної проти інших пропозицій на ринку.
На рівні архітектури, GTX 460 SE відрізняється від своїх попередників, так як в ядрі GF104 два потокових мультипроцессора відключені. Це означає, що кількість ядер CUDA знижено до 288 замість стандартних 336 в GTX 460, і що більш важливо, 8 текстурних блоків також відключені. Все це разом зі зменшеними тактовою частотою пам'яті і ядра призведе до істотного розриву в показниках продуктивності між SE і GTX 460 1 Гб / 768 Мб в деяких іграх
Так як в GTX 460 SE використовується повний квартет 64-бітних контролерів пам'яті, ця карта має більшу кількість ROP, ніж версія з 768 Мб пам'яті. Додатковий розділ ROP також дозволяє SE повністю використовувати кеш L2 512 Кб. На жаль, 8 ROP і невелика добавка кешу не перекриють відключені процесори, але є ситуації, в яких ці речі можуть допомогти.
На відміну від карт GF100, GTX 460 SE також підтримує повний бітстрімінг HD-аудіо через HDMI. Вся обробка сигналу проводиться на самій карті, без необхідності вненего декодування. Це величезний крок вперед для тих, хто бажає використовувати цю карту в оточенні HTPC для декодування треків Dolby DTS-HD Master Audio і TrueHD
Розігнана версія відеокарти від Gigabyte має ту ж тактову частоту пам'яті 3400 МГц, але тактова частота ядра в цьому адаптері піднята на рівень, який може істотно підвищити продуктивність.
Як і в більшості відеокарт GTX 460 власного виробництва, Gigabyte використовує власний радіатор для цього продукту, в іншому карта практично не відрізняється від стандартів версій GTX 460 1 Гб / 768 Мб. На друкованій платі присутні кілька модифікованих компонентів.
Коннектори на задній стороні також залишаються стандартними - один міні HDMI і пара роз'ємів DVI.
На радіатор встановлена пара вентиляторів діаметром 80 мм, які обдувають досить великий масив з ребер радіатора. На жаль, це означає, що рух розігрітого повітря обмежена в напрямку і велика частина залишиться всередині корпусу.
Задня сторона плати не містить нічого цікавого, але можна бачити, що розробники Gigabyte спростили модель друкованої плати, залишивши схему харчування 4 + 1
Отже, перейдемо безпосередньо до тестування. Для проведення польових випробувань була зібрана наступна станція:
Процесор: Intel Core i7 920 (ES) 4.0 ГГц (Turbo Mode включений)
Пам'ять: Corsair 3x2GB Dominator DDR3 1600Mhz
Материнська плата: Gigabyte EX58-UD5
Охолодження: CoolIT Boreas mTEC + контролер кольорів Scythe Fan Controller (вимикався в тестуванні енергоспоживання)
Оптичний привід: Pioneer DVD Writer
Жорсткий диск: Western Digital Caviar Black 640 Гб
Блок живлення: Corsair HX1000W
Монітор: Samsung 305T 30 дюймів широкоекранний LCD
Операційна система: Windows 7 Ultimate N x64 SP1
Тестування проходили такі відеокарти:
NVIDIA GTX 460 SE (Gigabyte, Flashed BIOS)
Gigabyte GTX 460 SE 1GB
NVIDIA GTX 460 1GB
NVIDIA GTX 460 768MB
NVIDIA GTS 450 1GB
ATI HD 5850 1GB (Ref)
ATI HD 5830 1GB (XFX)
ATI HD 5770 (Ref)
ATI HD 6850 1GB (Ref)
драйвера:
NVIDIA 263.09 WHQL
ATI 10.10 WHQL + 10.10d App Profiles
Додатки, в яких проводилися тести:
Aliens Versus Predator
Battlefield: Bad Company 2
DiRT 2
Just Cause 2
Lost Planet
Metro 2033
Starcraft 2
Unigine: Heaven
Всі ігри були пропатчити до останніх версій, операційна система повністю оновлена, все результати - це середнє арифметичне, отримане за результатами трьох послідовних тестів.
Тестування Aliens Versus Predator (DX11)
Під час тестування в грі Aliens Versus Predator, гра проходилася повністю з метою виявлення розділу з гіршим результатом за сценарієм. Зрештою. було вирішено включити рівень "The Refinery", який включає величезну відкритий простір і кілька візуальних особливостей, які значно навантажують графічний процесор. Дійство починається з першого тунелю, потім через міст справа (підриваючи кілька бочок з пропаном по шляху), потім назад по мосту і в кінці піднімаємося на вежу до першої сутички з Чужим. Загалом, на одну таку пробіжку витрачалося близько чотирьох хвилин. Частота кадрів записана за допомогою FRAPS.
1680 x 1050
Тестування BattleField: Bad Company 2 (DX11)
Для тестування в BF: BC2 використовувався п'ятихвилинний відрізок геймплея, починаючи з другого Чекпойнт (після зльоту вертольота) другий місії в одиночній грі - до сутички з танками. Частота кадрів записана за допомогою FRAPS.
Тестування в DiRT 2 (DX11)
Будучи однією з найбільш нових ігор на ринку, DiRT 2 піднімає планку якості зображення і точності відтворення ефектів. Для тестування продуктивності в цій грі використовувався спеціальний вбудований інструментарій. Однак, через невеликі варіацій в різних гонках, замість двох прогонів через тест було зроблено три. Також варто відзначити, що демо версія гри не використовувалася, тому як продуктивність в демке не відповідає продуктивності в повній версії гри. DX11 був включений в конфігураційному файлі гри. На додаток, можна бачити, що результати не відповідають результатам попередніх тестів. Це завдяки тому, що недавно вийшов патч, який включає оптимізацію продуктивності на ряду з новими опціями графіки
Дозвіл 1680 x 1050
Тестування в DiRT 2 (DX11)
Будучи однією з найбільш нових ігор на ринку, DiRT 2 піднімає планку якості зображення і точності відтворення ефектів. Для тестування продуктивності в цій грі використовувався спеціальний вбудований інструментарій. Однак, через невеликі варіацій в різних гонках, замість двох прогонів через тест було зроблено три. Також варто відзначити, що демо версія гри не використовувалася, тому як продуктивність в демке не відповідає продуктивності в повній версії гри. DX11 був включений в конфігураційному файлі гри. На додаток, можна бачити, що результати не відповідають результатам попередніх тестів. Це завдяки тому, що недавно вийшов патч, який включає оптимізацію продуктивності на ряду з новими опціями графіки
Тестування Just Cause 2 (DX10)
Гра Just Cause 2 швидко стала відомою як найкрасивіша з ігор на сучасному ринку, і, не дивлячись на те, що ця гра не підтримує DX11, вона використовує повний набір функцій з DX10 для найбільш яскравих візуальних ефектів. Для тестування в цій грі використовувалася сцена автомобільної погоні з рівня Casino Assaul. Сцена включає ідеально опрацьовані скріптові події, деякі складні візуальні ефекти і триває трохи менше чотирьох хвилин. Вбудований інструмент не використовувався для бенчмарка через його неточності, особливо коли справа доходить до дійсної продуктивності по геймплею.
Тестування Lost Planet (DX11)
Lost Planet - це гра, випущена спочатку для консолей, але в порте на ПК вона отримала кілька вражаючих особливостей від DX11. Для цього бенчмарка було прийнято рішення відмовитися від двох вбудованих інструментів і замість цього використовувати 2-хвилинну ігрову послідовність з другого рівня в першому розділі. Причиною вибору саме цього місця стало використання в ньому трьох необхідних елементів ігрового світу: джунглів, води і відкритій місцевості
Тестування в Metro 2033 (DX11)
Навколо гри Metro 2033 свого часу піднявся галас - все завдяки відмінній графіці разом з брутально низькою частотою кадрів навіть на найкращих відкритих, які може запропонувати ринок. У цьому бенчмарке використовувався прохід і битва в рівні The Bridge, який починається на початку рівня і триває близько 3 хвилин. Частота кадрів вимірюється FRAPS. Advanced PhysX вимкнений
Тестування StarCraft II (DX9)
Для тестування продуктивності в StarCraft II була записана типова битви в мультіплеере на мапі Agria Valley, потім битва відтворювалася - щоб упевнитися в тому, що кожен тест ідентичний попередньому. Використовувалися останні три хвилини ріплея, включаючи фінальну атаку бази ворога. Для деяких тестах в контрольних панелях NVIDIA і ATI включався MSAA
Тестування Unigine: Heaven v2.0 (DX11)
Бенчмарк Unigine Heaven - це в даний час фактично стандарт, коли справа стосується простих тестів продуктивності DX11. У той час, як багато хто вважає цей бенчмарк синтетичним, важливо пам'ятати, що в наступному році вийде принаймні 4 гри на цьому движку. У цьому тесті використовується стандартний бенчмарк в трьох дозволах
Тестування 1920 x 1200, 8x MSAA
У цій секції були взяті деякі ігри з попередніх тестів і включений ігровий MSAA 8x. В іншому методологія залишається такою ж як і раніше
BattleField: Bad Company 2 (DX11)
Зауважте, що 8x MSAA включається через ігровий конфігураційний файл для відеокарт NVIDIA, в ігровому меню опція недоступна.
Температура ядра і шумові показники
Для всіх тестів температурних показників, відеокарти були розміщені на відкритій тестової платформу з одним 120-міліметровим вентилятором. працюючим з частотою 1200 об / хв, розміщеним на відстані близько 20 см від радіатора. Температура навколишнього середовища підтримувалася на рівні 22 ° C (+/- 0.5 ° C). Якщо температура навколишнього середовища піднімалася вище 23 градусів за Цельсієм, тест припинявся. Для цього бенчмарка використовувався 3DMark Batch Size З найбільшою кількістю трикутників з включеними 4xAA і 16xAF, зациклений на годину з метою визначити пікову температуру за допомогою утиліти GPU-Z.
Разрешение 1920 x 1200
Тестування Just Cause 2 (DX10)
Гра Just Cause 2 швидко стала відомою як найкрасивіша з ігор на сучасному ринку, і, не дивлячись на те, що ця гра не підтримує DX11, вона використовує повний набір функцій з DX10 для найбільш яскравих візуальних ефектів. Для тестування в цій грі використовувалася сцена автомобільної погоні з рівня Casino Assaul. Сцена включає ідеально опрацьовані скріптові події, деякі складні візуальні ефекти і триває трохи менше чотирьох хвилин. Вбудований інструмент не використовувався для бенчмарка через його неточності, особливо коли справа доходить до дійсної продуктивності по геймплею.
Разрешение 1920 x 1200
Тестування Lost Planet (DX11)
Lost Planet - це гра, випущена спочатку для консолей, але в порте на ПК вона отримала кілька вражаючих особливостей від DX11. Для цього бенчмарка було прийнято рішення відмовитися від двох вбудованих інструментів і замість цього використовувати 2-хвилинну ігрову послідовність з другого рівня в першому розділі. Причиною вибору саме цього місця стало використання в ньому трьох необхідних елементів ігрового світу: джунглів, води і відкритій місцевості
Разрешение 1920 x 1200
Тестування в Metro 2033 (DX11)
Навколо гри Metro 2033 свого часу піднявся галас - все завдяки відмінній графіці разом з брутально низькою частотою кадрів навіть на найкращих відкритих, які може запропонувати ринок. У цьому бенчмарке використовувався прохід і битва в рівні The Bridge, який починається на початку рівня і триває близько 3 хвилин. Частота кадрів вимірюється FRAPS. Advanced PhysX вимкнений
Дозвіл 1680 x 1050
Разрешение 1920 x 1200
Тестування StarCraft II (DX9)
Для тестування продуктивності в StarCraft II була записана типова битви в мультіплеере на мапі Agria Valley, потім битва відтворювалася - щоб упевнитися в тому, що кожен тест ідентичний попередньому. Використовувалися останні три хвилини ріплея, включаючи фінальну атаку бази ворога. Для деяких тестах в контрольних панелях NVIDIA і ATI