Когда у какой-либо компании выходит новый продукт, естественно поднимается довольно большая шумиха вокруг этого события. По крайней мере, обычно происходит именно так, независимо от того, какие усилия предпринимает компания для раскрутки новинки. На прошлой неделе компания NVIDIA поступила слегка иначе, осуществив "тихий" запуск видеокарты под названием GTX 460 SE, и мало кто знал, что это продукт, созданный добросовестно и качественно, пока сама видеокарта не появилась внезапно на прилавках партнерских онлайн-магазинов.
И действительно - зачем нужно каждый раз устраивать маскарад, который часто стоит больше, чем разработка и производство нового технического решения? GTX 460 SE - это так называемый "виртуальный продукт", известный в определенных дистрибьюторских кругах. Это значит, что для данной видеокарты не существует эталонной версии, и все партнеры NVIDIA могут разрабатывать свои версии, руководствуясь свободным набором спецификаций. Конечно, указаны минимальные тактовые частоты, которых нужно придерживаться, но в конце концов, компании, такие как EVGA, Gigabyte, ASUS и другие, получили право разрабатывать свои версии такими, какими они их видят. О GTX 460 SE можно думать как о варианте на тему HD 5830 от NVIDIA, но с намного меньшей помпезностью представления новинки публике. Действительно, некоторые компании за все время своего существования, не выпустили ни одного продукта с дополнением "SE"
Вся соль GTX 460 SE 1 Гб заключается в незначительной таинственности вокруг ценовой политики - цены на новинку такие же как и на GTX 460 768 Мб, но ее спецификации значительно урезаны, если сравнивать. Представители NVIDIA утверждают, что новинка стоимостью 159 у.е. нацелена на рынок потребителей, которые хотят лучшее качество изображения, чем может обеспечить буфер кадров объемом 768 Мб, однако при этом не хотят тратить 200 долларов на какую-нибудь GTX 460 1Гб. В дополнение ко всему вышесказанному, можно утверждать, что цены могут колебаться как в положительную, так и в отрицательную сторону.
Учитывая, что данный релиз может оставаться самым тихим очень долгое время, присутствует определенный интерес в вопросе - какова же в действительности производительность у GTX 460 SE? На бумаге, по крайней мере, можно увидеть потенциал, присущий традициям наиболее популярных продуктов NVIDIA Fermi
Когда дело дошло до "сжатия" GF100, на котором построены GTX 480, GTX 470 и GTX 465, инженеры NVIDIA пересмотрели архитектуру и решили внести некоторые изменения в количество зон. С целью сохранения масштабности и пропорций, в расположение элементов GF100 были принесены определенные жертвы. Главная проблема GF100 - это действительный недостаток текстурных блоков. Нравится вам это л нет, но производительность в обработке текстур - это все еще узкое место современных игр, и если так и будет продолжаться, то продуктам NVIDIA будет тяжело конкурировать с серией HD 5000.
Одним из главных вопросов за кулисами разработки GF104 была необходимость уменьшения тепловыделения и энергопотребления архитектуры Fermi посредством производства более компактного ядра. Это не только облегчает и уменьшает стоимость процесса производства, но также позволяет продуктам NVIDIA занимать определенные ценовые ниши, в которых продукция ATI еще не укрепила позиции
Разница между компоновкой GF100 и GF104 начинается с потокового мультипроцессора, который вмещает ядра CUDA, текстурные чипы, полиморфный движок, схемы загрузки/сохранения, планировщики отклонений, SFU. Попробуем разобрать все по порядку.
Вместо двух блоков диспетчеризации, к каждому з которых осуществлялся доступ собственным планировщиком отклонений, в GF104 используется схема 2 к 1, в то время как количество блоков специальных функций возросло в два раза. В результате этого, производительность трансцендентных инструкций увеличилась по сравнению с GF100, даже несмотря на то, что количество параллельных потоков осталось таким же.
Главное изменение в SM (потоковом мультипроцесоре) заключается в увеличении количества ядер CUDA, и, соответственно, количества текстурных блоков. Вместо привычных 32 ядер на SM, в GF104 используется структура, которая позволяет 48 ядер вместе с 16 блоками загрузки/сохранения и 8 блоками специальных функций. Само по себе это уже удивительно, но настоящая разница кроется в количестве текстурных блоков, которые находятся в каждом потоковом мультипроцессоре. Карты GF100 имеют по 4 текстурных блока на каждый процессор, в то время, как в GF104 инженеры NVIDIA заложили по 8 текстурных блоков в каждый процессор. Это может и бут вести к значительному увеличению производительности, играть в игры на DX10 и DX9 будет намного приятнее.
Как и GF100, в GF104 используется 4 потоковых мультипроцессора и связанных с ними полиморфных движка с общим растровым движком. Разница в компоновке самих процессоров дает увеличение мощности, о котором GF100 остается только мечтать
Немного выше можно увидеть изображение полного ядра GF104 - особое внимание нужно обратить на компоновку и количество ядер, которое содержится в пределах двух GPC. В целом можно найти 384 ядра, 64 текстурных блока, 32 ROP, кэш уровня L2 объемом 512 Кб и 4 64-битных контроллера памяти. Вполне очевидно, что даже несмотря на то, что структура потокового мультипроцессора GF104 слегка большего размера, ROP, кэш и контроллеры памяти сохранились в том же виде, что и в GF100.
Очевидно, что разработчики NVIDIA извлекли урок и сделали выводы из опыта GF100 и направили полученный опыт на разработку ядра, намного более приспосабливаемого для устройств ценовой категории "до 250 у.е.". GF104 не только более компактно, чем старший брат (в GF104 содержится 1.95 миллиардов транзисторов, а в GF100 - 3 миллиарда), но оно к тому же более эффективно. Единственный факт, который может помешать GF104 в обгоне GF100 - это максимальное количество полиморфных движков, равное восьми, что важно для производительность приложений в DX11. Повлияет ли уменьшение количества полиморфных движков негативно на производительность DX11? Время покажет.
В рамках рыночного позиционирования, GTX 460 SE была представлена не как замена некоторой существующей видеокарте, а скорее, как дополнение существующей линейки NVIDIA в ценовой категории, которая является наиболее популярной. С ориентировочной ценой около 160 у.е. эта карта должна стать прямым конкурентом AMD HD 5770, которая в настоящее время стоит от 140 до 150 у.е.
Тактовые частоты - это одно из главных отличий между другими видеокартами в серии GTX 460 и этой. Ядро SE работает на тактовой частоте, которая на 25 МГц выше, чем у продуктов более высокого класса, но главное отличие в более медленной памяти. Даже несмотря на то, что пропускная способность увеличилась благодаря набору характеристик 1 Гб / 256-bit, тактовая частота памяти 3400 МГц слегка замедляет работу, что делает эту карту не слишком конкурентоспособной против других предложений на рынке.
На уровне архитектуры, GTX 460 SE отличается от своих предшественников, так как в ядре GF104 два потоковых мультипроцессора отключены. Это значит, что количество ядер CUDA снижено до 288 вместо стандартных 336 в GTX 460, и что более важно, 8 текстурных блоков также отключены. Все это вместе с уменьшенными тактовыми частотами памяти и ядра приведет к существенному разрыву в показателях производительности между SE и GTX 460 1 Гб / 768 Мб в некоторых играх
Так как в GTX 460 SE используется полный квартет 64-битных контроллеров памяти, эта карта имеет большее количество ROP, чем версия с 768 Мб памяти. Дополнительный раздел ROP также позволяет SE полностью использовать кэш L2 512 Кб. К сожалению, 8 ROP и небольшая добавка кэша не перекроют отключенные процессоры, но есть ситуации, в которых эти вещи могут помочь.
В отличие от карт GF100, GTX 460 SE также поддерживает полный битстриминг HD-аудио через HDMI. Вся обработка сигнала производится на самой карте, без необходимости вненего декодирования. Это огромный шаг вперед для тех, кто желает использовать эту карту в окружении HTPC для декодирования треков Dolby DTS-HD Master Audio и TrueHD
Разогнанная версия видеокарты от Gigabyte имеет ту же тактовую частоту памяти 3400 МГц, но тактовая частота ядра в этом адаптере поднята на уровень, который может существенно повысить производительность.
Как и в большинстве видеокарт GTX 460 собственного производства, Gigabyte использует собственный радиатор для этого продукта, в остальном карта практически не отличается от стандартов версий GTX 460 1 Гб / 768 Мб. На печатной плате присутствует несколько модифицированных компонентов.
Коннекторы на задней стороне также остаются стандартными - один мини HDMI и пара разъемов DVI.
На радиатор установлена пара вентиляторов диаметром 80 мм, которые обдувают довольно большой массив из ребер радиатора. К сожалению, это значит, что движение разогретого воздуха ограничено в направлении и большая часть останется внутри корпуса.
Задняя сторона платы не содержит ничего интересного, но можно видеть, что разработчики Gigabyte упростили модель печатной платы, оставив схему питания 4+1
Итак, перейдем непосредственно к тестированию. Для проведения полевых испытаний была собрана следующая станция:
Процессор: Intel Core i7 920(ES) 4.0 ГГц (Turbo Mode включен)
Модуль памяти: Corsair 3x2GB Dominator DDR3 1600Mhz
Материнская плата: Gigabyte EX58-UD5
Кулер: CoolIT Boreas mTEC + контроллер кулеров Scythe Fan Controller (выключался в тестировании энергопотребления)
Оптический привод: Pioneer DVD Writer
Жесткий диск: Western Digital Caviar Black 640 Гб
Блок питания: Corsair HX1000W
Монитор: Samsung 305T 30 дюймов широкоэкранный LCD
Операционная система: Windows 7 Ultimate N x64 SP1
Тестирование проходили следующие видеокарты:
NVIDIA GTX 460 SE (Gigabyte, Flashed BIOS)
Gigabyte GTX 460 SE 1GB
NVIDIA GTX 460 1GB
NVIDIA GTX 460 768MB
NVIDIA GTS 450 1GB
ATI HD 5850 1GB (Ref)
ATI HD 5830 1GB (XFX)
ATI HD 5770 (Ref)
ATI HD 6850 1GB (Ref)
Драйвера:
NVIDIA 263.09 WHQL
ATI 10.10 WHQL + 10.10d App Profiles
Приложения, в которых проводились тесты:
Aliens Versus Predator
Battlefield: Bad Company 2
DiRT 2
Just Cause 2
Lost Planet
Metro 2033
Starcraft 2
Unigine: Heaven
Все игры были пропатчены до последних версий, операционная система полностью обновлена, все результаты - это среднее арифметическое, полученное по результатам трех последовательных тестов.
Тестирование Aliens Versus Predator (DX11)
Во время тестирования в игре Aliens Versus Predator, игра проходилась полностью с целью обнаружения раздела с худшим исходом по сценарию. В конце концов. было решено включить уровень "The Refinery", который включает огромное открытое пространство и несколько визуальных особенностей, которые значительно нагружают графический процессор. Действо начинается с первого туннеля, потом через мост справа (взрывая несколько бочек с пропаном по пути), потом назад по мосту и в конце взбираемся на башню до первой стычки с Чужим. В общем, на одну такую пробежку тратилось около четырех минут. Частота кадров записана при помощи FRAPS.
Разрешение 1680 x 1050
Разрешение 1920 x 1200
Тестирование BattleField: Bad Company 2 (DX11)
Для тестирования в BF: BC2 использовался пятиминутный отрезок геймплея, начиная со второго чекпойнта (после взлета вертолета) второй миссии в одиночной игре - до стычки с танками. Частота кадров записана при помощи FRAPS.
Разрешение 1680 x 1050
Разрешение 1920 x 1200
Тестирование в DiRT 2 (DX11)
Являясь одной из наиболее новых игр на рынке, DiRT 2 поднимает планку качества изображения и точности воспроизведения эффектов. Для тестирования производительности в этой игре использовался специальный встроенный инструментарий. Однако, из-за небольших вариаций в разных гонках, вместо двух прогонов через тест было сделано три. Также стоит отметить, что демо версия игры не использовалась, потому как производительность в демке не соответствует производительности в полной версии игры. DX11 был включен в конфигурационном файле игры. В дополнение, можно видеть, что результаты не соответствуют результатам предыдущих тестов. Это благодаря тому, что недавно вышел патч,который включает оптимизацию производительности на ряду с новыми опциями графики
Разрешение 1680 x 1050
Разрешение 1920 x 1200
Тестирование Just Cause 2 (DX10)
Игра Just Cause 2 быстро стала известной как самая красивая из игр на современном рынке, и, несмотря на то, что эта игра не поддерживает DX11, она использует полный набор функций из DX10 для наиболее ярких визуальных эффектов. Для тестирования в этой игре использовалась сцена автомобильной погони из уровня Casino Assaul. Сцена включает идеально проработанные скриптовые события, некоторые сложные визуальные эффекты и длится немного меньше четырех минут. Встроенный инструмент не использовался для бенчмарка из-за его неточности, особенно когда дело доходит до действительной производительности по геймплею.
Разрешение 1680 x 1050
Разрешение 1920 x 1200
Тестирование Lost Planet (DX11)
Lost Planet - это игра, выпущенная изначально для консолей, но в порте на ПК она получила несколько впечатляющих особенностей от DX11. Для этого бенчмарка было принято решение отказаться от двух встроенных инструментов и вместо этого использовать 2-минутную игровую последовательность из второго уровня в первой главе. Причиной выбора именно этого места стало использование в нем трех необходимых элементов игрового мира: джунглей, воды и открытой местности
Разрешение 1680 x 1050
Разрешение 1920 x 1200
Тестирование в Metro 2033 (DX11)
Вокруг игры Metro 2033 в свое время поднялась шумиха - все благодаря отличной графике вместе с брутально низкой частотой кадров даже на самых лучших видеокартах, которые может предложить рынок. В этом бенчмарке использовался проход и битва в уровне The Bridge, который начинается в начале уровня и длится около 3 минут. Частота кадров измеряется FRAPS. Advanced PhysX выключен
Разрешение 1680 x 1050
Тестирование StarCraft II (DX9)
Для тестирования производительности в StarCraft II была записана типичная битвы в мультиплеере на карте Agria Valley, потом битва воспроизводилась - чтобы удостовериться в том, что каждый тест идентичен предыдущему. Использовались последние три минуты риплея, включая финальную атаку базы врага. Для некоторых тестах в контрольных панелях NVIDIA и ATI