Nvidia Geforce GTX 560 Ti:


описание видеокарт и результаты синтетических тестов



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 560 Ti — Часть 1: Теоретические сведения


В этой части, как обычно, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов.

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E
  • GPU: Geforce GTX 560 Ti (GF114)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 822 (номинал — 822)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1000 (400) (номинал — 1000 (4000))
  • Ширина шины обмена с памятью (бит): 256
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 384/1644 (номинал — 384/1644)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 384
  • Число блоков текстурирования: 64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры (мм): 210×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)




Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в восьми микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.





Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 460


Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 460


Как мы видим, по концепции оба дизайна GTX 460 и 560 очень схожи. Собственно, это и ожидалось, ибо ядро по сути то же самое, только лишь обновлено и включены все блоки. Разумеется, потребовалось внести изменения в силовую часть, ибо каждое новое ядро может требовать чуть иной вольтаж, а также инженеры всегда ищут повод для внесения оптимизаций в ту или иную разводку PCB, чтобы уменьшить себестоимость, не потеряв в стабильности.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также не должно быть проблем с HDMI: ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком. У карты есть и свой собственный вывод mini-HDMI.

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц макс. — по аналоговому интерфейсу
  • 2560×1600@60 Гц макс. — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл еще раз напомнить, что карты класса 460/560 требуют дополнительного питания, причем двумя 6-контактными разъемами.

О системе охлаждения.

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E

Сразу бросается в глаза внешняя схожесть СО с той, что у GTX 460: вентилятор находится в центре, пластиковый корпус в виде привычного уже для нас «турбинного» типа — это лишь декорация.

Под кожухом — СО центрального типа с единым овальным радиатором, усиленным медными тепловыми трубками. Кулер охлаждает лишь ядро, микросхемы памяти без охлаждения. Вентилятор работает на малых оборотах, и потому в целом СО нешумная.

Отличие данной CO от аналога на GTX 460 лишь в том, что выросли размеры радиатора и длина трубок, теперь все устройство занимает внутри почти весь кожух.




Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E



Nvidia Geforce GTX 560 Ti o/c 922/1844/4400 MHz 1024 МБ 256-битной GDDR5, PCI-E



Думаем, что нет смысла объяснять, почему два графика мониторинга. Да, мы разогнали частоты работы карты с 822/1644 МГц по ядру до 922/1844 МГц. При этом карта стабильно работает, проблем нет. Да и максимальный нагрев ядра в обоих случаях явно не велик для такого рода карт.

Кстати, в наших диаграммах с результатами тестов мы приведем показатели работы карты не только на номинальных, но и именно на таких вот повышенных частотах.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.12; Nvidia версии 266.56 / 266.35.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 560 Ti со стандартными параметрами (далее GTX 560)
  • Geforce GTX 460 со стандартными параметрами, модель с 1 ГБ видеопамяти (далее GTX 460)
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570)
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)

Для сравнения результатов новой модели Geforce GTX 560 Ti мы выбрали именно эти видеокарты по следующим причинам: Radeon HD 6950 и Radeon HD 6870 являются наиболее близкими по цене решениями от конкурента, Geforce GTX 460 — видеокарта на схожем графическом процессоре предыдущего поколения, а GTX 570 — это наиболее близкое по характеристикам решение текущего поколения, основанное на более мощном чипе GF110.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте все видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений (мы их перепроверим далее, в тесте 3DMark Vantage). Результаты данной синтетики для GTX 560 Ti сильно не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 34 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что значительно ниже теоретической цифры в 64 отфильтрованных текселя.

Так получается, скорее всего, из-за ограничения производительности полосой пропускания видеопамяти, так как тот же GTX 570 оказался впереди, несмотря на то, что по теоретическим цифрам старшее решение должно проигрывать анонсированному сегодня. Впрочем, GTX 460 всё же остался позади, хотя и не слишком заметно.

А вот обе видеокарты компании AMD на голову опережают новое решение Nvidia в режимах с большим количеством накладываемых на пиксель текстур. А в случаях с небольшим количеством текстур, ограничение по ПСП сказывается ещё больше и вплоть до трех текстур все видеокарты показывают близкие результаты. В этом тесте явно не достигаются реально возможные показатели нового GPU, но посмотрим их же в тесте филлрейта:

Во втором синтетическом тесте, который показывает скорость заполнения, видно всё то же самое, но уже с учетом количества записанных в буфер кадра пикселей. И по диаграмме отлично видно, что скорость рендеринга у многих решений в простых условиях серьёзно ограничена ПСП.

Максимальный результат остаётся за решениями AMD, имеющими значительно большее количество TMU и более эффективными по достижению высокого КПД в нашем синтетическом тесте. HD 6950 показывает максимальный результат, почти вдвое превышающий цифры GTX 560 Ti. Интересно, что даже в случаях с 0—4 накладываемыми текстурами, рассматриваемое сегодня решение уступает остальным, кроме GTX 460, хотя ПСП у неё почти как у HD 6870.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU даже среднего уровня и не могут показать все возможности современных видеочипов. В этих тестах производительность ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков и кэширования текстурных данных в реальных задачах, также есть влияние и ПСП видеопамяти.

Видно, что GF114 полностью повторяет результаты GF104, только с учётом большего количества ALU и TMU и работы их на повышенных частотах в случае GTX 560 Ti. В самых простых шейдерах разница между GTX 560 Ti и GTX 460 составила 23—28%, что ниже теоретических цифр усиления мощности ALU и TMU. Похоже, что производительность GTX 560 Ti в этом тесте ограничена пропускной способностью видеопамяти и филлрейтом, так как по этим показателям разница между решениями значительно ниже.

Более интересно то, что в трёх простых тестах GTX 560 Ti смогла составить конкуренцию даже GTX 570. Впрочем, в наиболее сложных тестах решение на GF114 всё-таки отстало от топового GF110. Что касается сравнения с видеокартами AMD, то обе они обогнали GTX 560 Ti, она смогла конкурировать только с HD 6870, да и то только в самых простых тестах. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

А вот эти тесты получились гораздо более любопытными. Нас интересует разница в результатах GTX 560 Ti (да и GTX 460) и GTX 570 в этих двух тестах. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём обычно располагаются по скорости текстурирования. И вот в этом тесте GTX 560 Ti показывает теоретически обоснованный результат, обгоняя даже GTX 570. Лучшую среди видеокарт AMD достать не удалось, но вот HD 6870 показала схожий результат, что вполне соответствует теории (пиковая скорость текстурирования у этих решений близкая).

Результаты второго теста довольно сильно отличаются, в нём GTX 560 Ti уже проигрывает всем, кроме младшей сестры GTX 460. Этот тест более интенсивен вычислительно, и в нём сказывается влияние математической производительности. Поэтому тест лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU. Разница между GTX 560 Ti и GTX 460 в этих двух тестах составила 32—37%, что примерно соответствует теоретическим показателям.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D-графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», и новая GTX 560 Ti снова заметно уступает GTX 570, имеющей топовый графический процессор GF110. Оба решения компании AMD также оказались далеко впереди.

Во втором тесте «Parallax Mapping» результаты тоже чем-то похожи на предыдущие, но в этот раз оба Radeon уже не так сильно оторвались от видеокарт Nvidia. Решения на основе чипов GF114 и GF104 остаются снова позади всех, и GTX 560 Ti опережает GTX 460 в этих тестах на 24—28%, что снова говорит о недостаточном раскрытии потенциала нового GPU, вызванного не слишком большим увеличением частоты видеопамяти и филлрейта, по сравнению с GTX 460 1 ГБ.

Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там новое решение должно показать результат сильнее:

Как и в случае с GTX 460, положение нового решения относительно GTX 570 из топовой серии несколько улучшилось. Правда, видеокарты Nvidia стали ещё больше уступать и HD 6870 и HD 6950, имеющими много текстурных модулей. Но теперь новая GTX 560 Ti даже обошла GTX 570 в тесте Frozen Glass, больше зависящем от производительности TMU. Да и во втором тесте результаты GTX 560 и GTX 570 оказались близки. Разница между видеокартами на GF104 и GF114 получилась 30—32%, что уже ближе к 38% теоретической разницы в скорости текстурирования.

Всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, не особенно сложные. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

Похоже, что с тестами пиксельных шейдеров версии 3.0 у нового решения Nvidia всё прекрасно. Оба PS 3.0 теста довольно сложные, они почти не зависят от ПСП и текстурирования и являются чисто математическими, но с большим количеством переходов и ветвлений, с которыми отлично справляется новая архитектура Nvidia.

В наиболее сложных Direct3D 9 тестах представленная сегодня GTX 560 Ti показывает результат заметно выше HD 6870, а в одном из тестов опережает и HD 6950. Если сравнивать с GTX 570, то в тесте Fur видеокарты близки, а вот в тесте продвинутого параллакс маппинга новое решение Nvidia уступает своему старшему собрату GTX 570, причём весьма сильно. Похоже, на результаты теста сильно влияет и нехватка ПСП, и меньшая эффективность GF114/GF104 по сравнению с GF110/GF100 в данном тесте (сказывается увеличенное количество блоков ALU в каждом мультипроцессоре). Хотя результат для GTX 560 Ti всё равно отличный — она близка к более дорогому HD 6950 от конкурента.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсемплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсемплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсемплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта, что отлично видно по близким цифрам HD 6870 и HD 6950. Результаты в «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia всегда были сильнее, но последняя архитектура AMD также показывает неплохие результаты.

Насколько неплохие, что новая видеокарта Nvidia даже немного отстаёт от обоих Radeon, хоть и не очень сильно. А лидером теста является GTX 570. Это снова говорит о некотором влиянии филлрейта, а возможно также и ПСП. Хотя в случае GTX 560 Ti и GTX 460 разница в скорости точно соответствует теоретической разнице в скорости ALU и TMU — порядка 38%.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсемплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсемплинга теоретически увеличивает нагрузку в четыре раза, и в таком случае абсолютно все решения Nvidia сдают позиции, и обе видеокарты AMD в таких условиях выглядят ещё сильнее. Теперь оба Radeon выигрывают даже у GTX 570. Но что странно — HD 6870 опережает HD 6950. Другими словами, в случае видеокарт AMD производительность ограничивается производительностью ROP, которая у HD 6870 выше. GTX 560 Ti всё так же отстаёт от GTX 570, но обгоняет GTX 460 на те же 39—40%, соответствующие теоретическим показателям.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсемплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсемплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсемплинга:

Этот тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсемплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма очень похожа на предыдущую без SSAA, и результаты близки даже по абсолютным цифрам. В обновленном D3D10-варианте теста без суперсемплинга, новая модель GTX 560 Ti справляется с данной задачей на 36—37% быстрее, чем родственная GTX 460 на чипе GF104. А вот от обеих видеокарт AMD они всё так же отстают, хотя лидером является GTX 570, основанная на GF110. Хотя топовая карта имеет явное преимущество по теоретическим характеристикам, но такого большого отрыва мы не ожидали.

Посмотрим, что изменит включение суперсемплинга, он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсемплинга и самозатенения задача получается заметно более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсемплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

И теперь HD 6950 при низкой детализации чуть-чуть выигрывает у GTX 570, столь же незначительно отставая от неё в более сложных условиях. Да и HD 6870 не слишком сильно отстаёт. Чего не скажешь про GTX 560 Ti и GTX 460. Новое решение Nvidia проигрывает обоим конкурентам и опережает лишь младшую GTX 460. Причём, ровно на всё те же теоретически обоснованные 38—40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты подтверждают, что графический процессор GF114 архитектурно не отличается от своего предшественника GF104, разница между GTX 560 Ti и GTX 460 соответствует теоретическим 38% в сравнительной производительности блоков ALU. Да и все остальные решения расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте явно быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет большое преимущество перед конкурирующими видеокартами Nvidia. В этот раз разрыв между картами Nvidia и AMD остаётся огромным, HD 6870 и HD 6950 показывают одинаковый результат, опережая даже GTX 570 из топовой линейки. Ну а разница с GTX 560 Ti получилась полуторакратная, что также близко к теории, с учётом меньшего КПД у видеочипов AMD.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, а самые производительные решения ограничиваются скоростью видеопамяти. Так что рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений очень мало, только HD 6950 вырвался ещё дальше вперёд, как и должно быть по теории. Во втором тесте скорость рендеринга уже ограничена исключительно производительностью шейдерных блоков, и разница между GTX 560 Ti и GTX 460 стала даже чуть больше теоретической — 40%, и новая модель почти догнала даже GTX 570. Но этого всё же слишком мало, чтобы новая видеокарта среднего уровня догнала конкурентов в лице Radeon HD 6870 и уж тем более HD 6950 в математических тестах.

Итог по математическим вычислениям неизменным уже несколько лет — у решений компании AMD есть явное преимущество, объясняемое большим количеством блоков ALU, скорость которых не сильно портит даже сравнительно низкий КПД. Переходим к результатам тестирования геометрических шейдеров, они будут интересны потому, что основным ограничителем производительности в них является скорость обработки геометрии, и будет интересно сравнить GTX 560 Ti с HD 6870 и HD 6950.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти.

Разница между Geforce GTX 560 Ti и GTX 460 оказалась даже выше теоретической — 46%. Новая видеокарта показала результат примерно на уровне обоих конкурентов от AMD, а лидером стала видеокарта Nvidia, основанная на топовом графическом процессоре GF110. Geforce GTX 570 во всех режимах заметно обогнала все остальные видеокарты, в том числе и GTX 560 Ti. Это связано с тем, что GTX 570 имеет большее количество блоков обработки геометрии.

В этот раз видеокарты AMD показали неплохой результат — явно сказались оптимизации геометрических блоков, которые сделали инженеры AMD. Их скорость выполнения геометрических шейдеров оказалась близкой к производительности GF114, что уже неплохо. Посмотрим, изменится ли ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia почти не изменились, а старшая видеокарта Radeon немного подтянула результаты, и теперь они обе совсем чуть-чуть быстрее GTX 560 Ti. Платы Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy», — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

Именно в этом тесте при сбалансированной загрузке скорость рендеринга для всех решений уже менее явно ограничена именно геометрической производительностью. Новый Geforce GTX 560 Ti в этот раз уже меньше отстаёт от GTX 570, и с ростом сложности геометрии отставание всё меньше. А по сравнению с картами Radeon новый GPU показывает весьма близкие результаты. Разница с GTX 460 составляет в этот раз всего около 30%, в отличие от 46% на двух предыдущих диаграммах, что явно говорит об упоре в ПСП.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Вот в этом тесте разница между GF114 и GF104 снова вернулась к теоретически обоснованным 40%. А GF110 по скорости исполнения геометрических шейдеров далеко впереди всех остальных — явно сказывается наличие четырёх растеризаторов, в отличие от двух у GF114 и GF104. Наглядно видно, что возможности GTX 570 по обработке геометрии и скорости исполнения геометрических шейдеров почти вдвое выше, чем у GTX 560 Ti.

Но самое главное тут — сравнение с видеокартами AMD. Новое решение компании Nvidia в этом тесте всё же осталось быстрее, чем Radeon HD 6870 и HD 6950, но лишь совсем немного. Количество блоков растеризации у GF114 не столь велико, как у GF110, поэтому та же GTX 570, обладая большим количеством растеризаторов, показывает результат на 70—75% выше.

Итак, по сравнению с GF110 скорость растеризации может быть потенциально слабым показателем для общей производительности. Хотя для решения среднего уровня важно уже то, что его результаты немного выше, чем у топового конкурирующего. В тестах тесселяции скорость ограничена уже не растеризаторами, а тесселяторами, и в таких случаях новый GPU должен показать ещё более сильный результат, по сравнению с конкурентами.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования, и пропускная способность памяти. Разница между всеми решениями не очень большая, только GTX 460 показывает немного странные результаты, являясь самой медленной. Свежеанонсированная GTX 560 Ti опережает старое решение в простых режимах на 30—40%, а в сложном — лишь на 10%. Вероятно, для этих видеокарт был сделан разный баланс в разных версиях драйверов.

GTX 560 Ti немного обгоняет обоих конкурентов от AMD в среднем и сложном режиме, упираясь во что-то (снова ПСП?) в лёгком. Похоже, что картам Nvidia эти задачи даются несколько легче. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось не слишком сильно. Теперь во что-то неведомое в самом лёгком режиме упираются вообще все видеокарты на чипах Nvidia, и лидером в нём становится HD 6950. Зато в тяжёлом режиме GTX 560 Ti почти догнал GTX 570 и заметно обходит конкурентов HD 6870 и HD 6950. Разница между GTX 560 Ti и GTX 460 составила от 10% (в тяжёлом режиме) до 50% (в лёгком режиме)! Тут явно что-то не так с драйвером для старой модели…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» не похожи на те, что мы видели на предыдущих диаграммах. В нём в разных условиях мы видим уже небольшое преимущество продукции компании AMD, хотя в целом все решения, кроме GTX 460, идут ровненько. Наш сегодняшний герой GTX 560 Ti в этом тесте показывает производительность лишь чуть, чем HD 6870 и HD 6950, да и от GTX 570 в лёгком режиме отстаёт. Зато новая карта быстрее, чем GTX 460 до 37%. Рассмотрим второй вариант этого же теста:

Изменений с ростом сложности условий снова очень немного, они почти отсутствуют. Относительные результаты графического процессора GF114 во втором тесте вершинных выборок при высокой детализации стали несколько лучше, и теперь новая видеокарта GTX 560 Ti опережает оба Radeon в тяжёлом режиме, продолжая немного отставать в простых условиях. Разница между видеокартами на основе GF114 и GF104 составила 36—39%, что соответствует теоретической разнице в скорости текстурирования.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новые, но они обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости TMU, ведь наш аналог показывает странные результаты.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета Vantage, результаты получаются совершенно иные, чем в нашем RightMark. Эти цифры больше похожи на истинное положение дел, и ближе к теории. В текстурной синтетике 3DMark карты Nvidia более эффективно используют имеющиеся текстурные блоки, и GTX 560 Ti показывает результат на уровне Radeon HD 6870, что близко к теоретической разнице. Естественно, HD 6950 остаётся далеко впереди, так как обладает большим количеством блоков TMU.

Что касается сравнения с видеокартами Nvidia, то и тут мы видим корректный результат — GTX 560 Ti обгоняет GTX 570, в полном соответствии с теорией. Да и разница между GTX 560 Ti и GTX 460 составила 39%, что также равно теоретической разнице в производительности текстурных выборок. Вообще, новая видеокарта на базе чипа GF114 показывает весьма неплохой результат, и среди всех представленных видеокарт Nvidia именно она становится лидером по текстурированию.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в этом тесте соответствуют теоретическим цифрам филлрейта (производительности блоков ROP), без учёта влияния ПСП видеопамяти. Они не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. И цифры 3DMark Vantage показывают именно производительность блоков ROP, а не величину пропускной способности памяти.

Результаты теста примерно соответствуют теоретическим цифрам, и больше всего зависят от количества блоков ROP и их частоты. Влияние ПСП есть, но небольшое. Новая модель GTX 560 Ti показывает неплохой результат, почти догоняя младшего конкурента от компании AMD, имеющего примерно такую же теоретическую скорость заполнения. А вот HD 6950 новая плата Nvidia догнать не в состоянии. От GTX 570 новое решение среднего уровня отстаёт по той же причине — даже у неполноценного GF110 в теории производительность блоков ROP выше. Зато по сравнению с GTX 460 новая модель оказалась заметно быстрее.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен удачный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

К сожалению, GF104 и GF114 в этом тесте показывают не очень хорошие результаты, GTX 460 так и вообще стала самой медленной картой и отстала от быстрейшей HD 6950 более чем в два раза! Ну а представленная сегодня видеоплата, предназначенная для среднего ценового диапазона, не дотягивается до младшей из представленных плат AMD и старшей сестры GTX 570. Впрочем, слабым утешением может служить то, что модель предыдущего поколения она опережает аж на 41%.

Мы уже ранее писали о том, что сложно сказать, какие параметры больше всего влияют на результаты этого теста. Вероятно, виновата сниженная эффективность выполнения шейдерных программ с ветвлениями у GF104 и GF114, по сравнению с GF110 и GF100. В прошлых исследованиях GF104 реабилитировала себя в тестах физических симуляций, и мы надеемся, что и GF114 там не подведёт.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Вероятнее всего, общая скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. В этом тесте даже GTX 460 работает неплохо, лишь немного отставая от HD 6950 — быстрейшей карты AMD в нашем обзоре. Хорошо видно, что в данном тесте все карты Nvidia показывают гораздо более высокие результаты при выполнении сложных шейдеров.

GTX 560 Ti в этом тесте явно имеет преимущество над обоими конкурирующими решениями в виде Radeon HD 6870 и HD 6950. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективности исполнения сложных программ у GF114 явно всё в порядке, как и у всех остальных чипов компании. От топовой GTX 570 новая модель отстаёт, что вполне соответствует теоретическим характеристикам.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста очень похожи на те, что мы видели на прошлой диаграмме, но GTX 460 теперь показывает даже ещё более высокий результат, чем обе платы Radeon. Не говоря уже об остальных видеокартах Nvidia. Разница между GTX 560 Ti и GTX 460 в этот раз составила чуть больше 30%.

В синтетических тестах имитации тканей и частиц этого тестового пакета, в которых используются геометрические шейдеры, новый графический процессор показал отличный результат, заметно опередив конкурирующие графические процессоры компании AMD. А младшее топовое решение на основе чипа GF110 просто имеет заметно большее количество блоков обработки геометрии, поэтому и стало лидером сравнения в этих задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Этот тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость всех решений примерно соответствует тому, что должно получаться по теории, и очень близка к той картине, что мы видели ранее в наших математических тестах из пакета RightMark 2.0 (по крайней мере во втором).

Конечно же, видеокарты AMD выигрывают у конкурентов от компании Nvidia и в этот раз. Простая, но интенсивная математика выполняется на видеокартах Radeon значительно быстрее, в чём мы уже не раз убеждались. Хотя в других вычислительных тестах с более сложными программами, такими как физические расчёты, решения Nvidia выглядят вполне неплохо, в том числе и GTX 560 Ti.

В этом же математическом тесте, Geforce GTX 560 Ti, основанный на новом чипе GF114, показывает скорость несколько ниже, чем у GTX 570, как и должно быть по теории (хотя разница должна быть чуть меньше, чем получилось). Зато новая модель быстрее, чем GTX 460 на 44%, что даже больше теоретической разницы. А вот от обеих видеокарт Radeon наблюдается большое отставание, и лидером сравнения является модель HD 6950, как и в остальных предельных математических тестах.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новой модели Nvidia Geforce GTX 560 Ti, основанной на графическом процессоре GF114, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что у Nvidia получилась отличная смена для GTX 470. Во многих синтетических тестах новый чип Nvidia показал себя очень неплохо, иногда догоняя Radeon HD 6950 и приближаясь к уровню GTX 570 в некоторых случаях.

Новый GPU отличается от GF104 увеличенным количеством исполнительных блоков и повышенной тактовой частотой, что привело к значительно увеличенной производительности (около 30—40% в большинстве случаев), и представленная сегодня видеокарта на его основе выглядит весьма привлекательно. Особенно отметим скорость текстурных выборок — по этому параметру GTX 560 Ti значительно опережает даже GTX 570, основанную на GF110! Также отметим, что в GF114 увеличилось количество активных тесселяторов, что позволило ещё больше увеличить производительность геометрической обработки.

Среди недостатков выделим то, что архитектурные изменения в GF114 и GF104 привели к небольшому снижению эффективности выполнения некоторых шейдерных программ. А вторым потенциальным недостатком может быть сравнительно низкая пропускная способность памяти, по сравнению с решениями более высокого уровня. Именно недостаточная ПСП зачастую ограничивает производительность GTX 560 Ti, и это может ещё сильнее сказаться в случае разогнанных вариантов карт, так как этот GPU способен работать на значительно повышенных частотах, а применяемая GDDR5-память — нет.

Можно предположить, что весьма неплохие в целом результаты Geforce GTX 560 Ti в синтетических тестах подтвердятся позитивными результатами и в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Новое решение Nvidia должно показать очень хорошие результаты на уровне предыдущих решений вроде Geforce GTX 470, и окажется несколько медленнее Geforce GTX 570, своего старшего собрата на основе чипа GF110, что вполне логично.

А вот что получится в играх по сравнению с конкурентами — сказать сложно сразу по нескольким причинам. Конкурирующие по цене Radeon HD 6870 и HD 6950 от компании AMD слишком отличаются даже друг от друга, имея разные сильные и слабые стороны. Чаще всего GTX 560 Ti должен опережать HD 6870, но всё же должен быть медленнее, чем HD 6950. Хотя в каких-то тестах он будет быстрее обоих конкурентов, а в других может уступить им.

В играх ситуация всегда сложнее, чем в синтетике, скорость рендеринга там часто зависит сразу от нескольких характеристик. И очень часто она зависит от филлрейта и текстурирования, чем сильны решения AMD. Кроме того, нужно учесть и слегка завышенную цену (для российского рынка) на новую GTX 560 Ti. Очень похоже, что ей придётся бороться с подешевевшей Radeon HD 6950 1 ГБ и это сравнение может оказаться для новой видеокарты Nvidia уже менее радужным.



Nvidia Geforce GTX 560 Ti — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia








Дополнительно

Nvidia Geforce GTX 560 Ti: описание видеокарты и результаты синтетических тестов

Nvidia Geforce GTX 560 Ti:

описание видеокарт и результаты синтетических тестов



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 560 Ti — Часть 1: Теоретические сведения


В этой части, как обычно, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов.

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E
  • GPU: Geforce GTX 560 Ti (GF114)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 822 (номинал — 822)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1000 (400) (номинал — 1000 (4000))
  • Ширина шины обмена с памятью (бит): 256
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 384/1644 (номинал — 384/1644)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 384
  • Число блоков текстурирования: 64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры (мм): 210×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)




Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в восьми микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.





Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 460


Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 460


Как мы видим, по концепции оба дизайна GTX 460 и 560 очень схожи. Собственно, это и ожидалось, ибо ядро по сути то же самое, только лишь обновлено и включены все блоки. Разумеется, потребовалось внести изменения в силовую часть, ибо каждое новое ядро может требовать чуть иной вольтаж, а также инженеры всегда ищут повод для внесения оптимизаций в ту или иную разводку PCB, чтобы уменьшить себестоимость, не потеряв в стабильности.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также не должно быть проблем с HDMI: ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком. У карты есть и свой собственный вывод mini-HDMI.

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц макс. — по аналоговому интерфейсу
  • 2560×1600@60 Гц макс. — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл еще раз напомнить, что карты класса 460/560 требуют дополнительного питания, причем двумя 6-контактными разъемами.

О системе охлаждения.

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E

Сразу бросается в глаза внешняя схожесть СО с той, что у GTX 460: вентилятор находится в центре, пластиковый корпус в виде привычного уже для нас «турбинного» типа — это лишь декорация.

Под кожухом — СО центрального типа с единым овальным радиатором, усиленным медными тепловыми трубками. Кулер охлаждает лишь ядро, микросхемы памяти без охлаждения. Вентилятор работает на малых оборотах, и потому в целом СО нешумная.

Отличие данной CO от аналога на GTX 460 лишь в том, что выросли размеры радиатора и длина трубок, теперь все устройство занимает внутри почти весь кожух.




Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 560 Ti 1024 МБ 256-битной GDDR5, PCI-E



Nvidia Geforce GTX 560 Ti o/c 922/1844/4400 MHz 1024 МБ 256-битной GDDR5, PCI-E



Думаем, что нет смысла объяснять, почему два графика мониторинга. Да, мы разогнали частоты работы карты с 822/1644 МГц по ядру до 922/1844 МГц. При этом карта стабильно работает, проблем нет. Да и максимальный нагрев ядра в обоих случаях явно не велик для такого рода карт.

Кстати, в наших диаграммах с результатами тестов мы приведем показатели работы карты не только на номинальных, но и именно на таких вот повышенных частотах.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.12; Nvidia версии 266.56 / 266.35.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 560 Ti со стандартными параметрами (далее GTX 560)
  • Geforce GTX 460 со стандартными параметрами, модель с 1 ГБ видеопамяти (далее GTX 460)
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570)
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)

Для сравнения результатов новой модели Geforce GTX 560 Ti мы выбрали именно эти видеокарты по следующим причинам: Radeon HD 6950 и Radeon HD 6870 являются наиболее близкими по цене решениями от конкурента, Geforce GTX 460 — видеокарта на схожем графическом процессоре предыдущего поколения, а GTX 570 — это наиболее близкое по характеристикам решение текущего поколения, основанное на более мощном чипе GF110.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте все видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений (мы их перепроверим далее, в тесте 3DMark Vantage). Результаты данной синтетики для GTX 560 Ti сильно не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 34 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что значительно ниже теоретической цифры в 64 отфильтрованных текселя.

Так получается, скорее всего, из-за ограничения производительности полосой пропускания видеопамяти, так как тот же GTX 570 оказался впереди, несмотря на то, что по теоретическим цифрам старшее решение должно проигрывать анонсированному сегодня. Впрочем, GTX 460 всё же остался позади, хотя и не слишком заметно.

А вот обе видеокарты компании AMD на голову опережают новое решение Nvidia в режимах с большим количеством накладываемых на пиксель текстур. А в случаях с небольшим количеством текстур, ограничение по ПСП сказывается ещё больше и вплоть до трех текстур все видеокарты показывают близкие результаты. В этом тесте явно не достигаются реально возможные показатели нового GPU, но посмотрим их же в тесте филлрейта:

Во втором синтетическом тесте, который показывает скорость заполнения, видно всё то же самое, но уже с учетом количества записанных в буфер кадра пикселей. И по диаграмме отлично видно, что скорость рендеринга у многих решений в простых условиях серьёзно ограничена ПСП.

Максимальный результат остаётся за решениями AMD, имеющими значительно большее количество TMU и более эффективными по достижению высокого КПД в нашем синтетическом тесте. HD 6950 показывает максимальный результат, почти вдвое превышающий цифры GTX 560 Ti. Интересно, что даже в случаях с 0—4 накладываемыми текстурами, рассматриваемое сегодня решение уступает остальным, кроме GTX 460, хотя ПСП у неё почти как у HD 6870.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU даже среднего уровня и не могут показать все возможности современных видеочипов. В этих тестах производительность ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков и кэширования текстурных данных в реальных задачах, также есть влияние и ПСП видеопамяти.

Видно, что GF114 полностью повторяет результаты GF104, только с учётом большего количества ALU и TMU и работы их на повышенных частотах в случае GTX 560 Ti. В самых простых шейдерах разница между GTX 560 Ti и GTX 460 составила 23—28%, что ниже теоретических цифр усиления мощности ALU и TMU. Похоже, что производительность GTX 560 Ti в этом тесте ограничена пропускной способностью видеопамяти и филлрейтом, так как по этим показателям разница между решениями значительно ниже.

Более интересно то, что в трёх простых тестах GTX 560 Ti смогла составить конкуренцию даже GTX 570. Впрочем, в наиболее сложных тестах решение на GF114 всё-таки отстало от топового GF110. Что касается сравнения с видеокартами AMD, то обе они обогнали GTX 560 Ti, она смогла конкурировать только с HD 6870, да и то только в самых простых тестах. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

А вот эти тесты получились гораздо более любопытными. Нас интересует разница в результатах GTX 560 Ti (да и GTX 460) и GTX 570 в этих двух тестах. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём обычно располагаются по скорости текстурирования. И вот в этом тесте GTX 560 Ti показывает теоретически обоснованный результат, обгоняя даже GTX 570. Лучшую среди видеокарт AMD достать не удалось, но вот HD 6870 показала схожий результат, что вполне соответствует теории (пиковая скорость текстурирования у этих решений близкая).

Результаты второго теста довольно сильно отличаются, в нём GTX 560 Ti уже проигрывает всем, кроме младшей сестры GTX 460. Этот тест более интенсивен вычислительно, и в нём сказывается влияние математической производительности. Поэтому тест лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU. Разница между GTX 560 Ti и GTX 460 в этих двух тестах составила 32—37%, что примерно соответствует теоретическим показателям.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D-графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», и новая GTX 560 Ti снова заметно уступает GTX 570, имеющей топовый графический процессор GF110. Оба решения компании AMD также оказались далеко впереди.

Во втором тесте «Parallax Mapping» результаты тоже чем-то похожи на предыдущие, но в этот раз оба Radeon уже не так сильно оторвались от видеокарт Nvidia. Решения на основе чипов GF114 и GF104 остаются снова позади всех, и GTX 560 Ti опережает GTX 460 в этих тестах на 24—28%, что снова говорит о недостаточном раскрытии потенциала нового GPU, вызванного не слишком большим увеличением частоты видеопамяти и филлрейта, по сравнению с GTX 460 1 ГБ.

Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там новое решение должно показать результат сильнее:

Как и в случае с GTX 460, положение нового решения относительно GTX 570 из топовой серии несколько улучшилось. Правда, видеокарты Nvidia стали ещё больше уступать и HD 6870 и HD 6950, имеющими много текстурных модулей. Но теперь новая GTX 560 Ti даже обошла GTX 570 в тесте Frozen Glass, больше зависящем от производительности TMU. Да и во втором тесте результаты GTX 560 и GTX 570 оказались близки. Разница между видеокартами на GF104 и GF114 получилась 30—32%, что уже ближе к 38% теоретической разницы в скорости текстурирования.

Всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, не особенно сложные. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

Похоже, что с тестами пиксельных шейдеров версии 3.0 у нового решения Nvidia всё прекрасно. Оба PS 3.0 теста довольно сложные, они почти не зависят от ПСП и текстурирования и являются чисто математическими, но с большим количеством переходов и ветвлений, с которыми отлично справляется новая архитектура Nvidia.

В наиболее сложных Direct3D 9 тестах представленная сегодня GTX 560 Ti показывает результат заметно выше HD 6870, а в одном из тестов опережает и HD 6950. Если сравнивать с GTX 570, то в тесте Fur видеокарты близки, а вот в тесте продвинутого параллакс маппинга новое решение Nvidia уступает своему старшему собрату GTX 570, причём весьма сильно. Похоже, на результаты теста сильно влияет и нехватка ПСП, и меньшая эффективность GF114/GF104 по сравнению с GF110/GF100 в данном тесте (сказывается увеличенное количество блоков ALU в каждом мультипроцессоре). Хотя результат для GTX 560 Ti всё равно отличный — она близка к более дорогому HD 6950 от конкурента.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсемплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсемплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсемплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта, что отлично видно по близким цифрам HD 6870 и HD 6950. Результаты в «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia всегда были сильнее, но последняя архитектура AMD также показывает неплохие результаты.

Насколько неплохие, что новая видеокарта Nvidia даже немного отстаёт от обоих Radeon, хоть и не очень сильно. А лидером теста является GTX 570. Это снова говорит о некотором влиянии филлрейта, а возможно также и ПСП. Хотя в случае GTX 560 Ti и GTX 460 разница в скорости точно соответствует теоретической разнице в скорости ALU и TMU — порядка 38%.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсемплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсемплинга теоретически увеличивает нагрузку в четыре раза, и в таком случае абсолютно все решения Nvidia сдают позиции, и обе видеокарты AMD в таких условиях выглядят ещё сильнее. Теперь оба Radeon выигрывают даже у GTX 570. Но что странно — HD 6870 опережает HD 6950. Другими словами, в случае видеокарт AMD производительность ограничивается производительностью ROP, которая у HD 6870 выше. GTX 560 Ti всё так же отстаёт от GTX 570, но обгоняет GTX 460 на те же 39—40%, соответствующие теоретическим показателям.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсемплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсемплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсемплинга:

Этот тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсемплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма очень похожа на предыдущую без SSAA, и результаты близки даже по абсолютным цифрам. В обновленном D3D10-варианте теста без суперсемплинга, новая модель GTX 560 Ti справляется с данной задачей на 36—37% быстрее, чем родственная GTX 460 на чипе GF104. А вот от обеих видеокарт AMD они всё так же отстают, хотя лидером является GTX 570, основанная на GF110. Хотя топовая карта имеет явное преимущество по теоретическим характеристикам, но такого большого отрыва мы не ожидали.

Посмотрим, что изменит включение суперсемплинга, он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсемплинга и самозатенения задача получается заметно более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсемплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

И теперь HD 6950 при низкой детализации чуть-чуть выигрывает у GTX 570, столь же незначительно отставая от неё в более сложных условиях. Да и HD 6870 не слишком сильно отстаёт. Чего не скажешь про GTX 560 Ti и GTX 460. Новое решение Nvidia проигрывает обоим конкурентам и опережает лишь младшую GTX 460. Причём, ровно на всё те же теоретически обоснованные 38—40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты подтверждают, что графический процессор GF114 архитектурно не отличается от своего предшественника GF104, разница между GTX 560 Ti и GTX 460 соответствует теоретическим 38% в сравнительной производительности блоков ALU. Да и все остальные решения расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте явно быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет большое преимущество перед конкурирующими видеокартами Nvidia. В этот раз разрыв между картами Nvidia и AMD остаётся огромным, HD 6870 и HD 6950 показывают одинаковый результат, опережая даже GTX 570 из топовой линейки. Ну а разница с GTX 560 Ti получилась полуторакратная, что также близко к теории, с учётом меньшего КПД у видеочипов AMD.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, а самые производительные решения ограничиваются скоростью видеопамяти. Так что рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений очень мало, только HD 6950 вырвался ещё дальше вперёд, как и должно быть по теории. Во втором тесте скорость рендеринга уже ограничена исключительно производительностью шейдерных блоков, и разница между GTX 560 Ti и GTX 460 стала даже чуть больше теоретической — 40%, и новая модель почти догнала даже GTX 570. Но этого всё же слишком мало, чтобы новая видеокарта среднего уровня догнала конкурентов в лице Radeon HD 6870 и уж тем более HD 6950 в математических тестах.

Итог по математическим вычислениям неизменным уже несколько лет — у решений компании AMD есть явное преимущество, объясняемое большим количеством блоков ALU, скорость которых не сильно портит даже сравнительно низкий КПД. Переходим к результатам тестирования геометрических шейдеров, они будут интересны потому, что основным ограничителем производительности в них является скорость обработки геометрии, и будет интересно сравнить GTX 560 Ti с HD 6870 и HD 6950.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти.

Разница между Geforce GTX 560 Ti и GTX 460 оказалась даже выше теоретической — 46%. Новая видеокарта показала результат примерно на уровне обоих конкурентов от AMD, а лидером стала видеокарта Nvidia, основанная на топовом графическом процессоре GF110. Geforce GTX 570 во всех режимах заметно обогнала все остальные видеокарты, в том числе и GTX 560 Ti. Это связано с тем, что GTX 570 имеет большее количество блоков обработки геометрии.

В этот раз видеокарты AMD показали неплохой результат — явно сказались оптимизации геометрических блоков, которые сделали инженеры AMD. Их скорость выполнения геометрических шейдеров оказалась близкой к производительности GF114, что уже неплохо. Посмотрим, изменится ли ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia почти не изменились, а старшая видеокарта Radeon немного подтянула результаты, и теперь они обе совсем чуть-чуть быстрее GTX 560 Ti. Платы Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy», — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

Именно в этом тесте при сбалансированной загрузке скорость рендеринга для всех решений уже менее явно ограничена именно геометрической производительностью. Новый Geforce GTX 560 Ti в этот раз уже меньше отстаёт от GTX 570, и с ростом сложности геометрии отставание всё меньше. А по сравнению с картами Radeon новый GPU показывает весьма близкие результаты. Разница с GTX 460 составляет в этот раз всего около 30%, в отличие от 46% на двух предыдущих диаграммах, что явно говорит об упоре в ПСП.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Вот в этом тесте разница между GF114 и GF104 снова вернулась к теоретически обоснованным 40%. А GF110 по скорости исполнения геометрических шейдеров далеко впереди всех остальных — явно сказывается наличие четырёх растеризаторов, в отличие от двух у GF114 и GF104. Наглядно видно, что возможности GTX 570 по обработке геометрии и скорости исполнения геометрических шейдеров почти вдвое выше, чем у GTX 560 Ti.

Но самое главное тут — сравнение с видеокартами AMD. Новое решение компании Nvidia в этом тесте всё же осталось быстрее, чем Radeon HD 6870 и HD 6950, но лишь совсем немного. Количество блоков растеризации у GF114 не столь велико, как у GF110, поэтому та же GTX 570, обладая большим количеством растеризаторов, показывает результат на 70—75% выше.

Итак, по сравнению с GF110 скорость растеризации может быть потенциально слабым показателем для общей производительности. Хотя для решения среднего уровня важно уже то, что его результаты немного выше, чем у топового конкурирующего. В тестах тесселяции скорость ограничена уже не растеризаторами, а тесселяторами, и в таких случаях новый GPU должен показать ещё более сильный результат, по сравнению с конкурентами.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования, и пропускная способность памяти. Разница между всеми решениями не очень большая, только GTX 460 показывает немного странные результаты, являясь самой медленной. Свежеанонсированная GTX 560 Ti опережает старое решение в простых режимах на 30—40%, а в сложном — лишь на 10%. Вероятно, для этих видеокарт был сделан разный баланс в разных версиях драйверов.

GTX 560 Ti немного обгоняет обоих конкурентов от AMD в среднем и сложном режиме, упираясь во что-то (снова ПСП?) в лёгком. Похоже, что картам Nvidia эти задачи даются несколько легче. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось не слишком сильно. Теперь во что-то неведомое в самом лёгком режиме упираются вообще все видеокарты на чипах Nvidia, и лидером в нём становится HD 6950. Зато в тяжёлом режиме GTX 560 Ti почти догнал GTX 570 и заметно обходит конкурентов HD 6870 и HD 6950. Разница между GTX 560 Ti и GTX 460 составила от 10% (в тяжёлом режиме) до 50% (в лёгком режиме)! Тут явно что-то не так с драйвером для старой модели…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» не похожи на те, что мы видели на предыдущих диаграммах. В нём в разных условиях мы видим уже небольшое преимущество продукции компании AMD, хотя в целом все решения, кроме GTX 460, идут ровненько. Наш сегодняшний герой GTX 560 Ti в этом тесте показывает производительность лишь чуть, чем HD 6870 и HD 6950, да и от GTX 570 в лёгком режиме отстаёт. Зато новая карта быстрее, чем GTX 460 до 37%. Рассмотрим второй вариант этого же теста:

Изменений с ростом сложности условий снова очень немного, они почти отсутствуют. Относительные результаты графического процессора GF114 во втором тесте вершинных выборок при высокой детализации стали несколько лучше, и теперь новая видеокарта GTX 560 Ti опережает оба Radeon в тяжёлом режиме, продолжая немного отставать в простых условиях. Разница между видеокартами на основе GF114 и GF104 составила 36—39%, что соответствует теоретической разнице в скорости текстурирования.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новые, но они обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости TMU, ведь наш аналог показывает странные результаты.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета Vantage, результаты получаются совершенно иные, чем в нашем RightMark. Эти цифры больше похожи на истинное положение дел, и ближе к теории. В текстурной синтетике 3DMark карты Nvidia более эффективно используют имеющиеся текстурные блоки, и GTX 560 Ti показывает результат на уровне Radeon HD 6870, что близко к теоретической разнице. Естественно, HD 6950 остаётся далеко впереди, так как обладает большим количеством блоков TMU.

Что касается сравнения с видеокартами Nvidia, то и тут мы видим корректный результат — GTX 560 Ti обгоняет GTX 570, в полном соответствии с теорией. Да и разница между GTX 560 Ti и GTX 460 составила 39%, что также равно теоретической разнице в производительности текстурных выборок. Вообще, новая видеокарта на базе чипа GF114 показывает весьма неплохой результат, и среди всех представленных видеокарт Nvidia именно она становится лидером по текстурированию.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в этом тесте соответствуют теоретическим цифрам филлрейта (производительности блоков ROP), без учёта влияния ПСП видеопамяти. Они не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. И цифры 3DMark Vantage показывают именно производительность блоков ROP, а не величину пропускной способности памяти.

Результаты теста примерно соответствуют теоретическим цифрам, и больше всего зависят от количества блоков ROP и их частоты. Влияние ПСП есть, но небольшое. Новая модель GTX 560 Ti показывает неплохой результат, почти догоняя младшего конкурента от компании AMD, имеющего примерно такую же теоретическую скорость заполнения. А вот HD 6950 новая плата Nvidia догнать не в состоянии. От GTX 570 новое решение среднего уровня отстаёт по той же причине — даже у неполноценного GF110 в теории производительность блоков ROP выше. Зато по сравнению с GTX 460 новая модель оказалась заметно быстрее.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен удачный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

К сожалению, GF104 и GF114 в этом тесте показывают не очень хорошие результаты, GTX 460 так и вообще стала самой медленной картой и отстала от быстрейшей HD 6950 более чем в два раза! Ну а представленная сегодня видеоплата, предназначенная для среднего ценового диапазона, не дотягивается до младшей из представленных плат AMD и старшей сестры GTX 570. Впрочем, слабым утешением может служить то, что модель предыдущего поколения она опережает аж на 41%.

Мы уже ранее писали о том, что сложно сказать, какие параметры больше всего влияют на результаты этого теста. Вероятно, виновата сниженная эффективность выполнения шейдерных программ с ветвлениями у GF104 и GF114, по сравнению с GF110 и GF100. В прошлых исследованиях GF104 реабилитировала себя в тестах физических симуляций, и мы надеемся, что и GF114 там не подведёт.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Вероятнее всего, общая скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. В этом тесте даже GTX 460 работает неплохо, лишь немного отставая от HD 6950 — быстрейшей карты AMD в нашем обзоре. Хорошо видно, что в данном тесте все карты Nvidia показывают гораздо более высокие результаты при выполнении сложных шейдеров.

GTX 560 Ti в этом тесте явно имеет преимущество над обоими конкурирующими решениями в виде Radeon HD 6870 и HD 6950. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективности исполнения сложных программ у GF114 явно всё в порядке, как и у всех остальных чипов компании. От топовой GTX 570 новая модель отстаёт, что вполне соответствует теоретическим характеристикам.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста очень похожи на те, что мы видели на прошлой диаграмме, но GTX 460 теперь показывает даже ещё более высокий результат, чем обе платы Radeon. Не говоря уже об остальных видеокартах Nvidia. Разница между GTX 560 Ti и GTX 460 в этот раз составила чуть больше 30%.

В синтетических тестах имитации тканей и частиц этого тестового пакета, в которых используются геометрические шейдеры, новый графический процессор показал отличный результат, заметно опередив конкурирующие графические процессоры компании AMD. А младшее топовое решение на основе чипа GF110 просто имеет заметно большее количество блоков обработки геометрии, поэтому и стало лидером сравнения в этих задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Этот тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость всех решений примерно соответствует тому, что должно получаться по теории, и очень близка к той картине, что мы видели ранее в наших математических тестах из пакета RightMark 2.0 (по крайней мере во втором).

Конечно же, видеокарты AMD выигрывают у конкурентов от компании Nvidia и в этот раз. Простая, но интенсивная математика выполняется на видеокартах Radeon значительно быстрее, в чём мы уже не раз убеждались. Хотя в других вычислительных тестах с более сложными программами, такими как физические расчёты, решения Nvidia выглядят вполне неплохо, в том числе и GTX 560 Ti.

В этом же математическом тесте, Geforce GTX 560 Ti, основанный на новом чипе GF114, показывает скорость несколько ниже, чем у GTX 570, как и должно быть по теории (хотя разница должна быть чуть меньше, чем получилось). Зато новая модель быстрее, чем GTX 460 на 44%, что даже больше теоретической разницы. А вот от обеих видеокарт Radeon наблюдается большое отставание, и лидером сравнения является модель HD 6950, как и в остальных предельных математических тестах.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новой модели Nvidia Geforce GTX 560 Ti, основанной на графическом процессоре GF114, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что у Nvidia получилась отличная смена для GTX 470. Во многих синтетических тестах новый чип Nvidia показал себя очень неплохо, иногда догоняя Radeon HD 6950 и приближаясь к уровню GTX 570 в некоторых случаях.

Новый GPU отличается от GF104 увеличенным количеством исполнительных блоков и повышенной тактовой частотой, что привело к значительно увеличенной производительности (около 30—40% в большинстве случаев), и представленная сегодня видеокарта на его основе выглядит весьма привлекательно. Особенно отметим скорость текстурных выборок — по этому параметру GTX 560 Ti значительно опережает даже GTX 570, основанную на GF110! Также отметим, что в GF114 увеличилось количество активных тесселяторов, что позволило ещё больше увеличить производительность геометрической обработки.

Среди недостатков выделим то, что архитектурные изменения в GF114 и GF104 привели к небольшому снижению эффективности выполнения некоторых шейдерных программ. А вторым потенциальным недостатком может быть сравнительно низкая пропускная способность памяти, по сравнению с решениями более высокого уровня. Именно недостаточная ПСП зачастую ограничивает производительность GTX 560 Ti, и это может ещё сильнее сказаться в случае разогнанных вариантов карт, так как этот GPU способен работать на значительно повышенных частотах, а применяемая GDDR5-память — нет.

Можно предположить, что весьма неплохие в целом результаты Geforce GTX 560 Ti в синтетических тестах подтвердятся позитивными результатами и в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Новое решение Nvidia должно показать очень хорошие результаты на уровне предыдущих решений вроде Geforce GTX 470, и окажется несколько медленнее Geforce GTX 570, своего старшего собрата на основе чипа GF110, что вполне логично.

А вот что получится в играх по сравнению с конкурентами — сказать сложно сразу по нескольким причинам. Конкурирующие по цене Radeon HD 6870 и HD 6950 от компании AMD слишком отличаются даже друг от друга, имея разные сильные и слабые стороны. Чаще всего GTX 560 Ti должен опережать HD 6870, но всё же должен быть медленнее, чем HD 6950. Хотя в каких-то тестах он будет быстрее обоих конкурентов, а в других может уступить им.

В играх ситуация всегда сложнее, чем в синтетике, скорость рендеринга там часто зависит сразу от нескольких характеристик. И очень часто она зависит от филлрейта и текстурирования, чем сильны решения AMD. Кроме того, нужно учесть и слегка завышенную цену (для российского рынка) на новую GTX 560 Ti. Очень похоже, что ей придётся бороться с подешевевшей Radeon HD 6950 1 ГБ и это сравнение может оказаться для новой видеокарты Nvidia уже менее радужным.



Nvidia Geforce GTX 560 Ti — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia