Nvidia Geforce Titan:

описание видеокарт и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов.

В нашей лаборатории побывала карта компании Gigabyte.

Платы

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E
  • GPU: Geforce Titan (GK110)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 837—876 МГц (номинал — 837—876 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 14/837—876 МГц (номинал — 14/837—876 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 2688
  • Число блоков текстурирования: 224 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 48
  • Размеры: 270×100×37 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 262/78/74 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E
Карта имеет 6144 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах (по 12 на каждой стороне PCB).

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Сравнение с эталонным дизайном, вид сзади
Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Как мы видим, в целом размеры карты не выходят за рамки принятых стандартов для топовых ускорителей: 270×100 мм. Да и занимает она традиционные 2 слота (хотя, по идее, трехслотовые ускорители должны уже стать стандартом, если речь идет о топовых продуктах). PCB у Titan логично отличается от GTX 680, поскольку карты имеют разные как шины обмена с памятью, так и наборы микросхем памяти (у GTX 680 — 256 бит и 8 микросхем, а у Titan — 384 бит и 24 микросхемы). Система питания имеет 6 фаз для ядра и 2 фазы для микросхем памяти. Управляется БП цифровым контроллером NCP 4206 компании On Semiconductor.

Ускоритель имеет набор гнезд вывода: 2 DVI (один из которых Single-Link и совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 4 монитора (каждый до разрешения Full HD), полученная еще серией GTX 6xx, реализована и на Titan, где она наиболее востребована, учитывая мощность и возможности данного ускорителя.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания, причем двумя разъемами: один с шестью контактами, второй с восемью.

О системе охлаждения.

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E
СО имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются и т. д. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума. Должны сказать, что при максимальной нагрузке шум все же ощущается, ведь максимальная частота вращения — около 2300 оборотов в минуту. Так что карту никак нельзя назвать бесшумной, что бы ни говорили специалисты из Nvidia.

Странная также ситуация с охлаждением микросхем памяти. Охлаждается только та половина, которая на лицевой стороне карты (у кулера есть специальная пластина, прижимающаяся к микросхемам памяти и транзисторам силового блока). Вторая половина на оборотной стороне вообще без охлаждения. Впрочем, для памяти, работающей на номинальной для нее частоте, охлаждения вообще не надо.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 82 градуса, что для топового ускорителя более чем удовлетворительно. Так что СО получилась весьма эффективной, хоть и шумноватой.

Комплектация. Базовый комплект поставки должен включать в себя руководство пользователя и диск с драйверами и утилитами.

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E
Перед нами базовый комплект плюс два разветвителя на 6- и 8-контактные коннекторы питания. Кроме того, мы видим адаптер DVI-to-VGA, HDMI-кабель, а также бонусы: набор фирменных игральных карт Gigabyte и эксклюзивный огромный коврик для мыши. Отличный комплект!

Упаковка.

Gigabyte Geforce Titan 6144 МБ 384-битной GDDR5 PCI-E

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.2beta7; Nvidia версии 314.09

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan)
  • Geforce GTX 690 со стандартными параметрами (далее GTX 690)
  • Geforce GTX 680 со стандартными параметрами (далее GTX 680)
  • Geforce GTX 680 SLI со стандартными параметрами (далее GTX 680 SLI)
  • Radeon HD 7970 со стандартными параметрами (далее HD 7970)
  • Asus ARES II — двухчиповая видеокарта (далее Asus ARES II)

Для сравнения результатов новой топовой модели видеокарты Geforce GTX Titan именно эти решения были выбраны по следующим причинам. Geforce GTX 680 является ближайшей к Titan моделью, основанной на базе менее мощного графического процессора GK110 той же архитектуры Kepler, и будет интересно посмотреть, насколько увеличилась производительность новой модели, по сравнению с предшественницей. Сравнение с двухчиповой GTX 690 и системой из двух GTX 680 в SLI также будет интересно, просто чтобы понять разницу между мощным одночиповым и двухчиповыми вариантами, но на базе менее мощных GPU.

От конкурирующей компании AMD были выбраны две видеоплаты. Точнее, от AMD пока что одна, а вторая — от Asus, пока у AMD нет референсного двухчипового варианта на базе двух чипов Tahiti. Итак, Radeon HD 7970 является наиболее мощным одночиповым конкурентом новинки (если его можно так назвать, потому что он явно менее производительный и имеет цену значительно ниже рекомендованной цены свежеанонсированной видеокарты Nvidia).

А вот вторая модель — Asus ARES II — показывает нам максимум того, что можно ожидать от грядущей двухчиповой видеокарты AMD под условным наименованием Radeon HD 7990. Естественно, ARES II не является прямым конкурентом для Geforce GTX Titan, она и стоит дороже, и потребляет энергии значительно больше, но может дать некий ориентир.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Как мы уже отметили, эти тесты очень просты для современных GPU, и скорость самых мощных решений в них почти всегда упирается в некие ограничители, как видно на диаграмме. Лишь иногда производительность определяется текстурированием или филлрейтом. Поэтому они способны показать далеко не все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. Судя по нашим предыдущим сравнениям, производительность последних видеокарт в этих тестах часто ограничена филлрейтом, но в случае самых мощных видеокарт почти все они показывают сравнимые результаты. Слегка выделяются только двухчиповые решения, да и то не во всех тестах.

Новая модель видеокарты Nvidia в этом сравнении выступила неплохо — она явно опередила одночиповую плату на базе GK104 и практически догнала двухчиповую GTX 690. Правда, мощнейшей в сравнении плате на базе двух разогнанных чипов Tahiti она уступает, но это решение идет у нас вне зачета — ведь Radeon HD 7990 вряд ли будет столь же мощным. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нем сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые платы Geforce на базе архитектуры Kepler в нем показывают тоже довольно сильные результаты.

Новинка Nvidia снова оказалась посередине между одночиповой GTX 680 и двухчиповой GTX 690, как и должно быть исходя из теории. Причем, что в тесте освещения, больше зависящем от скорости ALU, что в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же. Так что можем отметить сравнительно неплохой результат сегодняшней героини в лице Geforce GTX Titan, хотя от лидирующей в обоих тестах двухчиповой модели на GPU от конкурента она отстала достаточно сильно.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше графической архитектуры Nvidia.

Это относится и к двум моделям на чипах AMD, которые выбраны для сегодняшнего сравнения, правда в одном из тестов второй GPU явно не работал (к слову о проблемах AFR — как видите, они есть даже в синтетике). В этом тесте «Frozen Glass» скорость больше зависит от математической производительности, и Radeon HD 7970 снова оказывается быстрее новинки Nvidia, не говоря уже о старых платах этой компании. В этом тесте Titan показывает результат чуть выше двухчиповой же GTX 690, которая также страдает от недостатков мультичипового рендеринга, и находится посередине между одной GTX 680 и двумя платами в SLI.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia показала производительность ровно между GTX 680 и GTX 690, как и ожидалось, исходя из теории. Radeon HD 7970 от конкурента также где-то близко по скорости, а вот двухчиповая ARES II вырвалась далеко вперед. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение плат на чипах производства Nvidia явно улучшилось, и Geforce GTX Titan в одном из тестов немного опережает одночипового конкурента от AMD, а во втором столь же немного уступает ему. Хотя самая дорогая плата Asus на двух Tahiti все так же далеко впереди, даже с учетом явных проблем совместимости в тесте Frozen Glass. Итак, современные чипы Nvidia и в этих задачах явно работают достаточно эффективно, и новая видеокарта Geforce GTX Titan в этих тестах показывает неплохой результат.

Но все это давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Вот эти тесты уже не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились, особенно после доводки драйверов — посмотрите на разницу между Radeon HD 7970, которая тестировалась на первых драйверах и ARES II с двумя такими чипами, при тестировании которой применялась последняя версия драйвера — разница между ними намного превышает 2 раза, так что явная оптимизация драйверов налицо — отличная работа!

Да и новинка Nvidia выступила очень неплохо по сравнению со своими предшественниками на базе одного и двух чипов среднего класса — GK104. В обоих тестах она расположилась между этими платами и даже поближе к двухчиповой модели. С другой стороны, отставание от двухчиповой ARES II, которая в нашем сравнении является как бы прототипом возможного Radeon HD 7990, слишком велико. Эта плата на двух Tahiti значительно быстрее, и все платы серьезно ей уступают.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» — до полутора раза ниже, чем при «Low».

Надо отметить, что в задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD только сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперед. И сейчас уже именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, тем более что они не останавливали оптимизацию драйверов, которая позволила плате на базе двух чипов Tahiti в 2,5-2,6 раз обойти одночиповый аналог, протестированный на старых драйверах.

Результат ожидаемый, и мы видим его на диаграмме, где новая Geforce GTX Titan лишь догнала одночиповый Radeon HD 7970 (на старых драйверах), серьезно уступив двухчиповой плате Asus. Возможно, отчасти в этом виновата сравнительно низкая пропускная способность памяти или недостаток филлрейта (производительность блоков ROP). И все же, по сравнению с другими Geforce, рассматриваемая нами сегодня модель Nvidia показала очень неплохой результат, который оказался гораздо ближе к двухчиповой GTX 690, чем к одночиповой GTX 680.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В этот раз ситуация похожа на предыдущую диаграмму, но новинка Geforce GTX Titan стала ровно посередине между GTX 690 и GTX 680. Что касается сравнения с платами на чипах AMD при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, результаты почти не изменились, хотя одночиповый Radeon HD 7970 немного оторвался от Titan. Протестированная нами сегодня плата компании Nvidia опередила только GTX 680, так что преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. Называется он Steep Parallax Mapping и при низких настройках использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (также без включения SSAA), хотя модели Geforce тут смотрятся чуть-чуть лучше. Но в целом платы Nvidia в этом тесте справляются с работой все так же чуть хуже конкурирующих от AMD, и новая плата Geforce GTX Titan в обновленном D3D10-варианте теста без суперсэмплинга показывает результат на уровне менее дорогой Radeon HD 7970, не говоря о двухчиповом прототипе «HD 7990», который снова стал быстрейшим решением, почти в три раза обогнав новинку Nvidia. Посмотрим, что изменит включение суперсэмплинга.

Все снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается еще более тяжелой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае — видеокарта Radeon HD 7970 не улучшила свои показатели относительно новинки.

Двухчиповая плата на двух Tahiti остается лидером, графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают менее эффективно. Героиня нашего сегодняшнего обзора продолжает показывать скорость ровно между GTX 680 и GTX 680 — двухчиповой и одночиповой платами на базе GK104. Что вполне объяснимо теорией, так как Titan должна быть примерно на 45% быстрее GTX 680, а двухчиповая GTX 690 почти вдвое быстрее аналога на одном GK104. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов обычно более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учетом оптимизации драйверов. Явно же AMD улучшила драйверы со времен выхода Radeon HD 7970, так как разница между этой моделью на старых драйверах и Asus ARES II на новых явно выше двух раз — это даже разными частотами не объяснить.

Архитектуры AMD последних лет в таких тестах ранее имели серьезное преимущество перед конкурирующими видеокартами Nvidia, но калифорнийская компания в архитектуре Kepler увеличила число потоковых процессоров, и пиковая математическая производительность свежих моделей Geforce значительно возросла. Что мы и видим по результатам первого математического теста. Рассматриваемая Geforce GTX Titan показала очень хороший результат, почти догнав двухчиповую GTX 680, и он явно лучше, чем у Radeon HD 7970 (тут нужно учесть, что на новых драйверах плата AMD покажет скорость выше).

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим почти такие же относительные результаты. Почти, потому что скорость Radeon HD 7970 в этом тесте ближе к теории, чем в предыдущем. И хотя новинка от компании Nvidia все еще впереди одночиповой платы AMD, разница уже совсем невелика и она явно обусловлена ранними драйверами для Radeon HD 7970. Зато по сравнению с платами на GK104 все примерно так же — новинка чуть ближе к двухчиповой GTX 690, чем к GTX 680 на базе одного такого графического процессора. Все точно по теории.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Налицо разница между результатами видеокарт на чипах Nvidia и решений AMD, при одинаковом количестве GPU, конечно же. Она обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первый же тест геометрии показал, что в таких задачах платы Nvidia оказываются производительнее.

К сожалению, хотя сегодняшняя новинка Geforce GTX Titan имеет большое количество геометрических блоков, ее явно «душит» низкая пропускная способность памяти, которая не дает догнать двухчиповый GTX 690. Это почти не мешает ей в борьбе со своими настоящими конкурентами — одночиповый Radeon HD 7970 она обходит с огромным запасом, да и GTX 680 осталась позади. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX Titan все так же между GTX 680 и GTX 690 и при этом явно быстрее видеоплаты семейства Radeon HD 7000.

Что касается двухчиповой ARES II от Asus, то она оказывается быстрее чисто из-за своей двухчиповой природы и экстремального потребления — всерьез сравнивать плату с тремя 8-контактными разъемами питания и плату с 8- и 6-контактными разъемами просто нельзя. Но смотрим далее — интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — еще и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Сразу же видим «ахиллесову пяту» двухчиповых плат — они в этом тесте традиционно работают отвратительно. Если GTX 690 показывает результат, хоть и низкий, то на ARES II он просто не запускается. Относительные результаты остальных решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

Скорость рендеринга в этом тесте также ограничена в основном геометрической производительностью, но в случае сбалансированной загрузки геометрических шейдеров, все результаты близки. Geforce GTX Titan показала скорость лишь чуть выше младшей модели семейства Kepler, да и конкурирующий с ними Radeon HD 7970 неподалеку. Эти цифры могут серьезно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Так оно и получилось — одночиповая плата от AMD показала худший результат, заметно уступив как плате на базе GK104, так и топовой Titan на чипе GK110. В этом тесте единственно важным параметром является скорость обработки геометрии, с которой дела у Nvidia обстоят заметно лучше, особенно в топовых чипах. Вероятно, скорость в этом тесте упирается в производительность геометрических блоков, хотя, несмотря на разное количество геометрических блоков, Geforce GTX 680 и Titan оказались довольно близки друг к другу по скорости рендеринга. С двухчиповыми платами все так же — они «не любят» этот тест.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти, особенно в легком режиме. Результаты некоторых видеокарт Nvidia бывают ограничены еще чем-то непонятным, а двухчиповые платы Radeon получают очень приличный прирост при AFR-рендеринге. Зато между схожими по классу одночиповыми платами разница в этом тесте зачастую порой получается весьма небольшой.

В этом разделе часто получаются необычные результаты. Geforce GTX Titan в легком и среднем режиме показывает явно странные результаты, ограниченные чем-то, зато вот в сложном все прекрасно! Самой быстрой ожидаемо стала «внеконкурсная» двухчиповая ARES II, все остальные платы близки друг к другу по скорости, но в тяжелом режиме Geforce GTX Titan заметно быстрее всех — она опередила двухчиповую GTX 690 почти в два раза! Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось слабо — сравнительные результаты решений компании AMD в тяжелых режимах заметно ухудшились, и теперь ARES II заметно впереди новинки Nvidia только в легком и среднем режимах. А вот в тяжелом они близки по скорости. Понятно, что одночиповый Radeon HD 7970 сильно уступает им обеим. Ну а Geforce GTX Titan в целом показала себя просто отлично, новинка быстрее платы GTX 690, имеющей два GPU.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах, но некоторые тенденции продолжились. В этот раз по каким-то странным причинам показатели новой модели Geforce GTX Titan в легком режиме оказались очень слабыми, зато в тяжелом она более чем вдвое быстрее обеих плат на базе чипов GK104. Интересно, что скорость Radeon HD 7970 весьма приличная, хотя эта модель и немного отстала от Titan. Зато ARES II снова далеко впереди. Рассмотрим второй вариант этого же теста:

С усложнением задачи скорость всех решений Nvidia стала еще ниже, и особенно заметно видеокарты Geforce пострадали в легких режимах. Это позволило Radeon HD 7970 приблизиться к Titan в двух легких режимах, а плате компании Asus стать еще более недосягаемой. Результаты сегодняшней новинки снова оказались почти вдвое выше, чем у GTX 680 и GTX 690. Возможно, эти результаты можно объяснить сравнительно низкой ПСП решений компании Nvidia и ее нехваткой для этого теста.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Тест компании Futuremark хоть и не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нем достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Интересно, что свежая топовая модель Geforce GTX Titan отстала от двухчиповой GTX 690 лишь совсем немного, показав результат лучше, чем по теории. Новинка Nvidia стала и быстрейшей по текстурированию среди одночиповых плат, как и ожидалось.

Что касается сравнения скорости Geforce GTX Titan с парой конкурентов (Radeon HD 7970 и Asus ARES II на базе двух аналогичных GPU), то все более-менее соответствует теории — новинка компании Nvidia по текстурной скорости с запасом обгоняет одночиповую плату с меньшей ценой и уступает примерно столько же двухчиповой модели. Соответственно, для GK110 результат весьма неплохой — похоже, что эффективность TMU повысилась по сравнению с GK104. Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот в тесте производительности блоков ROP результат новинки явно слабее. Впрочем, это ожидалось. Мы ранее определили, что цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, чем производительность ROP. Но в нашем случае разница в скорости между GTX 680 и Titan говорит о том, что была измерена производительность именно ROP.

Что касается сравнения скорости Geforce GTX Titan с платами соперничающей компании AMD, то и тут все ожидаемо. Представленная недавно модель Nvidia показала достаточно высокую скорость заполнения сцены, опередив одночипового конкурента примерно на столько же, сколько и GTX 680, а вот с двухчиповой ARES II побороться не получилось по понятным причинам — ее скорость более чем удвоена. Похоже, что у новинки нет особых проблем с ограничением общей производительности пропускной способностью видеопамяти, как это иногда бывает, и она в данном случае имеет достаточную ПСП. Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Тест отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В данном случае, важнее математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Geforce GTX Titan обогнала с запасом GTX 680, приблизившись к двухчиповому варианту. Другими словами, дело в теоретической разнице по скорости текстурирования.

Radeon HD 7970 уступила новинке от Nvidia не так уж много, а лучшей в сравнении снова стала модель на базе двух чипов Tahiti, которая у нас является прототипом будущей Radeon HD 7990. Неплохой результат для Nvidia, в этом тесте их решения обычно уступают видеокартам на чипах AMD, особенно если брать платы Nvidia из низших ценовых диапазонов. Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим совершенно иную. Из-за влияния геометрических блоков получается, что все видеокарты производства Nvidia чувствуют себя в этом тестировании лучше конкурентов, обгоняя соответствующие по цене платы Radeon. Соответственно, даже Geforce GTX 680 опережает одночиповую плату верхнего уровня — Radeon HD 7970.

Рассматриваемая нами сегодня модель Geforce GTX Titan легко опережает одночиповые платы и немного не достает до двухчиповой GTX 690. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих улучшенный геометрический конвейер. Но, хотя у одночиповой платы Radeon скорость невысокая, второй чип Tahiti и разгон в ARES II позволяет сгладить недостаток скорости геометрических вычислений — эта плата снова быстрейшая. Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

И еще один геометрический тест из 3DMark Vantage. В сегодняшнем сравнении Geforce GTX Titan снова оказалась ровно между GTX 680 и GTX 690 и заметно опередила своего одночипового конкурента от AMD (но цены на эти платы разные, так что конкуренция лишь номинальная). Если сравнивать скорость новой Geforce GTX Titan с производительностью двухчипового соперника, то два Tahiti от компании AMD все же позволяют плате Asus стать лидером и в этом тесте, который обычно не столь приятен для AMD. Синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывают, что платы Nvidia в них несколько сильнее и в целом немного опережают соперников в таких задачах. Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории, но к тому же еще и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Нам давно известно, что видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с такими задачами, и почти всегда показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. И Radeon HD 7970 показывает отличный результат, лишь немного отставая от новинки Geforce GTX Titan — явно более дорогой модели компании Nvidia.

Что касается сравнения со своими собратьями, то рассматриваемая сегодня видеокарта Titan показала скорость, очень близкую к производительности двухчипового варианта на базе двух графических процессоров GK104. А одночиповая GTX 680 осталась далеко позади. Похоже, что возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче позволила бороться с соответствующими платами Radeon явно несколько успешнее. Впрочем, двухчиповый ARES II остается недосягаемым, да и Radeon HD 7990 будет быстрее одночипового Titan в этом тесте…

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Это далеко не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он показывает. Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат давно одинаковая, это у видеокарт с GPU предыдущих архитектур были различия, которых давно нет. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP. Двухчиповая Geforce GTX 690 работает слишком медленно, AFR-рендеринг не просто неэффективен, он делает только хуже.

Новая топовая плата компании Nvidia в этом тесте примерно на 25-27% опережает предыдущую одночиповую модель GTX 680, что говорит об упоре в производительность ROP. Впрочем, зато она настолько же опережает Radeon HDF 7970, насколько последняя обгоняет GTX 680. В общем, в этом тесте разница слишком мала и он не слишком показателен. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Картина в этом случае совершенно иная, как видите. Похоже, что у решений Nvidia есть явное преимущество в таких сложных расчетных задачах. Поэтому в этом тесте совершенно логично побеждает новая Geforce GTX Titan, а следом идет одночиповая плата на GK104. А Radeon HD 7970 довольствуется лишь третьим местом, да и то лишь потому, что неоптимизированный AFR-рендеринг на GTX 690 вновь показал себя во всей «красе».

Новая модель для энтузиастов Titan показывает на 40% большую скорость, по сравнению с видеокартой Geforce GTX 680, что примерно соответствует теории. Похоже на то, что в этом тесте упор именно в скорость исполнения математических вычислений, по крайней мере на платах Nvidia. Переходим к тестам производительности в задачах тесселяции, которые традиционно должны показать сильнейшую сторону новой платы.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга все платы упираются в ПСП, скорее всего, и результат новой видеокарты Nvidia примерно соответствует скорости Radeon HD 7970. Новинка от компании Nvidia опережает младшую сестру на треть и уступает двухчиповой модели — Geforce GTX 690, все в соответствии с теорией. Во втором подтесте с более сложными попиксельными расчетами все примерно так же, по скорости плата Titan расположилась между GTX 680 и GTX 690 и примерно там же находится единственный соперник от компании AMD. Эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN несколько выше, ведь GK110 гораздо сложнее Tahiti.

В самом интересном тесте с тесселяцией результат Radeon также неплох, но и только. В данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нем совсем не упирается в производительность блоков обработки геометрии. Поэтому скорости обработки треугольников у этой платы компании AMD вполне хватает, чтобы показывать результаты, аналогичные тому, что мы видим у GTX 680. Естественно, что у GTX 690 скорость выше, но у Geforce GTX Titan еще выше! И мы видим плюс одного большого чипа и в тесселяции.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжелых условиях графические процессоры Nvidia остаются заметно более производительными.

Анонсированная не так давно видеоплата Geforce GTX Titan основана на чипе GK110, который имеет большое количество геометрических блоков, по сравнению с GK104, который и сам довольно быстр, поэтому новинка становится лучшей во многих условиях, исключая самый сложный режим, где Titan слегка уступает двухчиповой карте Nvidia. Отличный результат! Естественно, что на скорость Radeon HD 7970 можно просто не смотреть, тесты тесселяции — явно не его конек.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали данную программу при четырех разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, старшая видеокарта компании AMD показывает достаточно высокий результат, даже лучше чем у Geforce GTX 680, то при увеличении геометрической работы платы компании Nvidia вырываются вперед, а производительность единственного Radeon заметно падает. Так что, хотя в текущей архитектуре компании AMD геометрическая производительность чипов была улучшена, в соответствующих синтетических тестах они сильно проигрывают решениям Nvidia.

А уж как тут расцвела Geforce GTX Titan! Новая топовая плата Nvidia во всех режимах показывает отличные результаты и лишь в сложных условиях начинает уступать двухчиповой плате GTX 690 на чипах GK104. Собственно, это и понятно, ведь в сумме у последней получается 16 движков PolyMorph, по сравнению с 14 у Titan, да еще работающих на меньшей частоте. В общем, результат для новинки просто отличный, именно для таких задач со сложнейшей геометрией и шейдерами она и подходит лучше всего — тут виден явный задел на будущее.

Выводы по синтетическим тестам

Результаты синтетических тестов топовой модели Geforce GTX Titan, основанной на мощнейшем графическом процессоре GK110 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia является самой мощной одночиповой видеокартой в большинстве задач и просто не имеет конкурентов, кроме двухчиповых решений на базе GPU меньшей сложности.

По синтетическим тестам превосходство новой модели в производительности перед Geforce GTX 680 примерно соответствует теории и было ожидаемо. За исключением нескольких редких тестов, новинка очень неплохо выступила по сравнению с самой мощной моделью Radeon HD 7970 от конкурирующей компании AMD, да и на фоне двухчиповой GTX 690 она не теряется. Наш набор синтетических тестов показал, что производительность Geforce GTX Titan в среднем находится где-то между скоростью моделей GTX 680 и GTX 690. С учетом отсутствия проблем многочипового AFR-рендеринга, для энтузиастов мы бы посоветовали именно это решение — новинка не слишком уступает двухчиповым платам вроде Geforce GTX 690 и грядущего Radeon HD 7990, но при этом обеспечит высокую скорость всегда, а не только при соответствующей оптимизации драйверов и отсутствии проблем совместимости.

В общем, исходя из теоретических данных и синтетических тестов, топовая видеокарта Geforce GTX Titan — это интересное предложение для тех энтузиастов, которые могут заплатить такие деньги за видеокарту, не пожалев об этом. Все-таки она стоит довольно дорого, а сверхтребовательных игр в последнее время выходит не так уж много, и та же Geforce GTX 680 с ними отлично справляется. В лице Titan рынок получил быстрейшее решение, с которым конкурентам придется бороться при помощи установки двух чипов на одну плату. В следующей части статьи мы проверим производительность новой модели в играх — это будет еще интереснее!

Nvidia Geforce Titan — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 Накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




18 марта 2013 Г.

Nvidia Geforce Titan. 2 — ,

Nvidia Geforce Titan:

, .

Gigabyte.

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E
  • GPU: Geforce Titan (GK110)
  • : PCI Express x16
  • GPU (ROPs): 837—876 ( — 837—876 )
  • ( ()): 1500 (6000) ( — 1500 (6000) )
  • : 384
  • GPU/ : 14/837—876 ( — 14/837—876 )
  • (ALU) : 192
  • (ALU): 2688
  • : 224 (BLF/TLF/ANIS)
  • (ROP): 48
  • : 270×100×37 ( 2 )
  • :
  • ( 3D/ 2D/ «»): 262/78/74
  • : 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • : SLI (Hardware)

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E
6144  GDDR5 SDRAM, 24 ( 12 PCB).

Samsung (GDDR5). 1500 (6000) .

,
Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

,
Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

, : 270×100 . 2 (, , , ). PCB Titan GTX 680, , ( GTX 680 — 256 8 , Titan — 384 24 ). 6 2 . NCP 4206 On Semiconductor.

: 2 DVI ( Single-Link VGA) DisplayPort HDMI ( DVI HDMI, 2 HDMI). , Nvidia , HDMI- , . , 4 ( Full HD), GTX 6xx, Titan, , .

:

  • 240 — ;
  • 2048×1536@85 — ;
  • 2560×1600@60 — ( DVI- Dual-Link/HDMI).

— 2007 , .

, : , .

.

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E
. , , , . , , ( ), . . .

, . , , — 2300 . , Nvidia.

. , ( , ). . , , , .

EVGA PrecisionX ( . AKA Unwinder) .

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E

6 82 , . , .

. .

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E
6- 8- . , DVI-to-VGA, HDMI-, : Gigabyte . !

.

Gigabyte Geforce Titan 6144 384- GDDR5 PCI-E

:

  • Intel Core i7-3960X (Socket 2011):
    • 2 Intel Core i7-3960X (o/c 4 );
    • Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • Intel Thermal Solution RTS2011LC;
    • Asus Sabertooth X79 Intel X79;
    • MSI X79A-GD45(8D) Intel X79;
    • 16 DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 ;
    • Seagate Barracuda 7200.14 3 SATA2;
    • WD Caviar Blue WD10EZEX 1 T SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 Corsair CMPSU-1200AXEU (1200 );
    • Corsair Obsidian 800D Full-Tower.
  • Windows 7 64-; DirectX 11;
  • Dell UltraSharp U3011 (30″);
  • AMD Catalyst 13.2beta7; Nvidia 314.09

VSync .

:

RightMark3D 2.0 MS Visual Studio 2005 runtime, DirectX runtime.

DirectX 11 SDK Microsoft AMD, Nvidia. -, HDRToneMappingCS11.exe NBodyGravityCS11.exe DirectX SDK (February 2010).

: Nvidia AMD. ATI Radeon SDK DetailTessellation11 PNTriangles11 ( DirectX SDK). Nvidia — Realistic Water Terrain, Island11.

:

  • Geforce GTX Titan ( GTX Titan)
  • Geforce GTX 690 ( GTX 690)
  • Geforce GTX 680 ( GTX 680)
  • Geforce GTX 680 SLI ( GTX 680 SLI)
  • Radeon HD 7970 ( HD 7970)
  • Asus ARES II — ( Asus ARES II)

Geforce GTX Titan . Geforce GTX 680 Titan , GK110 Kepler, , , . GTX 690 GTX 680 SLI , , GPU.

AMD . , AMD , — Asus, AMD Tahiti. , Radeon HD 7970 ( , Nvidia).

— Asus ARES II — , AMD Radeon HD 7990. , ARES II Geforce GTX Titan, , , .

Direct3D 9: Pixel Shaders

() 3DMark Vantage , , , : 1.1, 1.4 2.0, , .

, GPU, , . . . , , . , .

Nvidia — GK104 GTX 690. , Tahiti , — Radeon HD 7990 . :

Cook-Torrance , ALU , TMU. AMD, Geforce Kepler .

Nvidia GTX 680 GTX 690, . , , ALU, Water, , . Geforce GTX Titan, GPU .

Direct3D 9: Pixel Shaders 2.0

DirectX 9 , , , . 2.0:

  • Parallax Mapping — , « 3D-».
  • Frozen Glass — .

: . , :

, ALU, , . , AMD Nvidia.

AMD, , GPU ( AFR — , ). «Frozen Glass» , Radeon HD 7970 Nvidia, . Titan GTX 690, , GTX 680 SLI.

«Parallax Mapping» Nvidia GTX 680 GTX 690, , . Radeon HD 7970 - , ARES II . :

Nvidia , Geforce GTX Titan AMD, . Asus Tahiti , Frozen Glass. , Nvidia , Geforce GTX Titan .

, . , 3.0, Direct3D 9. , . , ALU, , :

  • Steep Parallax Mapping — «» parallax mapping, « 3D-».
  • Fur — , .

. DX9- RightMark Nvidia , AMD , — Radeon HD 7970, ARES II , — 2 , — !

Nvidia — GK104. . , ARES II, Radeon HD 7990, . Tahiti , .

Direct3D 10: PS 4.0 (, )

RightMark3D PS 3.0 Direct3D 9, DirectX 10, . , .

( ) ALU. , .

Fur. 15 30 . Effect detail — «High» 40—80, «» — 60—120 , «High» SSAA «» — 160 320 .

, , «Low» «High» .

TMU, . . «High» — , «Low».

, AMD Nvidia, GCN . Radeon , , , Tahiti 2,5-2,6 , .

, , Geforce GTX Titan Radeon HD 7970 ( ), Asus. , ( ROP). , Geforce, Nvidia , GTX 690, GTX 680.

, «» , : , - , :

, Geforce GTX Titan GTX 690 GTX 680. AMD , , , Radeon HD 7970 Titan. Nvidia GTX 680, AMD, .

DX10- . Steep Parallax Mapping 10 50 . , . 80 400 , . :

- Direct3D 10 , parallax mapping , , steep parallax mapping, , Crysis Lost Planet. , , , , — «High».

( SSAA), Geforce - . Nvidia AMD, Geforce GTX Titan D3D10- Radeon HD 7970, «HD 7990», , Nvidia. , .

, «Fur» — , , , . , , — Radeon HD 7970 .

Tahiti , Nvidia D3D10- . GTX 680 GTX 680 — GK104. , Titan 45% GTX 680, GTX 690 GK104. , .

Direct3D 10: PS 4.0 ()

TMU. , , .

— Mineral. , 65 sin cos.

- , . AMD Radeon HD 7970, Asus ARES II — .

AMD Nvidia, Kepler , Geforce . . Geforce GTX Titan , GTX 680, , Radeon HD 7970 ( , AMD ).

, Fire. ALU, , sin cos , 130. , :

. , Radeon HD 7970 , . Nvidia AMD, Radeon HD 7970. GK104 — GTX 690, GTX 680 . .

Direct3D 10:

RightMark3D 2.0 , «Galaxy», «point sprites» Direct3D. GPU, , . DirectX 10.

, , . «GS load» , — . .

«Galaxy», , :

, , FPS . , .

Nvidia AMD, GPU, . . AMD , , Nvidia .

, Geforce GTX Titan , «» , GTX 690. — Radeon HD 7970 , GTX 680 . , :

AMD Nvidia. GS load, , . Geforce GTX Titan GTX 680 GTX 690 Radeon HD 7000.

ARES II Asus, - — 8- 8- 6- . — , , .

«Hyperlight» — , : instancing, stream output, buffer load. , Direct3D 10 — stream output. , , , . 14 , .

«», «GS load», «Heavy» — . , «Balanced» «» , «instancing», «Heavy» .

« » — . GTX 690 , , ARES II . : , «Polygon count» .

, , . Geforce GTX Titan Kepler, Radeon HD 7970 . , . , «Balanced» «Heavy».

— AMD , GK104, Titan GK110. , Nvidia , . , , , , Geforce GTX 680 Titan . — « » .

Direct3D 10:

«Vertex Texture Fetch» . , , «Earth» «Waves» . displacement mapping , , «Waves» , «Earth» — .

«Earth», «Effect detail Low»:

, , . Nvidia - , Radeon AFR-. .

. Geforce GTX Titan , -, ! «» ARES II, , Geforce GTX Titan — GTX 690 ! :

— AMD , ARES II Nvidia . . , Radeon HD 7970 . Geforce GTX Titan , GTX 690, GPU.

. «Waves» , . 14 («Effect detail Low») 24 («Effect detail High») . .

«Waves» , , . - Geforce GTX Titan , GK104. , Radeon HD 7970 , Titan. ARES II . :

Nvidia , Geforce . Radeon HD 7970 Titan , Asus . , GTX 680 GTX 690. , Nvidia .

3DMark Vantage: Feature

3DMark Vantage , . Feature DirectX 10 , . Nvidia - , RightMark.

Feature Test 1: Texture Fill

— . , , .

Futuremark , AMD Nvidia . , Geforce GTX Titan GTX 690 , , . Nvidia , .

Geforce GTX Titan (Radeon HD 7970 Asus ARES II GPU), - — Nvidia . , GK110 — , TMU GK104.

Feature Test 2: Color Fill

— . , . (render target) -. 16- FP16, , HDR-, .

ROP . , . , 3DMark Vantage ROP (. . « »), , ROP. GTX 680 Titan , ROP.

Geforce GTX Titan AMD, . Nvidia , , GTX 680, ARES II — . , , , .

Feature Test 3: Parallax Occlusion Mapping

feature-, . (, ) Parallax Occlusion Mapping, . . Strauss. , , Strauss.

, , , . GPU, . , , 3DMark Vantage Geforce GTX Titan GTX 680, . , .

Radeon HD 7970 Nvidia , Tahiti, Radeon HD 7990. Nvidia, AMD, Nvidia .

Feature Test 4: GPU Cloth

, ( ) . , , . stream out . , stream out.

, , . - , Nvidia , Radeon. , Geforce GTX 680 — Radeon HD 7970.

Geforce GTX Titan GTX 690. , Nvidia, . , Radeon , Tahiti ARES II — .

Feature Test 5: GPU Particles

, . , . Stream out , . , , .

RightMark3D 2.0, , , . , stream out.

3DMark Vantage. Geforce GTX Titan GTX 680 GTX 690 AMD ( , ). Geforce GTX Titan , Tahiti AMD Asus , AMD. 3DMark Vantage, , , Nvidia .

Feature Test 6: Perlin Noise

feature- Vantage - , Perlin noise . . Perlin noise — , , .

Futuremark, , , . , , RightMark 2.0.

, Radeon AMD, GCN, , , , . Radeon HD 7970 , Geforce GTX Titan — Nvidia.

, Titan , GK104. GTX 680 . , Kepler Radeon . , ARES II , Radeon HD 7990 Titan …

Direct3D 11:

Nvidia , DirectX 11, , (SDK) Microsoft, Nvidia AMD.

, (Compute) . — DX API, : , . . HDR- tone mapping DirectX SDK, , .

, . , GPU , . , , , ROP. Geforce GTX 690 , AFR- , .

Nvidia 25-27% GTX 680, ROP. , Radeon HDF 7970, GTX 680. , . Microsoft DirectX SDK, N (N-body) — , , .

, . , Nvidia . Geforce GTX Titan, GK104. Radeon HD 7970 , , AFR- GTX 690 «».

Titan 40% , Geforce GTX 680, . , , Nvidia. , .

Direct3D 11:

, Direct3D 11 . Nvidia GF100. DX11-, STALKER: , DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 . , — .

(). , phong tessellation, PN triangles, Catmull-Clark subdivision. , PN Triangles STALKER: , Metro 2033 — Phong tessellation. , .

Detail Tessellation ATI Radeon SDK. , : parallax occlusion mapping. , DX11- AMD Nvidia :

, , Nvidia Radeon HD 7970. Nvidia — Geforce GTX 690, . , Titan GTX 680 GTX 690 AMD. GCN , GK110 Tahiti.

Radeon , . . AMD , , , GTX 680. , GTX 690 , Geforce GTX Titan ! .

3D- ATI Radeon SDK — PN Triangles. , DX SDK, , . (tessellation factor), , .

, . , , Nvidia .

Geforce GTX Titan GK110, , GK104, , , , Titan Nvidia. ! , Radeon HD 7970 , — .

— Nvidia Realistic Water Terrain, Island. (displacement mapping) .

Island GPU, , , GPU, , .

( Dynamic Tessellation LOD). , , AMD , Geforce GTX 680, Nvidia , Radeon . , AMD , Nvidia.

Geforce GTX Titan! Nvidia GTX 690 GK104. , , 16 PolyMorph, 14 Titan, . , , — .

Geforce GTX Titan, GK110 Kepler, , Nvidia , GPU .

Geforce GTX 680 . , Radeon HD 7970 AMD, GTX 690 . , Geforce GTX Titan - GTX 680 GTX 690. AFR-, — Geforce GTX 690 Radeon HD 7990, , .

, , Geforce GTX Titan — , , . - , , Geforce GTX 680 . Titan , . — !

Nvidia Geforce Titan — 3: →

2 Corsair CMPSU-1200AXEU Corsair

Corsair Obsidian 800D-Full Tower Corsair

Corsair Vengeance CMZ16GX3M4X1600C9 Corsair

Corsair Hydro SeriesT H100i CPU Cooler Corsair

Dell UltraSharp U3011

Asus Sabertooth X79 AsusTeK

MSI X79A-GD45(8D) MSI

Seagate Barracuda 7200.14 3 Seagate

SSD OCZ Octane 512 OCZ Russia

2 SSD Corsair Neutron SeriesT 120 Corsair