Nvidia Geforce GTX 750 Ti:

описание видеокарты и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референс-карта.

Платa

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
  • GPU: Geforce GTX 750 Ti (GM107)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1020—1150 МГц (номинал — 1020—1150 МГц)
  • Частота работы памяти (физическая (эффективная)): 1350 (5400) МГц (номинал — 1350 (5400) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 5/1020—1150 МГц (номинал — 5/1020—1150 МГц)
  • Число операций (ALU) в блоке: 128
  • Суммарное число операций (ALU): 640
  • Число блоков текстурирования: 40 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 150×100×35 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 64/35/15 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×Mini-HDMI 1.4a
  • Поддержка многопроцессорной работы: SLI

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах 4Gb (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Поскольку ускоритель имеет самую простую на сегодня шину обмена с памятью в 128 бит, то и плата получилась очень простой. К тому же, как известно, семейство Maxwell имеет пониженное энергопотребление, которое у GTX 750 Ti укладывается в 75 Вт, поэтому дополнительного питания не требуется. Впрочем, разводка PCB показывает, что все же на всякий случай плату снабдили посадочным местом под разъем дополнительного питания — вероятно, для сильно разогнанных версий партнеров Nvidia, которые воспользуются референс-дизайном.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместим с выводом на HDMI) и один порт Mini-HDMI (суммарно можно подключить 2 приемника с HDMI или с DVI при наличии соответствующих переходников). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Повторим, что карта не требует дополнительного питания.

О системе охлаждения.

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
Основой СО является небольшой центральный округлый радиатор, имеющий обычный вентилятор.

Собственно, для таких карт и не требуется мощная СО. Полагаю, что партнеры Nvidia смогут выпустить даже модели с пассивным охлаждением. Вентилятор работает на небольших оборотах, так что шума практически не производит.

Микросхемы памяти и силовые транзисторы — без охлаждения.

Мы провели исследование температурного режима с помощью версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 67 градусов, что является очень хорошим результатом.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.1; Nvidia версии 334.89.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:


Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 750 Ti со стандартными параметрами (далее GTX 750 Ti)
  • Geforce GTX 650 Ti Boost со стандартными параметрами (далее GTX 650 Ti+)
  • Geforce GTX 650 Ti со стандартными параметрами (далее GTX 650 Ti)
  • Geforce GTX 650 со стандартными параметрами (далее GTX 650)
  • Radeon R7 260X со стандартными параметрами (далее R7 260X)
  • Radeon R7 260 со стандартными параметрами (далее R7 260)

Для анализа результатов новой видеокарты Geforce GTX 750 Ti были выбраны именно эти решения по следующим причинам. Geforce GTX 650 Ti Boost и Geforce GTX 650 Ti являются теми моделями, на смену которым пришла новинка (мы в основном сравнивали с Boost-вариантом, кроме D3D9 и D3D11 тестов). Ну а Geforce GTX 650 является моделью компании предыдущего поколения, которая стоит в линейке на ступень ниже рассматриваемой нами сегодня GTX 750 Ti.

Из стана конкурирующей компании AMD для нашего сравнения были выбраны две видеоплаты, основанные на одинаковом графическом процессоре, но отличающиеся по производительности и цене. Сложно сказать, какая именно модель является конкурентом для GTX 750 Ti, так как даже Radeon R7 260X стоит чуть дешевле ее, а Radeon R7 265 у нас пока что нет. Ну а Radeon R7 260 взят просто ради интереса, так как эта модель продается значительно дешевле.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С такими тестами все современные GPU справляются с легкостью, и скорость даже бюджетных решений упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia так и вовсе давно перестали оптимизироваться для них, что прекрасно видно по не слишком впечатляющим результатам GTX 750 Ti.

Новая модель видеокарты Nvidia в этом сравнении в трех из тестов уступает решению предыдущего поколения на более мощном чипе на 13-15%, но в двух самых сложных задачах расчета освещения, где важна математическая производительность, выигрывает до 18%! Естественно, что новинка в этих тестах уступает обеим платам серии Radeon R7 260 во всех тестах, кроме последнего. В общем, платы Nvidia в этом сравнении продолжают уступать всем моделям Radeon. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Здесь мы снова видим не совсем привычный результат, если сравнивать видеокарты Nvidia — в одном из тестов новинка чуть впереди, а в другом — серьезно уступает предшественнице. Тест Cook-Torrance вычислительно интенсивный, и скорость в нем больше зависит от количества ALU и их частоты, поэтому GTX 750 Ti показала в нем хороший результат, даже немного обогнав GTX 650 Ti. И даже с учетом того, что этот тест исторически лучше подходит для графических решений компании AMD, новая плата Geforce на базе архитектуры Maxwell в нем показала сильный результат на уровне Radeon R7 260X, что подтверждает высокую математическую производительность GM107.

В тесте Water, скорость в котором больше зависит от текстурирования, мы видим совершенно другое, ведь по скорости текстурирования новая модель уступает Geforce из предыдущего поколения, причем ощутимо — почти 30%, в чем явно виноват упор или в текстурирование или в пропускную способность памяти. Собственно, в этом тесте новинка уступает вообще всем представленным в сравнении решениям, в том числе обеим платам AMD.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD GCN выступает значительно лучше графической архитектуры Nvidia Kepler. Оказалось, что и Maxwell не особенно изменила это положение.

Впрочем, все снова зависит от теста. В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае плат Nvidia всегда есть непонятная преграда, из-за которой они упираются во что-то (это видно по паре Geforce) и проигрывают аналогичным по цене платам Radeon. Новая модель Geforce оказывается в этом тесте на уровне предшественницы и серьезно уступает Radeon R7 260X и 260.

А вот во втором тесте «Parallax Mapping» новая видеокарта Geforce GTX 750 Ti показала производительность на треть выше, чем GTX 650 Ti, что говорит о влиянии математической производительности, которая у новинки достаточно высока. Даже если сравнивать с платами Radeon, то плата на GM107 почти догнала R7 260X. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение видеоплат Nvidia улучшилось совсем чуть-чуть, так как они справляются с текстурными выборками несколько лучше конкурентов. Но в случае Geforce GTX 750 Ti это помогло не сильно, так как у нее меньше всего блоков TMU. Новинка все равно остается позади быстрейшего из конкурентов в обоих тестах, особенно в Frozen Glass. GTX 750 Ti даже чуть медленнее своей предшественницы, что снова говорит об относительной слабости текстурирования.

Но это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. И когда дело коснулось самых тяжелых DX9-тестов из первой версии пакета RightMark, то новая видеокарта производства Nvidia показала результат, превосходящий производительность Geforce предыдущего поколения. Впрочем, платы AMD на чипах архитектуры GCN все равно остаются впереди.

Новинка компании Nvidia показывает в этих задачах неплохой результат, обойдя на 4-8% модель предыдущего поколения Geforce GTX 650 Ti, а вот что касается сравнения с конкурентами AMD, то тут дела не так радостны. Новинка может и способна конкурировать с младшей из Radeon, но от старшей отстает в обоих тестах. Решения AMD явно быстрее представленной недавно Geforce, хотя в тесте Fur новая плата уступает не так уж сильно, хотя в тесте продвинутого параллакс-маппинга разница оказалась почти полуторакратной.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая видеокарта Geforce GTX 750 Ti заметно быстрее платы на чипе GK107 предыдущего поколения (чуть ли не вдвое), но уступает плате на базе GK106 около 13-18%, в свою очередь. Преимущество в этом тесте все равно у обеих видеокарт Radeon и оно весьма существенное. В этой задаче новинка Nvidia явно не может ничего им противопоставить. Снова в этом тесте для Nvidia все очень печально, ведь даже самый слабый Radeon опережает все Geforce.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Положение (плачевное для видеокарт Nvidia в этой задаче) изменилось не слишком сильно. Свежая модель Geforce GTX 750 Ti все так же обгоняет только младшую сестру GTX 650, и оказывается уже на 17-23% медленнее модели с приставкой Boost — все-таки GK106 во многих задачах явно быстрее GM107, что соответствует и теории. Проигрыш прямым конкурентам в виде пары Radeon R7 260 и 260X снова чуть ли не двукратный. Увы, но преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения SSAA, хотя в этот раз Geforce GTX 750 Ti отстает от GTX 650 Ti Boost немного меньше — лишь 9-13%, но все же уступает. Конечно, новинка значительно опережает младшую модель Geforce GTX 650 на базе чипа GK107, но это было понятно уже из теории. Что касается пары Radeon, то и R7 260X и R7 260 все также быстрее всех видеокарт Nvidia, которые в этом тесте снова справляются с работой заметно хуже конкурирующих решений. Посмотрим, что изменит включение суперсэмплинга:

Мало что изменилось и в этот раз, хотя при включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась немного, но этого хватило, чтобы разница между GTX 750 Ti и GTX 650 Ti Boost лишь увеличилась до 13-19%, понятно в какую пользу.

Увы, но мы в очередной раз увидели, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают куда более эффективно, по сравнению с конкурирующими Geforce, и старшая плата Nvidia на чипе GM107 серьезно уступает не только обеим платам серии Radeon R7 260, но и отстает от GTX 650 Ti Boost, которую, по идее, должна заменять на рынке. Что ж, может быть в чисто вычислительных задачах у новинки получится лучше.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на них влияет и разная эффективность их использования в конкретных решениях и оптимизация драйверов. В случае теста Mineral, новая модель Geforce GTX 750 Ti выступила просто отлично, более чем вдвое обогнав младшую модель GTX 650 и на 10% опередив GTX 650 Ti Boost — наконец-то мы увидели такую задачу, где новинка показала свою силу.

Да и по сравнению с Radeon все стало куда лучше, чем раньше. Архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Maxwell инженеры калифорнийской компании значительно увеличили число потоковых процессоров, поэтому пиковая математическая производительность Geforce GTX 750 Ti серьезно возросла. И в первом же математическом тесте новая видеокарта Geforce хоть и уступает лучшей плате компании AMD, но это уже всего лишь жалкие 4%, а Radeon R7 260 и вовсе остался позади. Отличная работа по устранению слабых мест предыдущих архитектур!

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Разница между Geforce GTX 750 Ti и GTX 650 Ti Boost выросла до 17%, а GTX 650 и вовсе неприлично отстала. Что же касается конкуренции с Radeon, то новинка Nvidia в этот раз слегка отступила, совсем чуть-чуть опередив Radeon R7 260 и проиграв старшей R7 260X уже 18%.

В любом случае, с учетом вдвое меньшего энергопотребления платой на основе GM107, результаты в тестах пиковой математической производительности Nvidia явно подтянула, и это очень важно для них. Представьте, что было бы при сравнении R7 260X (да пусть даже R7 265) с гипотетическим GM106 — чипом большей сложности, с большим количеством исполнительных блоков и пропускной способностью памяти.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Отлично заметна разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Наша новинка Geforce GTX 750 Ti справляется с задачей явно не хуже заменяемой ей модели GTX 650 Ti Boost, и даже немного (5-6%) обгоняет ее. Сравнивать новинку с платами Radeon нет смысла, у решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются много быстрее конкурентов. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новая модель Geforce показала скорость, идентичную производительности GTX 650 Ti Boost, и обе они вдвое быстрее Geforce GTX 650, а обе платы Radeon еще хуже, так что в выводах ничего не меняется.

К сожалению, но «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании и ошибка не исправлена уже много месяцев.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены еще чем-то странным, и разница между скоростью рендеринга в разных режимах лишь подтверждает эту аномалию.

Собственно, по разнице между GTX 750 Ti и GTX 650 Ti Boost видно, что дело в ПСП, так как новинка отстала на 15-20%. Впрочем, GTX 650 отстала еще заметно сильнее, так что дело явно не только в ширине шины и частоте видеопамяти. Самой быстрой в сравнении стала GTX 650 Ti Boost, а же за ней идет плотная группа из выпущенной недавно новой модели Geforce GTX 750 Ti и пары Radeon R7 260 и 260X, которые весьма близки, особенно в более сложных условиях. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме изменилась — решения компании AMD в тяжелых режимах потеряли ощутимо больше, по сравнению с платами Geforce. И теперь во всех режимах лидирует Geforce GTX 650 Ti Boost, а новая модель Nvidia слегка отстает от нее в легком режиме, заметно опережая в тяжелом. Прямые конкуренты Geforce GTX 750 Ti уступают ей во всех режимах, кроме самого простого.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах, но в тяжелых режимах первенствуют платы семейства Radeon R7 260. Новая видеокарта Nvidia оказалась на 1-3% (в пределах погрешности) быстрее заменяемой модели GTX 650 Ti Boost, и обе они заметно быстрее младшей видеоплаты. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в тяжелых режимах. Новая платы на чипе GM107 во всех режимах уступила 4-6% своей сестре GTX 650 Ti Boost, обе они быстрее младшей GTX 650. А вот сравнение с платами AMD не совсем однозначное. Если в легком режиме все платы кроме GTX 650 идут почти наравне, то в тяжелом Radeon R7 260X явно сильнее пары Geforce.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Geforce GTX 750 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Старшая модель нового семейства Geforce GTX 750 в этом тесте почти на 30% медленнее GTX 650 Ti Boost, что примерно соответствует теоретической разнице по скорости текстурирования. В свою очередь, новинка ощутимо быстрее младшей GTX 650 — по сути, по скорости текстурирования она где-то между этими двумя видеокартами прошлого поколения.

Что касается сравнения скорости новой платы Nvidia с решениями конкурента, то новинка по текстурной скорости явно уступает и Radeon R7 260 и 260X, что также ожидаемо и соответствует теоретическим показателям. Такое отставание понятно, ведь GM107 по сути ближе к уровню GK107, чем к более сложным чипам GK106 и Bonaire. Мы уж не говорим об энергопотреблении.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот в тесте производительности блоков ROP результат у анонсированной недавно видеоплаты Nvidia получился очень неплохим — лишь на 14% ниже, чем у модели на более сложном чипе предыдущего поколения, а Geforce GTX 650 отстала от них очень сильно — сказывается более высокая эффективность новинки, в том числе изменения в подсистеме памяти, ведь цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»).

Geforce GTX 750 Ti с запасом обгоняет и Radeon R7 260 и 260X, по каким-то причинам обе платы AMD показывают в этом тесте низкую скорость заполнения сцены, по сравнению с тем, что должно быть по теории, ведь по ней R7 260X по всем параметрам (ПСП, ROP) должна быть быстрее новой платы Nvidia.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 750 Ti и не отстает и не обгоняет старшую модель из семейства GTX 650. А вот младшая осталась далеко позади, почти вдвое проиграв обеим платам более высокого уровня. Графические процессоры производства компании AMD являются более эффективными в этой конкретной задаче, но Geforce GTX 750 Ti проигрывает младшей из них не так много. Старшая, впрочем, далеко впереди, а ведь даже она стоит дешевле новинки Nvidia.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, но основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров, но картина на диаграмме в очередной раз получилась странная и необъяснимая исходя из одного-двух теоретических параметров.

Старшая модель семейства Geforce GTX 750, которую мы сегодня рассматриваем, показывает скорость на 9% хуже, чем Geforce GTX 650 Ti Boost, и обгоняет оставшуюся последней GTX 650, как и должно быть по теории. Удивительно то, что, несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с решениями конкурента, все Geforce уступают обеим представленным платам Radeon.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация изменилась на противоположную, и теперь уже видеокарты Nvidia первенствуют по скорости рендеринга. Разве что Geforce GTX 650 отстала от всех, снова став последней, что вполне объяснимо, ведь графический процессор GK107 является самым слабым.

Новая Geforce GTX 750 Ti на 17% отстает от GTX 650 Ti Boost, что многовато, явно ей не хватает ПСП или скорости текстурирования — судя по результатам, упор есть не только в геометрическую производительность. Если сравнивать скорость новинки с конкурирующими платами Radeon, то новая модель Nvidia оказалась все же быстрее их в этой задаче — синтетический тест имитации частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывает, что платы Nvidia опережают конкурирующие модели AMD.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений уже не совсем соответствует теории, и не слишком близка к тому, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Новинка Nvidia из серии Geforce GTX 700 лишь на 4% отстала от GTX 650 Ti Boost (и все же она отстала), что подтверждает теоретические показатели, а младшая GTX 650 показывает скорость снова чуть ли не вдвое хуже старших моделей. Впрочем, неплохая скорость относительно других моделей Nvidia не позволяет новинке сражаться на равных с видеокартами Radeon компании AMD, так как архитектура GCN отлично справляется с подобными задачами и показывает лучшие результаты в случаях, когда выполняется интенсивная «математика». И GTX 750 Ti немного не дотянулась даже до Radeon R7 260 в этом тесте, не говоря уже о старшей модели.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно практически одинаковая, хотя у видеокарт с GPU предыдущих архитектур были явные различия. Судя по нашим последним исследованиям, результаты в этой задаче явно зависят не от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности ROP.

А в этот раз нам и вовсе не удастся сделать какие-либо выводы, ибо абсолютно все решения показали близкие результаты — разница между лучшей и худшей цифрой не превышает и 8%. Радует то, что новая плата компании Nvidia среди лидеров даже в таких условиях, но все же данный тест для нас практически бесполезен.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот второй DX11-тест показал первый (а возможно и единственный) сенсационный результат, который можно объяснить разве что увеличившейся эффективностью выполнения определенных вычислительных задач. В этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями.

Решения Nvidia в подобных расчетных задачах в принципе выглядят неплохо, но ведь и новые платы Radeon также справляются на отлично с этой задачей. Но все они померкли перед эффективностью Geforce GTX 750 Ti, которая показала лучший результат, опередив Radeon R7 260X на 22%. При этом новинка более чем в полтора раза опередила свою предшественницу на базе чипа GK106, теоретически более сложного и мощного. Похоже, что так повлияли архитектурные улучшения, связанные с увеличением эффективности вычислений, о которых мы писали в предыдущей части.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты Nvidia явно выше, чем у платы предыдущего поколения. Впрочем, обе видеокарты AMD имеют высокую ПСП и прекрасно справляются с этой простой задачей — они обогнали новую модель Geforce с хорошим запасом.

Во втором подтесте с более сложными попиксельными расчетами все сложилось практически так же. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN явно выше, чем у Kepler и... теперь уже Maxwell. По сути, разницы в этом случае между GTX 650 Ti и GTX 750 Ti никакой нет, поэтому рассматриваемая сегодня плата Nvidia проиграла даже Radeon R7 260, не говоря о более мощной модификации.

Да и в подтесте с тесселяцией новинка также отстала от соперников производства компании AMD. Модель Geforce GTX 750 Ti явно опередила свою сестру, но заметно уступила платам семейства Radeon R7. Это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, и скорости обработки треугольников у платы компании AMD вполне хватает.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере в сложных режимах применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит иные выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжелых условиях графический процессоры Nvidia все же производительнее.

Рассматриваемая сегодня модель Geforce GTX 750 Ti отстает от всех остальных во всех легких режимах, хотя разница с GTX 650 Ti невелика. Зато в самой сложной конфигурации с большим количеством геометрии она явно вырвалась вперед. Так что выводы именно по тесселяции таковы: новая видеокарта Nvidia быстрее соответствующих плат Radeon в сложных условиях, когда скорость последних сильно падает, а у плат Geforce остается достаточно высокой.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы протестировали представленные в материале решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Интересно, что даже при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon теперь отстают от Geforce GTX 750 Ti, хотя с GTX 650 Ti они справлялись. В целом, платы компании AMD показывают достаточно высокие результаты только при легких условиях, а при увеличении геометрической работы производительность всех Radeon заметно снижается, и платы компании Nvidia вырываются далеко вперед.

Видеокарты Nvidia в этом тесте всегда очень быстры, а новая модель Geforce GTX 750 Ti так и вовсе оказалась даже в самых сложных условиях на 22% быстрее Geforce предыдущего поколения на графическом процессоре архитектуры Kepler. Естественно, что сравнение с платами AMD не в их пользу, в сложном режиме они отстают от новинки чуть ли не вдвое. Впрочем, мы не устаем повторять, что в играх геометрическая нагрузка всегда в разы ниже, и возможности видеокарт в них не ограничены производительностью геометрических блоков.


В целом, результаты синтетических тестов новой видеоплаты Nvidia Geforce GTX 750 Ti, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали неоднозначные результаты. С одной стороны, новая плата Nvidia явно показывает очень хорошую энергоэффективность, оказываясь по производительности в тестах почти на уровне Geforce GTX 650 Ti (Boost) — плат предыдущего поколения на куда более сложном видеочипе с почти вдвое большим потреблением энергии. То же самое касается и конкурентов AMD, все они потребляют куда больше энергии, но обеспечивают лишь чуть более высокую скорость.

То есть, чисто технически видеокарта на чипе GM107 показала себя отлично, явно став самой энергоэффективной видеокартой в истории. У нее есть некоторые «узкие» места, вроде относительно малой скорости текстурирования и явно низкой пропускной способности памяти, которые мешают в ряде случае, но эти случаи редки. Но есть важное «но» — на рынке куда важнее стоимость решений, на которую в первую очередь смотрят покупатели. И тут для Geforce GTX 750 Ti уже далеко не все столь радужно. Новинка явно имеет завышенную цену и стоит дороже конкурирующей модели в виде Radeon R7 260X, показывая скорость примерно на том же уровне.

Иными словами, подобная плата на видеочипе GM107 стала бы прекрасным выбором и самым выгодным предложением на рынке, если бы она была выпущена в соответствующем ценовом диапазоне. Выйди она ступенью ниже, заместив не Geforce GTX 650 Ti Boost, которая явно побыстрее, и не GTX 650 Ti, которая то быстрее, то медленнее, а обычную GTX 650 без суффикса «Ti» — в таком случае это был бы бестселлер по соотношению цены и производительности, а не только по энергоэффективности. Увы, но наш набор синтетических тестов показал, что по производительности новая плата Nvidia способна соперничать лишь с Radeon R7 260X, как максимум, а ведь эта модель AMD стоит заметно дешевле. Чтобы сделать окончательные выводы, посмотрим реальную производительность новинки в играх в следующей части нашего материала и оправданность ее розничной цены уже с учетом скорости в игровых приложениях.


Nvidia Geforce GTX 750 Ti — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek




Дополнительно

Обзор нового видеоускорителя Nvidia Geforce GTX 750 Ti. Часть 2 — Особенности видеокарты, результаты синтетических тестов

Nvidia Geforce GTX 750 Ti:

описание видеокарты и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референс-карта.

Платa

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
  • GPU: Geforce GTX 750 Ti (GM107)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1020—1150 МГц (номинал — 1020—1150 МГц)
  • Частота работы памяти (физическая (эффективная)): 1350 (5400) МГц (номинал — 1350 (5400) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 5/1020—1150 МГц (номинал — 5/1020—1150 МГц)
  • Число операций (ALU) в блоке: 128
  • Суммарное число операций (ALU): 640
  • Число блоков текстурирования: 40 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 150×100×35 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 64/35/15 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×Mini-HDMI 1.4a
  • Поддержка многопроцессорной работы: SLI

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах 4Gb (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Поскольку ускоритель имеет самую простую на сегодня шину обмена с памятью в 128 бит, то и плата получилась очень простой. К тому же, как известно, семейство Maxwell имеет пониженное энергопотребление, которое у GTX 750 Ti укладывается в 75 Вт, поэтому дополнительного питания не требуется. Впрочем, разводка PCB показывает, что все же на всякий случай плату снабдили посадочным местом под разъем дополнительного питания — вероятно, для сильно разогнанных версий партнеров Nvidia, которые воспользуются референс-дизайном.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместим с выводом на HDMI) и один порт Mini-HDMI (суммарно можно подключить 2 приемника с HDMI или с DVI при наличии соответствующих переходников). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Повторим, что карта не требует дополнительного питания.

О системе охлаждения.

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E
Основой СО является небольшой центральный округлый радиатор, имеющий обычный вентилятор.

Собственно, для таких карт и не требуется мощная СО. Полагаю, что партнеры Nvidia смогут выпустить даже модели с пассивным охлаждением. Вентилятор работает на небольших оборотах, так что шума практически не производит.

Микросхемы памяти и силовые транзисторы — без охлаждения.

Мы провели исследование температурного режима с помощью версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 750 Ti 2048 МБ 128-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 67 градусов, что является очень хорошим результатом.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.1; Nvidia версии 334.89.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:


Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 750 Ti со стандартными параметрами (далее GTX 750 Ti)
  • Geforce GTX 650 Ti Boost со стандартными параметрами (далее GTX 650 Ti+)
  • Geforce GTX 650 Ti со стандартными параметрами (далее GTX 650 Ti)
  • Geforce GTX 650 со стандартными параметрами (далее GTX 650)
  • Radeon R7 260X со стандартными параметрами (далее R7 260X)
  • Radeon R7 260 со стандартными параметрами (далее R7 260)

Для анализа результатов новой видеокарты Geforce GTX 750 Ti были выбраны именно эти решения по следующим причинам. Geforce GTX 650 Ti Boost и Geforce GTX 650 Ti являются теми моделями, на смену которым пришла новинка (мы в основном сравнивали с Boost-вариантом, кроме D3D9 и D3D11 тестов). Ну а Geforce GTX 650 является моделью компании предыдущего поколения, которая стоит в линейке на ступень ниже рассматриваемой нами сегодня GTX 750 Ti.

Из стана конкурирующей компании AMD для нашего сравнения были выбраны две видеоплаты, основанные на одинаковом графическом процессоре, но отличающиеся по производительности и цене. Сложно сказать, какая именно модель является конкурентом для GTX 750 Ti, так как даже Radeon R7 260X стоит чуть дешевле ее, а Radeon R7 265 у нас пока что нет. Ну а Radeon R7 260 взят просто ради интереса, так как эта модель продается значительно дешевле.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С такими тестами все современные GPU справляются с легкостью, и скорость даже бюджетных решений упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia так и вовсе давно перестали оптимизироваться для них, что прекрасно видно по не слишком впечатляющим результатам GTX 750 Ti.

Новая модель видеокарты Nvidia в этом сравнении в трех из тестов уступает решению предыдущего поколения на более мощном чипе на 13-15%, но в двух самых сложных задачах расчета освещения, где важна математическая производительность, выигрывает до 18%! Естественно, что новинка в этих тестах уступает обеим платам серии Radeon R7 260 во всех тестах, кроме последнего. В общем, платы Nvidia в этом сравнении продолжают уступать всем моделям Radeon. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Здесь мы снова видим не совсем привычный результат, если сравнивать видеокарты Nvidia — в одном из тестов новинка чуть впереди, а в другом — серьезно уступает предшественнице. Тест Cook-Torrance вычислительно интенсивный, и скорость в нем больше зависит от количества ALU и их частоты, поэтому GTX 750 Ti показала в нем хороший результат, даже немного обогнав GTX 650 Ti. И даже с учетом того, что этот тест исторически лучше подходит для графических решений компании AMD, новая плата Geforce на базе архитектуры Maxwell в нем показала сильный результат на уровне Radeon R7 260X, что подтверждает высокую математическую производительность GM107.

В тесте Water, скорость в котором больше зависит от текстурирования, мы видим совершенно другое, ведь по скорости текстурирования новая модель уступает Geforce из предыдущего поколения, причем ощутимо — почти 30%, в чем явно виноват упор или в текстурирование или в пропускную способность памяти. Собственно, в этом тесте новинка уступает вообще всем представленным в сравнении решениям, в том числе обеим платам AMD.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD GCN выступает значительно лучше графической архитектуры Nvidia Kepler. Оказалось, что и Maxwell не особенно изменила это положение.

Впрочем, все снова зависит от теста. В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае плат Nvidia всегда есть непонятная преграда, из-за которой они упираются во что-то (это видно по паре Geforce) и проигрывают аналогичным по цене платам Radeon. Новая модель Geforce оказывается в этом тесте на уровне предшественницы и серьезно уступает Radeon R7 260X и 260.

А вот во втором тесте «Parallax Mapping» новая видеокарта Geforce GTX 750 Ti показала производительность на треть выше, чем GTX 650 Ti, что говорит о влиянии математической производительности, которая у новинки достаточно высока. Даже если сравнивать с платами Radeon, то плата на GM107 почти догнала R7 260X. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение видеоплат Nvidia улучшилось совсем чуть-чуть, так как они справляются с текстурными выборками несколько лучше конкурентов. Но в случае Geforce GTX 750 Ti это помогло не сильно, так как у нее меньше всего блоков TMU. Новинка все равно остается позади быстрейшего из конкурентов в обоих тестах, особенно в Frozen Glass. GTX 750 Ti даже чуть медленнее своей предшественницы, что снова говорит об относительной слабости текстурирования.

Но это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. И когда дело коснулось самых тяжелых DX9-тестов из первой версии пакета RightMark, то новая видеокарта производства Nvidia показала результат, превосходящий производительность Geforce предыдущего поколения. Впрочем, платы AMD на чипах архитектуры GCN все равно остаются впереди.

Новинка компании Nvidia показывает в этих задачах неплохой результат, обойдя на 4-8% модель предыдущего поколения Geforce GTX 650 Ti, а вот что касается сравнения с конкурентами AMD, то тут дела не так радостны. Новинка может и способна конкурировать с младшей из Radeon, но от старшей отстает в обоих тестах. Решения AMD явно быстрее представленной недавно Geforce, хотя в тесте Fur новая плата уступает не так уж сильно, хотя в тесте продвинутого параллакс-маппинга разница оказалась почти полуторакратной.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая видеокарта Geforce GTX 750 Ti заметно быстрее платы на чипе GK107 предыдущего поколения (чуть ли не вдвое), но уступает плате на базе GK106 около 13-18%, в свою очередь. Преимущество в этом тесте все равно у обеих видеокарт Radeon и оно весьма существенное. В этой задаче новинка Nvidia явно не может ничего им противопоставить. Снова в этом тесте для Nvidia все очень печально, ведь даже самый слабый Radeon опережает все Geforce.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Положение (плачевное для видеокарт Nvidia в этой задаче) изменилось не слишком сильно. Свежая модель Geforce GTX 750 Ti все так же обгоняет только младшую сестру GTX 650, и оказывается уже на 17-23% медленнее модели с приставкой Boost — все-таки GK106 во многих задачах явно быстрее GM107, что соответствует и теории. Проигрыш прямым конкурентам в виде пары Radeon R7 260 и 260X снова чуть ли не двукратный. Увы, но преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения SSAA, хотя в этот раз Geforce GTX 750 Ti отстает от GTX 650 Ti Boost немного меньше — лишь 9-13%, но все же уступает. Конечно, новинка значительно опережает младшую модель Geforce GTX 650 на базе чипа GK107, но это было понятно уже из теории. Что касается пары Radeon, то и R7 260X и R7 260 все также быстрее всех видеокарт Nvidia, которые в этом тесте снова справляются с работой заметно хуже конкурирующих решений. Посмотрим, что изменит включение суперсэмплинга:

Мало что изменилось и в этот раз, хотя при включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась немного, но этого хватило, чтобы разница между GTX 750 Ti и GTX 650 Ti Boost лишь увеличилась до 13-19%, понятно в какую пользу.

Увы, но мы в очередной раз увидели, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают куда более эффективно, по сравнению с конкурирующими Geforce, и старшая плата Nvidia на чипе GM107 серьезно уступает не только обеим платам серии Radeon R7 260, но и отстает от GTX 650 Ti Boost, которую, по идее, должна заменять на рынке. Что ж, может быть в чисто вычислительных задачах у новинки получится лучше.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на них влияет и разная эффективность их использования в конкретных решениях и оптимизация драйверов. В случае теста Mineral, новая модель Geforce GTX 750 Ti выступила просто отлично, более чем вдвое обогнав младшую модель GTX 650 и на 10% опередив GTX 650 Ti Boost — наконец-то мы увидели такую задачу, где новинка показала свою силу.

Да и по сравнению с Radeon все стало куда лучше, чем раньше. Архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Maxwell инженеры калифорнийской компании значительно увеличили число потоковых процессоров, поэтому пиковая математическая производительность Geforce GTX 750 Ti серьезно возросла. И в первом же математическом тесте новая видеокарта Geforce хоть и уступает лучшей плате компании AMD, но это уже всего лишь жалкие 4%, а Radeon R7 260 и вовсе остался позади. Отличная работа по устранению слабых мест предыдущих архитектур!

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Разница между Geforce GTX 750 Ti и GTX 650 Ti Boost выросла до 17%, а GTX 650 и вовсе неприлично отстала. Что же касается конкуренции с Radeon, то новинка Nvidia в этот раз слегка отступила, совсем чуть-чуть опередив Radeon R7 260 и проиграв старшей R7 260X уже 18%.

В любом случае, с учетом вдвое меньшего энергопотребления платой на основе GM107, результаты в тестах пиковой математической производительности Nvidia явно подтянула, и это очень важно для них. Представьте, что было бы при сравнении R7 260X (да пусть даже R7 265) с гипотетическим GM106 — чипом большей сложности, с большим количеством исполнительных блоков и пропускной способностью памяти.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Отлично заметна разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Наша новинка Geforce GTX 750 Ti справляется с задачей явно не хуже заменяемой ей модели GTX 650 Ti Boost, и даже немного (5-6%) обгоняет ее. Сравнивать новинку с платами Radeon нет смысла, у решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются много быстрее конкурентов. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новая модель Geforce показала скорость, идентичную производительности GTX 650 Ti Boost, и обе они вдвое быстрее Geforce GTX 650, а обе платы Radeon еще хуже, так что в выводах ничего не меняется.

К сожалению, но «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании и ошибка не исправлена уже много месяцев.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены еще чем-то странным, и разница между скоростью рендеринга в разных режимах лишь подтверждает эту аномалию.

Собственно, по разнице между GTX 750 Ti и GTX 650 Ti Boost видно, что дело в ПСП, так как новинка отстала на 15-20%. Впрочем, GTX 650 отстала еще заметно сильнее, так что дело явно не только в ширине шины и частоте видеопамяти. Самой быстрой в сравнении стала GTX 650 Ti Boost, а же за ней идет плотная группа из выпущенной недавно новой модели Geforce GTX 750 Ti и пары Radeon R7 260 и 260X, которые весьма близки, особенно в более сложных условиях. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме изменилась — решения компании AMD в тяжелых режимах потеряли ощутимо больше, по сравнению с платами Geforce. И теперь во всех режимах лидирует Geforce GTX 650 Ti Boost, а новая модель Nvidia слегка отстает от нее в легком режиме, заметно опережая в тяжелом. Прямые конкуренты Geforce GTX 750 Ti уступают ей во всех режимах, кроме самого простого.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах, но в тяжелых режимах первенствуют платы семейства Radeon R7 260. Новая видеокарта Nvidia оказалась на 1-3% (в пределах погрешности) быстрее заменяемой модели GTX 650 Ti Boost, и обе они заметно быстрее младшей видеоплаты. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в тяжелых режимах. Новая платы на чипе GM107 во всех режимах уступила 4-6% своей сестре GTX 650 Ti Boost, обе они быстрее младшей GTX 650. А вот сравнение с платами AMD не совсем однозначное. Если в легком режиме все платы кроме GTX 650 идут почти наравне, то в тяжелом Radeon R7 260X явно сильнее пары Geforce.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Geforce GTX 750 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Старшая модель нового семейства Geforce GTX 750 в этом тесте почти на 30% медленнее GTX 650 Ti Boost, что примерно соответствует теоретической разнице по скорости текстурирования. В свою очередь, новинка ощутимо быстрее младшей GTX 650 — по сути, по скорости текстурирования она где-то между этими двумя видеокартами прошлого поколения.

Что касается сравнения скорости новой платы Nvidia с решениями конкурента, то новинка по текстурной скорости явно уступает и Radeon R7 260 и 260X, что также ожидаемо и соответствует теоретическим показателям. Такое отставание понятно, ведь GM107 по сути ближе к уровню GK107, чем к более сложным чипам GK106 и Bonaire. Мы уж не говорим об энергопотреблении.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот в тесте производительности блоков ROP результат у анонсированной недавно видеоплаты Nvidia получился очень неплохим — лишь на 14% ниже, чем у модели на более сложном чипе предыдущего поколения, а Geforce GTX 650 отстала от них очень сильно — сказывается более высокая эффективность новинки, в том числе изменения в подсистеме памяти, ведь цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»).

Geforce GTX 750 Ti с запасом обгоняет и Radeon R7 260 и 260X, по каким-то причинам обе платы AMD показывают в этом тесте низкую скорость заполнения сцены, по сравнению с тем, что должно быть по теории, ведь по ней R7 260X по всем параметрам (ПСП, ROP) должна быть быстрее новой платы Nvidia.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 750 Ti и не отстает и не обгоняет старшую модель из семейства GTX 650. А вот младшая осталась далеко позади, почти вдвое проиграв обеим платам более высокого уровня. Графические процессоры производства компании AMD являются более эффективными в этой конкретной задаче, но Geforce GTX 750 Ti проигрывает младшей из них не так много. Старшая, впрочем, далеко впереди, а ведь даже она стоит дешевле новинки Nvidia.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, но основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров, но картина на диаграмме в очередной раз получилась странная и необъяснимая исходя из одного-двух теоретических параметров.

Старшая модель семейства Geforce GTX 750, которую мы сегодня рассматриваем, показывает скорость на 9% хуже, чем Geforce GTX 650 Ti Boost, и обгоняет оставшуюся последней GTX 650, как и должно быть по теории. Удивительно то, что, несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с решениями конкурента, все Geforce уступают обеим представленным платам Radeon.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация изменилась на противоположную, и теперь уже видеокарты Nvidia первенствуют по скорости рендеринга. Разве что Geforce GTX 650 отстала от всех, снова став последней, что вполне объяснимо, ведь графический процессор GK107 является самым слабым.

Новая Geforce GTX 750 Ti на 17% отстает от GTX 650 Ti Boost, что многовато, явно ей не хватает ПСП или скорости текстурирования — судя по результатам, упор есть не только в геометрическую производительность. Если сравнивать скорость новинки с конкурирующими платами Radeon, то новая модель Nvidia оказалась все же быстрее их в этой задаче — синтетический тест имитации частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывает, что платы Nvidia опережают конкурирующие модели AMD.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений уже не совсем соответствует теории, и не слишком близка к тому, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Новинка Nvidia из серии Geforce GTX 700 лишь на 4% отстала от GTX 650 Ti Boost (и все же она отстала), что подтверждает теоретические показатели, а младшая GTX 650 показывает скорость снова чуть ли не вдвое хуже старших моделей. Впрочем, неплохая скорость относительно других моделей Nvidia не позволяет новинке сражаться на равных с видеокартами Radeon компании AMD, так как архитектура GCN отлично справляется с подобными задачами и показывает лучшие результаты в случаях, когда выполняется интенсивная «математика». И GTX 750 Ti немного не дотянулась даже до Radeon R7 260 в этом тесте, не говоря уже о старшей модели.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно практически одинаковая, хотя у видеокарт с GPU предыдущих архитектур были явные различия. Судя по нашим последним исследованиям, результаты в этой задаче явно зависят не от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности ROP.

А в этот раз нам и вовсе не удастся сделать какие-либо выводы, ибо абсолютно все решения показали близкие результаты — разница между лучшей и худшей цифрой не превышает и 8%. Радует то, что новая плата компании Nvidia среди лидеров даже в таких условиях, но все же данный тест для нас практически бесполезен.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот второй DX11-тест показал первый (а возможно и единственный) сенсационный результат, который можно объяснить разве что увеличившейся эффективностью выполнения определенных вычислительных задач. В этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями.

Решения Nvidia в подобных расчетных задачах в принципе выглядят неплохо, но ведь и новые платы Radeon также справляются на отлично с этой задачей. Но все они померкли перед эффективностью Geforce GTX 750 Ti, которая показала лучший результат, опередив Radeon R7 260X на 22%. При этом новинка более чем в полтора раза опередила свою предшественницу на базе чипа GK106, теоретически более сложного и мощного. Похоже, что так повлияли архитектурные улучшения, связанные с увеличением эффективности вычислений, о которых мы писали в предыдущей части.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты Nvidia явно выше, чем у платы предыдущего поколения. Впрочем, обе видеокарты AMD имеют высокую ПСП и прекрасно справляются с этой простой задачей — они обогнали новую модель Geforce с хорошим запасом.

Во втором подтесте с более сложными попиксельными расчетами все сложилось практически так же. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN явно выше, чем у Kepler и... теперь уже Maxwell. По сути, разницы в этом случае между GTX 650 Ti и GTX 750 Ti никакой нет, поэтому рассматриваемая сегодня плата Nvidia проиграла даже Radeon R7 260, не говоря о более мощной модификации.

Да и в подтесте с тесселяцией новинка также отстала от соперников производства компании AMD. Модель Geforce GTX 750 Ti явно опередила свою сестру, но заметно уступила платам семейства Radeon R7. Это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, и скорости обработки треугольников у платы компании AMD вполне хватает.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере в сложных режимах применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит иные выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжелых условиях графический процессоры Nvidia все же производительнее.

Рассматриваемая сегодня модель Geforce GTX 750 Ti отстает от всех остальных во всех легких режимах, хотя разница с GTX 650 Ti невелика. Зато в самой сложной конфигурации с большим количеством геометрии она явно вырвалась вперед. Так что выводы именно по тесселяции таковы: новая видеокарта Nvidia быстрее соответствующих плат Radeon в сложных условиях, когда скорость последних сильно падает, а у плат Geforce остается достаточно высокой.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы протестировали представленные в материале решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Интересно, что даже при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon теперь отстают от Geforce GTX 750 Ti, хотя с GTX 650 Ti они справлялись. В целом, платы компании AMD показывают достаточно высокие результаты только при легких условиях, а при увеличении геометрической работы производительность всех Radeon заметно снижается, и платы компании Nvidia вырываются далеко вперед.

Видеокарты Nvidia в этом тесте всегда очень быстры, а новая модель Geforce GTX 750 Ti так и вовсе оказалась даже в самых сложных условиях на 22% быстрее Geforce предыдущего поколения на графическом процессоре архитектуры Kepler. Естественно, что сравнение с платами AMD не в их пользу, в сложном режиме они отстают от новинки чуть ли не вдвое. Впрочем, мы не устаем повторять, что в играх геометрическая нагрузка всегда в разы ниже, и возможности видеокарт в них не ограничены производительностью геометрических блоков.


В целом, результаты синтетических тестов новой видеоплаты Nvidia Geforce GTX 750 Ti, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали неоднозначные результаты. С одной стороны, новая плата Nvidia явно показывает очень хорошую энергоэффективность, оказываясь по производительности в тестах почти на уровне Geforce GTX 650 Ti (Boost) — плат предыдущего поколения на куда более сложном видеочипе с почти вдвое большим потреблением энергии. То же самое касается и конкурентов AMD, все они потребляют куда больше энергии, но обеспечивают лишь чуть более высокую скорость.

То есть, чисто технически видеокарта на чипе GM107 показала себя отлично, явно став самой энергоэффективной видеокартой в истории. У нее есть некоторые «узкие» места, вроде относительно малой скорости текстурирования и явно низкой пропускной способности памяти, которые мешают в ряде случае, но эти случаи редки. Но есть важное «но» — на рынке куда важнее стоимость решений, на которую в первую очередь смотрят покупатели. И тут для Geforce GTX 750 Ti уже далеко не все столь радужно. Новинка явно имеет завышенную цену и стоит дороже конкурирующей модели в виде Radeon R7 260X, показывая скорость примерно на том же уровне.

Иными словами, подобная плата на видеочипе GM107 стала бы прекрасным выбором и самым выгодным предложением на рынке, если бы она была выпущена в соответствующем ценовом диапазоне. Выйди она ступенью ниже, заместив не Geforce GTX 650 Ti Boost, которая явно побыстрее, и не GTX 650 Ti, которая то быстрее, то медленнее, а обычную GTX 650 без суффикса «Ti» — в таком случае это был бы бестселлер по соотношению цены и производительности, а не только по энергоэффективности. Увы, но наш набор синтетических тестов показал, что по производительности новая плата Nvidia способна соперничать лишь с Radeon R7 260X, как максимум, а ведь эта модель AMD стоит заметно дешевле. Чтобы сделать окончательные выводы, посмотрим реальную производительность новинки в играх в следующей части нашего материала и оправданность ее розничной цены уже с учетом скорости в игровых приложениях.


Nvidia Geforce GTX 750 Ti — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek