Блоки растровых операций. Скорость заполнения (филлрейт)

О чём будет рассказываться в этой небольшой статье?

Данная статья – набор базовых знаний для тех, кто хочет выбрать сбалансированную видеокарту, не отдавая лишних денег маркетологам. Поможет новичкам, а так же, послужит источником полезной информации и для более продвинутых пользователей ПК. Тем не менее, мини статья всё же, ориентирована именно на новичков .

Предназначение видеокарты.

Ни для кого не секрет, что в наше время, основным полем деятельности для производительной видеокарты являются – 3 D игры, плавное проигрывание видео (HD ), работа в профессиональных 3D2D и видео редакторах. Остальные, повседневные задачи можно без проблем выполнять и на встроенных в процессор или чипсет видеокартах. С недавнего времени, для видеокарты расширили поле деятельности, в виде многопоточных вычислений , которые работают гораздо быстрее на параллельной архитектуре видеокарт, чем на процессорах.

NVidia продвигает свою программно-аппаратную платформу CUDA , основанную на языке Си (между прочим удачно, и это не удивительно, при вложении таких то средств). AMD же, в основном полагается на открытый код OpenCL .

С помощью можно кодировать видео в 3-4 раза быстрее . Аппаратно, силами видеокарт ускорять продукты компании Adobe – в частности Photoshop , Flash , и это по видимому только начало. Правда, тех людей которые постоянно пользуются вычислительной мощностью видеокарт, теоретически очень мало. И казалось задумываться об этом пока рано, тем более на пятки наступают много ядерные процессоры, которые хоть и медленнее в многопоточных операциях, но имеют неоспоримый плюс в том, что они без сложных программных оптимизаций просто делают своё дело. А простота и удобство реализации, как показывает история Windows (к примеру) – для людей главное и залог успеха на Software рынке. И всё равно стоит отдать дань вычислительной мощи видеокарт, пока не обузданной «правильным» софтом.

Итак. NVidia или AMD ?

*Самый «интересный» вопрос

Главными игроками на рынке графических ускорителей являются корпорации AMD и NVidia .

Тут всё понятно, как и во многих секторах рынков, дуополия. Как Pepsi и Coca — Cola , как и Xbox 360 , как Intel и AMD в конце концов. С недавнего времени, компании выпускают свои продукты поочерёдно. Затем чтобы и одной было хорошо и второй. Сначала AMD выпускает флагмана линейки, затем месяца через два-три, более мощного флагмана выпускает NVidia . Сначала покупаются карты от AMD , как самые мощные, затем после выхода карт NVidia , купившие их, снова идут в магазин, за ещё лучшим продуктом. Практически то же самое происходит и со средним и бюджетным рынком. Только разброс по увеличенной производительности относительно конкурента здесь выше, так как чтобы заинтересовать более экономного потребителя, требуется нечто большее, чем шанс обладать лучшей видеокартой, как это происходит в секторе флагманов.

Лучше не «фанатеть», ведь это бизнес и ничего личного. Главное чтобы видеокарты были производительными, а цены не кусались. И какой производитель — не суть важно. С таким подходом можно всегда оставаться в выигрыше по ценепроизводительности.

Архитектура чипа.

Количество пиксельных процессоров (для AMD ), универсальных конвейеров (для NVidia ).

Да. Это совершенно разные вещи. То, что у AMD Radeon HD 5870 – 1600 исполнительных блоков совершенно не значит, что она будет в 3 раза мощнее, чем NVidia GTX 480 у которой на борту имеется 480 исполнительных блоков.

NVidia имеет скалярную архитектуру, а AMD – супер скалярную .

AMD архитектуры.

Рассмотрим архитектуру ПП (*пиксельных процессоров), на примере базовой супер скалярной архитектуры видеокарт Radeon HD 5 серии (5-way VLIW ).

Каждые 5 пп составляют один исполнительный блок, который за раз может выполнить максимум — 1 скалярную операцию и 1 векторную или иногда 5 скалярных (однако условия не всегда подходят для этого). Каждая векторная операция требует 4 ПП , каждая скалярная 1 ПП . И тут, уж как получится. У NVidia же, каждое Cuda Core , исполняет строго по 1 векторной и 1 скалярной операции за такт.

С выходом 6 серии, под кодовым именем (Nothern Islands ), а именно чипов Cayman, решили отказаться от дополнительного, пятого ALU (T-unit ), который отвечал за выполнение сложных задач.

Теперь эту роль могут исполнять три из четырёх оставшихся блоков. Это позволило разгрузить диспетчер потоков (Ultra-Threaded Dispatch Processor ), которых в придачу стало вдвое больше для улучшения работы с геометрией и тесселяцией, которые были слабой стороной 5 серии. Плюс ко всему, позволяет сэкономить на площади ядра и транзисторном бюджете при той же эффективности.

После шестой серии, работа в направлении развития VLIW закончилась, ввиду её слабой гибкости и большого времени простоя из-за зависимостей внутренних блоков друг от друга (в особенности векторные операции). На первый план вышла совершенно новая архитектура Graphics Core Next .

Движок SIMD , сменяется вычислительным блоком Compute Unit (CU ), что позволяет значительно поднять уровень эффективности и производительности архитектуры. Каждый ПП, теперь может независимо выполнять векторные и скалярные операции, так как для них ввели раздельные блоки управления, которые более эффективно распределяют ресурсы между свободными блоками. В целом, архитектура начинает обретать кое какие предпосылки скалярной архитектуры от NVidia , которая отличается простотой и эффективностью.

Первым чипом с новой архитектурой стал GPU Tahiti , на котором строятся AMD Radeon HD 7970 /7950 . Компания планирует выпустить и средний класс на новой архитектуре.

Теперь рассмотрим базовую, скалярную архитектуру NVidia .

Как мы видим, каждый универсальный процессор ( ), за такт исполняет 1 скалярную операцию и 1 векторную. Это позволяет добиться максимальной плавности. Там где много векторных и скалярных операций, видеокарты AMD с архитектурой VLIW уступают, так как они не способны загрузить работой свои блоки каквидеокарты NVidia .

Допустим выбор пал между Radeon HD 5870 и GeForce GTX 480 .

У первой 1600пп , у второй 480 унифицированных блоков.

Вычисляем: 16005=320 суперскалярных блоков, у Radeon HD 5870.

То есть за такт видеокарта от AMD , выполняет от 320 до 1600 скалярных операций и от 0 до 320 плавающих векторных, в зависимости от характера задачи.

А при удвоенной частоте шейдерного домена, карта на архитектуре Fermi , теоретически должна выполнять 960 векторных и 960 скалярных операций за такт.

Однако Radeon , имеет более выгодную частоту, чем карта из «зелёного лагеря» (700 против 850). Так что, такие показатели NVidia , теоретически должны быть как при частоте работы шейдерного домена на частоте 1700мгц (850 x 2=1700), а это не так. При частоте 1401 Мгц, GTX 480 выдаёт ~ 700 векторных и ~ 700 скалярных операций за такт.

* не стоит полагаться на достоверность данных вычислений, они носят лишь теоретический характер. К тому же данное утверждение не действует с 6-й серии Radeon , начиная с чипов Cayman .

За счёт того, что максимальное количество векторных и скалярных операций выполняется одинаковое количество, архитектура NVidia имеет лучшую плавность в сложных сценах, чем AMD VLIW (<5 series).

Ценовые категории и что мы получаем, если покупаем видеокарту серией помладше.

Инженеры AMD , не задумываясь режут половину пиксельных процессоров, шину памяти и часть ROP ’ s поколению карт, из сегмента на класс ниже. К примеру Radeon HD 5870 имеет 1600пп , шину 256 bit , а в 577 0, всего этого осталось ровно половина – 800 , и шина памяти 128 bit . Такая же ситуация продолжается и до самых бюджетных видеокарт. Так что, всегда предпочтительнее будет приобрести более слабую видеокарту из 58** серии, чем самую старшую из серии 57**.

У инженеров NVidia , не много иной подход. Плавно, обрезается шина памяти, универсальные конвейеры, ROP ’ s , пиксельные конвейеры. Но так же и снижаются частоты, которые при должной системе охлаждения, можно немного компенсировать разгоном. Немного странно, что не наоборот, как это делает AMD , повышая частоты на картах с обрезанным количеством исполнительных элементов.

Подход AMD более выгоден производителю, подход NVidia — покупателю.

Упоминание о драйверах.

Именно из-за особенностей суперскалярной архитектуры VLIW , драйвера от AMD , приходится постоянно оптимизировать, чтобы видеокарта понимала, когда ей нужно использовать векторы или скаляры максимально эффективно.

Унифицированные драйвера от NVidia более невосприимчивы к различным движкам игр, благодаря тому, что инженеры NVidia зачастую уже при разработке игры оптимизируют её под архитектуру своих видео чипов и драйверов. Также стоит отметить, что при их установке и удалении не возникает практически никаких проблем, которые присущи драйверам от AMD .

Драйвера NVidia можно устанавливать прямо на старые, без удаления и без чисток реестра. Надеемся, что программисты AMD будут двигаться в том же направлении. Появилась возможность, скачивать «фиксы» для драйверов Catalyst , которые выходят незадолго до появления игры в продаже или чуть позже. Уже что то. А с выходом новой архитектуры Graphics Core Next , работа по оптимизации драйверов значительно облегчится.

Пиксельные конвейеры, TMU , ROP .

Также, очень важно число пиксельных конвейеров и TMU (блок наложения текстуры ), их количество особенно важно при высоких разрешениях и при использовании анизотропной фильтрации текстур (важны пиксельные конвейеры ), использовании высокого качества текстур и высоких настроек анизотропной фильтрации (важны TMU ).

Количество блоков ROP (блоки растровых операций ), в основном влияют на производительность сглаживания, но при их недостатке может быть потеря общей производительности. Чем их больше, тем незаметнее будет влиять сглаживание на количество кадров секунду. Так же, на производительность сглаживания, существенно влияет объём видеопамяти.

Объём, частота и разрядность шины памяти.

Чем больше видеопамяти у видеокарты, тем лучше. Однако не стоит покупаться на большой объём .

Как часто бывает, на относительно слабые видеокарты, ставят неимоверные объёмы видеопамяти, да ещё и медленной (к примеру на GeForce 8500 GT , некоторые OEM производители ставят по 2 Гб DDR 2 видеопамяти). От этого видеокарта не взлетит, и производительности не добавится.

* в сравнении с 8500 GT 512 мб

Гораздо лучшим вариантом, будет взять видеокарту с более быстрой памятью, но меньшим объёмом. К примеру, если выбор стоит: взять 9800 GT с 512 или 1024 мб памяти, с частотой 1000мгц и 900мгц соответственно, то предпочтительней будет взять 9800 GT с 512 мб памяти. Тем более видеокарта такого уровня не нуждается в видеопамяти больше чем 512 мб .

Пропускная способность памяти – это главное в производительности подсистемы видеопамяти, которая наиважнейшим образом влияет на производительность видеокарты в целом. Измеряется в Гб/c (гигабайт в секунду).

К примеру сейчас, активно используется видеопамять типа GDDR 5 , у которой гораздо выше частотный потенциал, чем у GDDR 3 , и соответственно белее высокая пропускная способность.

Однако частота это далеко не всё. Вторым важным фактором, является разрядность шины памяти . Чем выше разрядность, тем быстрее память.

К примеру, память с частотой 1000мгц и шиной 256 bit , будет ровно в 2 раза быстрее памяти 1000мгц и шиной 128 bit . Чем больше разрядность — тем быстрее память. Самая широкая шина памяти из существующих – это монструозная 896 bit (448 x 2 ) на видеокарте GeForce GTX 295 . Однако в ней используется память GDDR 3 , что существенно ухудшает пропускную способность (меньше эффективная частота) в сравнении с GDDR 5 . Поэтому, её пропускная способность, даже немного ниже, чем у Radeon HD 5970 с 512 bit (256 x 2), но с GDDR 5 .

Система охлаждения.

Чем эффективнее система охлаждения, тем меньше шанс, что ваша видеокарта выйдет из строя. Карта будет меньше перегреваться, что улучшит общую стабильность системы, значительно увеличит срок службы , а так же повысит разгонный потенциал .

Выпускаемые, готовые с истемы о хлаждения видеокарт бывают двух вариаций.

Референсные (от производителя) и альтернативные (от партнёров производителя). Как правило, референсные карты имеют турбинное ( , blower) исполнение, и обычно очень надёжны. Относительно шумны, не всегда так эффективны, как альтернативные СО от партнёров производителя и сильнее забиваются пылью. Хотя при использовании , бловерные системы охлаждения видеокарт очень эффективные и тихие. Если небольшой шум при нагрузке вас не беспокоит, и вы не будете ставить рекордов в разгоне, референсные системы охлаждения — предпочтительней. Обычно, партнёры производителей, обклеивают их наклейками со своими логотипами, изменения возможны лишь в BIOS-е видеокарты (регулировка оборотов вентилятора), поэтому некоторые карты идентичные по дизайну, но от разных производителей, шумнее либо горячее своих собратьев и наоборот. У каждого из производителей, свои предпочтения и гарантийные условия. Потому, некоторые жертвуют тишиной для большей стабильности и долговечности.

Если же вам важна тишина , то стоит обратить внимание на альтернативные системы охлаждения повышенной эффективности, с меньшим уровнем шума (к примеру Vapor — x , IceQ , , DirectCu), или же выбрать видеокарту с пассивной системой охлаждения, коих сейчас всё больше.

* Совет : не забывайте раз в год-два, менять термоинтерфейс, особенно на СО с технологией прямого контакта тепловых трубок. Термопаста застывает, образуя слой, плохо проводящий тепло, что ведёт к перегреву видеокарты.

Энергопотребление видеокарты.

Очень важная характеристика при выборе, так как видеокарта является очень прожорливым компонентом компьютера, если не самым прожорливым. Топовые видеокарты иногда приближаются к отметке 300W . Поэтому при выборе, следует учитывать, способен ли ваш блок питания обеспечить видеокарте стабильное питание. Иначе система может либо не запуститься из-за несоответствия напряжения при прохождении POST , могут появиться нестабильности в работе и неожиданные выключения, перезагрузки или перегрев компонентов компьютера, либо блок питания может просто сгореть.

На сайте производителя или коробке видеокарты, написаны минимальные характеристики, среди которых минимальная мощность блока питания. Данные значения написаны для любых блоков, в том числе и китайских. Если вы уверены что у вас качественный блок питания, можно отнять от этого значения 50-100W .

Косвенно определить энергопотребление можно по количеству дополнительных разъёмов для питания на видеокарте.

Ни одного – меньше 75W , один 6-pin до 150W , два 6-pin до 225W , 8-pin + 6-pin – до 300W . Убедитесь что ваш блок имеет необходимые разъёмы или чтобы в комплекте были переходники под 4-х штырьковые molex -ы. Либо докупите их, они свободно продаются в компьютерных магазинах.

Недостаток питания видеокарты может привести к её перегреву, появлению артефактов и выходу её системы питания из строя. Видеокарты NVidia , при недостатке питания могут начать предупреждать сообщениями вида: «видео драйвер перестал отвечать и был восстановлен» или «подключите дополнительное питание к видеокарте».

Высокое энергопотребление = большое тепловыделение . Если ваша видеокарта потребляет много энергии, позаботьтесь о дополнительных вентиляторах на вдув и выдув на корпусе. Либо как временная мера — откройте боковую крышку. Постоянно высокая температура в корпусе — пагубно влияет на строк службы всех компонентов начиная материнской платой, заканчивая .

Разъёмы.

Когда вы уже определились с видеокартой, внимание стоит обратить и на разъёмы.

Если у вас монитор с матрицей P- или с поддержкой 30 битного цвета (1.07 млрд. ), то вам обязательно понадобится DisplayPort на видеокарте для раскрытия его потенциала. Только DisplayPort поддерживает передачу 30 битной глубины цвета.

* достоверно неизвестно, поддерживают ли передачу 30 бит, игровые видеокарты, но наличие DisplayPort говорит о возможной поддержке. В спецификациях поддержка, заявлена только у профессиональных видеокарт AMD FirePro и NVidia Quadro .

Очень хорошо если есть . Никогда не знаешь, что может пригодиться и лучше быть к этому готовым. Вдруг вам понадобится вывести сигнал с ресивера. Кстати, HDMI и DVI совместимы через простой переходник и практически без проблем.

Выводы.

На этом всё. Не успели начать, уже заканчиваем. Так как статья описывает главные, общие понятия, она получилась не слишком длинной.

Тем не менее, все наиболее важные моменты для выбора качественной и производительной видеокарты описаны.

1. Вопрос веры.

3. Количество исполнительных блоков (TMU, ROP и т.д).

4. Объём, частота и разрядность шины памяти.

5. Узнать подойдёт ли карта по уровню энергопотребления.

5. Система охлаждения.

6. Разъёмы.

Надеемся, с этими знаниями, вы сможете в соответствии с вашими требованиями, выбрать видеокарту.

Удачного вам выбора!

Теоретически современный компьютер может существовать без видеокарты — не зря материнские платы наделены одним или даже двумя разъемами, использующимися для подключения монитора. Совсем никаких проблем с этим нет у владельцев процессоров с интегрированным графическим ядром. Но даже они приобретают видеокарту в том случае, если хотят играть в современные игры. Только видеоадаптер способен обеспечить достойный уровень графики. А ещё сильнее она помогает в случае видеомонтажа или работы над визуальными спецэффектами. Но как выбрать подходящую модель?

Зависимость видеоадаптера от других компонентов

Предупреждаем сразу, ориентироваться в первую очередь следует на уже имеющиеся компьютерные комплектующие! Представьте, что вы приобрели мощнейший NVIDIA TITAN в то время, как в вашем системном блоке ютится скромный двухъядерный процессор. Он попросту не сможет обработать всю ту информацию, что поступает к нему от видеокарты. В связи с этим ваш TITAN будет использовать лишь половину или даже четверть своих возможностей.

Одним словом, подбирайте себе комплектующие примерно одного класса. Если вы покупаете мощную игровую видеокарту, то и процессор с материнской платой не должны быть дешевыми. Нет проблем только с бюджетными видеоадаптерами, предназначенными для обработки офисной графики. Как правило, выжать максимум из такого устройства могут любые «материнки» и процессоры, если только речь не идет об одноядерном чипсете десятилетней давности.

Фото: domcomputer.ru

Основные критерии выбора

Интерфейс подключения

Как известно, видеоадаптеры вставляются в слот PCI-Express. Он имеется в практически каждой материнской плате, за исключением наиболее миниатюрных моделей. Но версия данного интерфейса может отличаться! Если вы собираете компьютер прямо сейчас, то точно приобретёте материнскую плату со слотом PCI-Express 3.0 . Но если вы подбираете видеокарту для имеющейся «матери», то не лишним будет ознакомиться с тем, какая версия интерфейса ею используется. Вполне возможно, что это устаревший PCI-Express 2.0 .

Ничего страшного в установке видеокарты на интерфейс прошлого поколения нет. Просто вы не сможете использовать все её возможности, так как она будет работать в режиме совместимости. Различие интерфейсов кроется лишь в пропускной способности — о высоком уровне графики в современных играх вы можете забыть. Справедливо это и в обратную сторону. Видеоадаптеры, предназначенные для PCI-Express 2.0, будут работать и в новом слоте. Но лучше поискать видеокарту поновее, дабы раскрыть потенциал материнской платы.

Энергопотребление

Давно уже прошли времена, когда видеоускоритель не требовал дополнительного питания. Сейчас отличается только количество разъемов, используемых для подключения блока питания. Самые мощные модели требуют обеспечения питания посредством двух разъемов 8PIN — если ваш блок питания не имеет таких кабелей, то придется озаботиться приобретением переходников, задействующих MOLEX. Чуть менее мощные видеокарты могут использовать один разъем 8PIN или даже 6PIN .

Само собой, отличается у видеоадаптеров и уровень энергопотребления. В технических характеристиках обычно указывается, сколько электричества видеокарта требует в режиме простоя и под нагрузкой. Обычно этот параметр варьируется от 50 до 350 Вт. Если вы не собираетесь менять блок питания, то подбирайте видеокарту под него. Например, GeForce 770 с системой охлаждения от GIGABYTE потребляет в играх до 220 Вт. Прибавьте к этому энергопотребление имеющихся у вас жестких дисков, CD-привода, звуковой карты и материнской платы. В результате вы получите, что такой видеокарте требуется блок питания не менее, чем на 600 Вт. Если ваш блок питания не способен выдать такой объем электричества, то следует рассмотреть более простой видеоадаптер. Или NVIDIA GeForce 970, созданный по утонченному техпроцессу и потребляющий меньшее количество электроэнергии.

Объем и шина видеопамяти

Многим кажется, что чем больше видеопамяти у видеокарты, тем лучше. Однако на самом деле это не всегда так. Дело в том, что видеопамять расходуется через специальную шину. И если у неё пропускная способность слишком низкая, то в редкой игре вы сможете израсходовать весь запас имеющейся видеопамяти. В частности, для объема 1 Гб достаточно шины 128 бит. А для объема 2-4 Гб нужна шина 256 бит. Для ещё большего объема потребуется ещё более широкая шина. Для разных нужд могут потребоваться видеоадаптеры со следующими параметрами:

Работа в офисе — в таком случае вас может устроить простейшая видеокарта, на борту которой имеется 512 Мб видеопамяти с не очень широкой шиной;
Просмотр видео и игры прошлых поколений — для решения таких задач потребуется видеокарта с 1 Гб видеопамяти (желателен стандарт GDDR5) и шиной от 128 бит.
Современные игры со средними настройками графики — здесь всё зависит от разрешения экрана. Вывод картинки в Full HD потребует 2 Гб видеопамяти и 256-битную шину.
Современные игры с максимальными настройками графики требуют как минимум 4 Гб видеопамяти и шину от 256 бит (чем шире, тем быстрее будет загружаться графика).
Задел на будущее и профессиональный монтаж видеоматериалов — потребуется модель, оснащенная 6 Гб видеопамяти (а лучше — ещё большим количеством) и максимально широкой шиной. Если высокое энергопотребление не пугает, то можно рассмотреть двухпроцессорную видеокарту или связку из двух видеоадаптеров.

Фото: bws.ucoz.ru

Частота видеопамяти и процессора

Любая видеокарта состоит из процессора и видеопамяти. Оба этих компонента характеризуются частотой — в этом плане они не отличаются от процессора и оперативной памяти, подключаемых к материнской плате — только цифры совсем другие. В частности, частота видеопамяти обычно повышена до нескольких тысяч мГц — это сделано для того, чтобы обмен данными происходил как можно быстрее. Ну а что касается процессора , то его тактовая частота варьируется от 600 до 1300 мГц. Чем все эти параметры выше, тем более высокий уровень графики видеоадаптер способен обеспечить.

Обращаем ваше внимание, современные видеокарты, стоимость которых начинается от 15 тысяч рублей, поддаются разгону! В BIOS можно попытаться повысить частоту процессора, добившись чуть более интересного результата.

Число универсальных процессоров

Тоже весьма интересный параметр. Для геймеров он не так важен, так как универсальные процессоры в играх задействуются далеко не всегда. В первую очередь они предназначены для обработки потока видеоданных, а не трехмерной графики. В частности, с их помощью осуществляется рендеринг видео и конвертирование одного формата в другой. Чем процессоров больше, тем быстрее закончится этот процесс. У топовых видеокарт число универсальных процессоров может достигать пары тысяч. В бюджетных моделях их может быть встроено всего 300-500. К слову говоря, у NVIDIA эта технология получила наименование CUDA — должно быть, вы о ней уже слышали.

NVIDIA Experience

Раз уж речь зашла о видеокартах NVIDIA, то стоит рассказать о главном их преимуществе. При установке такого устройства вы получаете в своё распоряжение программу NVIDIA Experience . Изначально она была предназначена лишь для автоматического обновления драйверов и оптимизации имеющихся игр. Но сейчас в этом приложении имеется более интересный пункт — NVIDIA ShadowPlay. Если его задействовать, то видеокарта будет в фоновом режиме записывать ваш игровой процесс (от пяти до двадцати последних минут). Нажатие на определенную комбинацию клавиш позволяет сохранить видео на жесткий диск.

Нужно отметить, что данная функция доступна только обладателям видеокарт NVIDIA GeForce 600-й и более высокой серии. Её главное отличие от Fraps, Bandicam и прочих подобных программ — отсутствие какой-либо дополнительной нагрузки на систему, в связи с чем FPS (частота кадров) в играх не проседает.

Фото: www.overclockers.ru

Разъемы

Для вывода изображения на монитор или проектор могут быть использованы разные разъемы. Обычно видеокарта наделена как минимум четырьмя интерфейсами, а в дорогих моделях можно найти четыре или даже пять разъемов.

HDMI — современный цифровой интерфейс, который встречается в подавляющем большинстве телевизоров и многих мониторах, стоимость которых превышает 6 тысяч рублей. Обратите внимание, существуют уменьшенные версии разъема, которые требуют соответствующего кабеля! В зависимости от версии интерфейса, видеокарта может вывести на монитор картинку с разным разрешением (вплоть до 4K) и даже в 3D-виде. Доступен вывод изображения в паре со звуком.
DisplayPort — ещё один современный разъем. Этот интерфейс позволяет вывести картинку в любом разрешении, какое только поддерживает видеоадаптер. Вместе с изображением можно вывести и звук. Также доступна функция подключения нескольких мониторов.
DVI — наиболее надежный разъем. «Вилка» к нему не только подключается, но и вкручивается двумя болтиками. Недостатком можно считать только разрешение — картинку можно вывести в Full HD, но не более того.
VGA — устаревший разъем, через который невозможно вывести изображение в высоком разрешении, звук же им не поддерживается совсем. Однако таким интерфейсом подключения до сих пор обладают многие мониторы.

На что же ориентироваться?

В случае потребности вывода изображения на несколько мониторов необходимо рассматривать мощную видеокарту, наделенную современными разъемами (о VGA точно следует забыть).
Офисных работников устроит практически любой видеоадаптер, продающийся сейчас в магазинах. При покупке бывшего в употреблении устройства следует ориентироваться на объем видеопамяти — при 512 Мб будут стабильно работать любые приложения, связанные с графикой или видео.
Любители игр обязаны искать видеокарту с приличной разрядностью шины видеопамяти. 256 бит — оптимальный параметр, позволяющий играм спокойно задействовать любой объем видеопамяти — вплоть до 4 Гб.
Если вы обожаете записывать свой игровой процесс или вести стримы, то ориентируйтесь на продукцию NVIDIA — в этом деле вам поможет ShadowPlay. Но не забудьте перед этим запастись вместительным жестким диском, выбору которого посвящена !

Как бы то ни было, а при выборе видеокарты обязательно нужно читать обзоры и отзывы. Только так можно понять, не пищат ли у устройства дроссели, как громко работает система охлаждения и каковы показатели видеоадаптера в ваших любимых играх.

Архитектура графического процессора: функции

Реализм 3D-графики очень сильно зависит от производительности видеокарты. Чем больше блоков пиксельных шейдеров содержит процессор и чем выше частота, тем больше эффектов можно наложить на 3D-сцену, чтобы улучшить её визуальное восприятие.

Графический процессор содержит много различных функциональных блоков. По количеству некоторых компонентов можно оценить, насколько графический процессор мощный. Перед тем, как двигаться дальше, позвольте рассмотреть самые важные функциональные блоки.

Вершинные процессоры (блоки вершинных шейдеров)

Как и блоки пиксельных шейдеров, вершинные процессоры выполняют код программ-шейдеров, которые касаются вершин. Поскольку больший бюджет вершин позволяет создавать более сложные 3D-объекты, производительность вершинных процессоров очень важна в 3D-сценах со сложными объектами или с большим их количеством. Впрочем, блоки вершинных шейдеров всё же не так очевидно влияют на производительность, как пиксельные процессоры.

Пиксельные процессоры (блоки пиксельных шейдеров)

Пиксельный процессор - это компонент графического чипа, выделенный на обработку пиксельных программ-шейдеров. Эти процессоры выполняют вычисления, касающиеся только пикселей. Поскольку пиксели содержат информацию о цвете, пиксельные шейдеры позволяют достичь впечатляющих графических эффектов. Например, большинство эффектов воды, которые вы видели в играх, создаётся с помощью пиксельных шейдеров. Обычно число пиксельных процессоров используется для сравнения пиксельной производительности видеокарт. Если одна карта оснащена восемью блоками пиксельных шейдеров, а другая - 16 блоками, то вполне логично предположить, что видеокарта с 16 блоками будет быстрее обрабатывать сложные пиксельные программы. Также следует учитывать и тактовую частоту, но сегодня удвоение числа пиксельных процессоров эффективнее по энергопотреблению, чем удвоение частоты графического чипа.

Унифицированные шейдеры

Унифицированные (единые) шейдеры ещё не пришли в мир ПК, но грядущий стандарт DirectX 10 как раз опирается на подобную архитектуру. То есть структура кода вершинных, геометрических и пиксельных программ будет единая, хотя шейдеры будут выполнять разную работу. Новую спецификацию можно посмотреть в Xbox 360, где графический процессор был специально разработан ATi для Microsoft. Будет весьма интересно увидеть, какой потенциал несёт новый DirectX 10.

Блоки наложения текстур (Texture Mapping Unit, TMU)

Текстуры следует выбрать и отфильтровать. Эта работа выполняется блоками наложения текстур, которые работают совместно с блоками пиксельных и вершинных шейдеров. Работа TMU заключается в применении текстурных операций над пикселями. Число текстурных блоков в графическом процессоре часто используется для сравнения текстурной производительности видеокарт. Вполне разумно предположить, что видеокарта с большим числом TMU даст более высокую текстурную производительность.

Блоки растровых операций (Raster Operator Unit, ROP)

Процессоры растровых операций отвечают за запись пиксельных данных в память. Скорость, с которой выполняется эта операция, является скоростью заполнения (fill rate). В ранние дни 3D-ускорителей число ROP и скорость заполнения являлись очень важными характеристиками видеокарт. Сегодня работа ROP по-прежнему важна, но производительность видеокарты уже не упирается в эти блоки, как было раньше. Поэтому производительность (и число) ROP уже редко используется для оценки скорости видеокарты.

Конвейеры

Конвейеры используются для описания архитектуры видеокарт и дают вполне наглядное представление о производительности графического процессора.

Конвейер нельзя считать строгим техническим термином. В графическом процессоре используются разные конвейеры, которые выполняют отличающиеся друг от друга функции. Исторически под конвейером понимали пиксельный процессор, который был подключён к своему блоку наложения текстур (TMU). Например, у видеокарты Radeon 9700 используется восемь пиксельных процессоров, каждый из которых подключён к своему TMU, поэтому считают, что у карты восемь конвейеров.

Но современные процессоры описать числом конвейеров весьма сложно. По сравнению с предыдущими дизайнами, новые процессоры используют модульную, фрагментированную структуру. Новатором в этой сфере можно считать ATi, которая с линейкой видеокарт X1000 перешла на модульную структуру, что позволило достичь прироста производительности через внутреннюю оптимизацию. Некоторые блоки процессора используются больше, чем другие, и для повышения производительности графического процессора ATi постаралась найти компромисс между числом нужных блоков и площадью кристалла (её нельзя очень сильно увеличивать). В данной архитектуре термин "пиксельный конвейер" уже потерял своё значение, поскольку пиксельные процессоры уже не подключены к собственным блокам TMU. Например, у графического процессора ATi Radeon X1600 есть 12 блоков пиксельных шейдеров и всего четыре блока наложения текстур TMU. Поэтому нельзя говорить, что в архитектуре этого процессора есть 12 пиксельных конвейеров, как и говорить, что их всего четыре. Впрочем, по традиции пиксельные конвейеры всё ещё упоминают.

С учётом сказанных допущений, число пиксельных конвейеров в графическом процессоре часто используют для сравнения видеокарт (за исключением линейки ATi X1x00). Например, если взять видеокарты с 24 и 16 конвейерами, то вполне разумно предположить, что карта с 24 конвейерами будет быстрее.

СОДЕРЖАНИЕ

Унифицированные шейдерные блоки объединяют два типа перечисленных выше блоков, они могут исполнять как вершинные, так и пиксельные программы (а также геометрические, которые появились в DirectX 10). Унификация блоков шейдеров значит, что код разных шейдерных программ (вершинных, пиксельных и геометрических) универсален, и соответствующие унифицированные процессоры могут выполнить любые программы из вышеперечисленных. Соответственно, в новых архитектурах число пиксельных, вершинных и геометрических шейдерных блоков как бы сливается в одно число - количество универсальных процессоров.

Блоки текстурирования (tmu)

Эти блоки работают совместно с шейдерными процессорами всех указанных типов, ими осуществляется выборка и фильтрация текстурных данных, необходимых для построения сцены. Число текстурных блоков в видеочипе определяет текстурную производительность, скорость выборки из текстур. И хотя в последнее время большая часть расчетов осуществляется блоками шейдеров, нагрузка на блоки TMU до сих пор довольно велика, и с учетом упора некоторых приложений в производительность блоков текстурирования, можно сказать, что количество блоков TMU и соответствующая высокая текстурная производительность являются одними из важнейших параметров видеочипов. Особое влияние этот параметр оказывает на скорость при использовании трилинейной и анизотропной фильтраций, требующих дополнительных текстурных выборок.

Блоки операций растеризации (rop)

Блоки растеризации осуществляют операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как уже отмечалось выше, производительность блоков ROP влияет на филлрейт и это - одна из основных характеристик видеокарт. И хотя в последнее время её значение несколько снизилось, еще попадаются случаи, когда производительность приложений сильно зависит от скорости и количества блоков ROP. Чаще всего это объясняется активным использованием фильтров постобработки и включенным антиалиасингом при высоких настройках изображения.

Объем видеопамяти

Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, буферов и т.п. Казалось бы, что чем её больше - тем лучше. Но не всё так просто, оценка мощности видеокарты по объему видеопамяти - это наиболее распространенная ошибка! Значение объема памяти неопытные пользователи переоценивают чаще всего, используя его для сравнения разных моделей видеокарт. Оно и понятно - раз параметр, указываемый во всех источниках одним из первых, в два раза больше, то и скорость у решения должна быть в два раза выше, считают они. Реальность же от этого мифа отличается тем, что рост производительности растет до определенного объема и после его достижения попросту останавливается.

В каждом приложении есть определенный объем видеопамяти, которого хватает для всех данных, и хоть 4 ГБ туда поставь - у нее не появится причин для ускорения рендеринга, скорость будут ограничивать исполнительные блоки. Именно поэтому почти во всех случаях видеокарта с 320 Мбайт видеопамяти будет работать с той же скоростью, что и карта с 640 Мбайт (при прочих равных условиях). Ситуации, когда больший объем памяти приводит к видимому увеличению производительности, существуют, это очень требовательные приложения в высоких разрешениях и при максимальных настройках. Но такие случаи весьма редки, поэтому, объем памяти учитывать конечно нужно, но не забывая о том, что выше определенного объема производительность просто не растет, есть более важные параметры, такие как ширина шины памяти и ее рабочая частота.

Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта: пиксельный (pixel fill rate) и текстурный (texel rate). Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга), а текстурная - это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.

Например, пиксельный филлрейт у GeForce GTX 275 равен 633 (частота чипа) * 28 (количество блоков ROP) = 17724 мегапикселей в секунду, а текстурный - 633 * 80 (кол-во блоков текстурирования) = 50640 мегатекселей/с. Чем больше первое число - тем быстрее видеокарта может отрисовывать готовые пиксели, а чем больше второе - тем быстрее производится выборка текстурных данных. Оба параметра важны для современных игр, но они должны быть сбалансированы. Именно поэтому количество блоков ROP в современных чипах обычно меньше количества текстурных блоков.

Количество блоков-шейдеров (пиксельные, вершинные).

Вершинный шейдер отвечает за построение вершин объекта. Определяют возможности современных карт по обработке графических примитивных объектов, и в общем производительность самой карты. Пиксельный шейдер более актуальный чем вершинный поэтому количество их обычно больше. Разделение на пиксельные и вершинные в последнее время (с выходом Direct 10) теряют свою актуальность. Все они заменяются едиными унифицированными шейдерными блоками, кот зависят от конкретной ситуации. Они исп роль как пиксельных, так и вершинных шейдеров, а так же геометрических, кот появились в Direct 10.

Количество блоков текстурирования ТМU

Количество блоков текстурирования ТМU, которые определяют текстурную производительность или скорость выборки и наложения текстур. Особенно это актуальности при анизотропной фильтрации. Наибольшее значение блоки ТМU имеют в старых играх. Сейчас они практически потеряли свою актуальность, т.к. пропускная способность шины памяти в совр коп-рах не хватает для того, чтобы нормально функционировали высокопроизводительные карты. Большинство и них оснащены собственной памятью, которая требуется для хранения необходимых данных, а именно текстур, вершин и т.д.

Блоки операций растеризации (ROP)

Блоки растеризации осуществляют операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как мы уже отмечали выше, производительность блоков ROP влияет на филлрейт и это - одна из основных характеристик видеокарт всех времён. И хотя в последнее время её значение также несколько снизилось, всё ещё попадаются случаи, когда производительность приложений зависит от скорости и количества блоков ROP. Чаще всего это объясняется активным использованием фильтров постобработки и включенным антиалиасингом при высоких игровых настройках.

Ещё раз отметим, что современные видеочипы нельзя оценивать только числом разнообразных блоков и их частотой. Каждая серия GPU использует новую архитектуру, в которой исполнительные блоки сильно отличаются от старых, да и соотношение количества разных блоков может отличаться. Так, блоки ROP компании AMD в некоторых решениях могут выполнять за такт больше работы, чем блоки в решениях NVIDIA, и наоборот. То же самое касается и способностей текстурных блоков TMU - они разные в разных поколениях GPU разных производителей, и это нужно учитывать при сравнении.

Геометрические блоки

Вплоть до последнего времени, количество блоков обработки геометрии было не особенно важным. Одного блока на GPU хватало для большинства задач, так как геометрия в играх была довольно простой и основным упором производительности были математические вычисления. Важность параллельной обработки геометрии и количества соответствующих блоков резко выросли при появлении в DirectX 11 поддержки тесселяции геометрии. Компания NVIDIA первой распараллелила обработку геометрических данных, когда в её чипах семейства GF1xx появилось по несколько соответстующих блоков. Затем, похожее решение выпустила и AMD (только в топовых решениях линейки Radeon HD 6700 на базе чипов Cayman).

Объём видеопамяти

Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, данных буферов и т. п. Казалось бы, что чем её больше - тем всегда лучше. Но не всё так просто, оценка мощности видеокарты по объему видеопамяти - это наиболее распространенная ошибка! Значение объёма видеопамяти неопытные пользователи переоценивают чаще всего, до сих пор используя именно его для сравнения разных моделей видеокарт. Оно и понятно - этот параметр указывается в списках характеристик готовых систем одним из первых, да и на коробках видеокарт его пишут крупным шрифтом. Поэтому неискушённому покупателю кажется, что раз памяти в два раза больше, то и скорость у такого решения должна быть в два раза выше. Реальность же от этого мифа отличается тем, что память бывает разных типов и характеристик, а рост производительности растёт лишь до определенного объёма, а после его достижения попросту останавливается.

Есть у чипов памяти и более важные параметры, такие как ширина шины памяти и её рабочая частота.

Ширина шины памяти.

Ширина шины памяти является важнейшей характеристикой, влияющей на пропускную способность памяти (ПСП). Большая ширина позволяет передавать большее количество информации из видеопамяти в GPU и обратно в единицу времени, что положительно влияет на производительность в большинстве случаев. Теоретически, по 256-битной шине можно передать в два раза больше данных за такт, чем по 128-битной. На практике разница в скорости рендеринга хоть и не достигает двух раз, но весьма близка к этому во многих случаях с упором в пропускную способность видеопамяти.

Современные игровые видеокарты используют разную ширину шины: от 64 до 384 бит (ранее были чипы и с 512-битной шиной), в зависимости от ценового диапазона и времени выпуска конкретной модели GPU. Для самых дешёвых видеокарт уровня low-end чаще всего используется 64 и реже 128 бит, для среднего уровня от 128 до 256 бит, ну а видеокарты из верхнего ценового диапазона используют шины от 256 до 384 бит шириной. Ширина шины уже не может расти чисто из-за физических ограничений - размер кристалла GPU недостаточен для разводки более чем 512-битной шины, и это обходится слишком дорого. Поэтому наращивание ПСП сейчас осуществляется при помощи использования новых типов памяти (см. далее).

Частота видеопамяти

Ещё одним параметром, влияющим на пропускную способность памяти, является её тактовая частота. А повышение ПСП часто напрямую влияет на производительность видеокарты в 3D-приложениях. Частота шины памяти на современных видеокартах бывает от 533(1066, с учётом удвоения) МГц до 1375(5500, с учётом учетверения) МГц, то есть, может отличаться более чем в пять раз! И так как ПСП зависит и от частоты памяти, и от ширины ее шины, то память с 256-битной шиной, работающая на частоте 800(3200) МГц, будет иметь бо́льшую пропускную способность по сравнению с памятью, работающей на 1000(4000) МГц со 128-битной шиной.

Типы памяти

На современные видеокарты устанавливается сразу несколько различных типов памяти. Старую SDR-память с одинарной скоростью передачи уже нигде не встретишь, но и современные типы памяти DDR и GDDR имеют значительно отличающиеся характеристики. Различные типы DDR и GDDR позволяют передавать в два или четыре раза большее количество данных на той же тактовой частоте за единицу времени, и поэтому цифру рабочей частоты зачастую указывают удвоенной или учетверённой, умножая на 2 или 4. Так, если для DDR-памяти указана частота 1400 МГц, то эта память работает на физической частоте в 700 МГц, но указывают так называемую «эффективную» частоту, то есть ту, на которой должна работать SDR-память, чтобы обеспечить такую же пропускную способность. То же самое с GDDR5, но частоту тут даже учетверяют.

Основное преимущество новых типов памяти заключается в возможности работы на больших тактовых частотах, а соответственно - в увеличении пропускной способности по сравнению с предыдущими технологиями. Это достигается за счет увеличенных задержек, которые, впрочем, не так важны для видеокарт.

Отсюда следует что чем больше объем памяти видеокарты, тем выше производительность. Важные параметры – является рабочая частота шины и ширина шины. Большая ширина шины позволяет передавать большее количество информации в единицу времени из видеопамяти графический центральный процессор GPU и обратно. Что обеспечивает большую производительность видеокарты при равных условиях. Ширина шины составляет бюджетной видеокарты – 64-128 бит, для карт среднего уровня 128-256 бит, для карт высокого уровня – 256-512 бит.

1.2 Описание работы и структурной схемы устройства

При построении изображения, после обработки видео сигнала центральным процессором, данные поступают на шину данных видеокарты. Далее данные отправляются в блок параллельного выполнения команд, а уже из него в GPU(графический процессор) в котором выполняются следующие дейтсвия:

· Трансформация - простые объекты чаще всего необходимо определенным образом изменить или трансформировать чтобы получился более естественный объект, или имитировать его перемещение в пространстве. Для этого координаты вершин граней объекта (vertex - вертекс) пересчитывают с использованием операций матричной алгебры и геометрических преобразований. В видеокартах для этого интенсивно используется геометрический сопроцессор .

· Расчет освещенности и затенения - для того чтобы объект был виден на экране, нужно рассчитать освещенность и затенение каждого элементарного прямоугольника или треугольника. Причем необходимо имитировать реальное распределение освещенности, т. е. требуется скрыть изменения освещенности между прямоугольниками или треугольниками – этим занимается Блок растеризации.

· Наложение текстур - чтобы создать реалистичное изображение, на каждую элементарную поверхность накладывают текстуру, имитирующую реальную поверхность. Текстуры хранятся в памяти в виде растровых картинок.

· Коррекция дефектов - смоделированные линии и границы объектов, если они не вертикальны или горизонтальны, на экране выглядят угловатыми, поэтому проводят коррекцию изображения, называемую антиалиасинг(anti-aliasing );

После обработки GPU объекты обрабатываются блоком «Z-буфер»:

· Проецирование - трехмерный объект преобразуется в двумерный, но при этом запоминаются расстояния вершин граней до поверхности экрана (координата Z, Z-буфер), на который проецируется объект;

· Удаление скрытых поверхностей - из двумерной проекции трехмерного объекта удаляются все невидимые поверхности.

После расчета всех точек кадра информация о каждом пикселе перемещается в видеопамять.

В блоке управления палитрой и наложением изображения выполняется интерполяция недостающих цветов - если при моделировании объектов использовалось другое количество цветов, нежели чем в текущем режиме видеокарты, то необходимо рассчитать недостающие цвета или удалить избыточные.

Если видеокарта подключена к монитору на основе Электронно лучевой трубки тогда данные поступают в ЦАП(цифро-аналоговый преобразователь) в котором происходит преобразование цифровых сигналов в аналоговые RGB сигналы понятные монитору.

Если видеокарта подключена к цифровому монитору то информация изображения конвертируется в формат экрана монитора.