1、像素:pixels
从技术角度,像素指 “图像元素”,指显示器中图形信息的一个小点?d即代表一 种单色(大多是红、绿、蓝色的数值)。如果屏幕分辨率是1024x768,那么在即是指屏幕 会显示宽度1024个像素乘以高度768个像素的画面,当所有像素同时显示时,就会在屏幕上看到显示。根据显示器类型不同及显卡生成的数据量与输出量不同,图像呈现的檗速度约在每秒60至120次不等;crt显示器以线为单位呈现影像,而lcd显示器则是 每个像素个别更新。
2、顶点:vertics
所有3d场景的对象都是由顶点形成。一个顶点是x、y、z坐标形成的3d空间中的一点,多个顶点组合在一起(至少四个)可形成一个多边形,如三角形、立方体或更复杂的形状,将材质贴在其上可使该组件(或几个排好的组件)看起来更真实。上图的3d立方体就是由八个顶点所形成,使用大量顶点,可形成弧线形对象等较复杂的图像
3、材质:texture
材质从严格意义上讲只是2d影像,其大小可根据场景不同而不同,材质贴在3d对象上以仿真表面。例如,上图的3d立方体由八个顶点组合而成,看起来只是一个很平凡的箱子,但贴上材质后可改变外观,一旦将材质贴到3d对象上,该对象看起来就像是绘过该材质一样。
4、着色器:shader
目前有两种着色器 : 顶点着色器与像素着色器。其中,顶点着色器能将3d部件做变形或转换处理;像素处理单元可根据复杂的输入资料改变像素颜色,如3d场景中的光源;当点亮对象时,某些颜色显得更亮,但其它对象因像素颜色的讯息改变,会产生阴影。在大多数游戏中经常使用像素着色器来构建华丽的视觉效果,例如,让一把3d的剑周围的像素光彩夺目,不同的着色器会影响一个复杂3d对象的所有顶点,让对象看起来栩栩如生。如今,游戏开发者越来越倚重复杂的着色器处理程序以及逻辑单元,以便创造更真实的图像,图像最丰富的游戏往往使用大量的着色器。direct x 10是第三代着色器,称为几何着色器,可根据想呈现的效果,可分割、修饰、甚至摧毁对象。这三类着色器类型在编程中的应用方法类似,但目的大不相同。
5、填充率:fill rate
在显卡的包装上常常可以看到名为填充率(fill rate)的指标。所谓填充率,通常是指图形处理器处理像素的速度。
一般而言,显卡的填充率可分为两种 : 像素填充率与材质填充率。其中,像素填充率是显卡输出的像素总数,其值乘以gpu频率后,即为光栅运作(rop : raster operations)的速度。
ati与nvidia在计算材质填充率时的方式并不相同。nvidia将像素管线的数字乘上频率速度,得到材质填充率;而ati则是将材质单元的数字乘上频率速度。两者计算方式都有一定道理,因为nvidia每个像素着色器有一个材质单元,或是每一个像素管线有一个材质单元。
6、顶点着色单元:vertex shader units
如像素着色单元一样,顶点着色单元是gpu中处理影响顶点的着色器。一般来说,顶点越多,3d对象便越复杂,而3d场景包含了较多或是更复杂的3d对象,因此顶点着色单元对最终的图形效果非常重要。不过,和像素着色单元比起来,顶点着色器对整体呈现效果的影响要小一些。
7、像素着色单元:pixel shader units
像素着色单元是gpu芯片中专门处理像素着色程序的组件,这些处理单元仅执行像素运算,由于像素代表色值,因此像素着色单元是用来处理绘图影像的各种视觉特效。 举例来说,游戏中最出色的水波特效便是由像素着色单元所完成。gpu中的像素着色单元数目,通常用来比较不同显卡的像素处理效能。一般来说,如果拿8 像素着色单元和16着色单元作比较,可以想象16着色单元的显卡在处理复杂的像素着色器特效时,速度比较快。当然,gpu的时针频率亦会对此有所影响,但从性能方面考虑,把gpu的时针频率速度提高一倍的效果远不如将着色单元的数目提升一倍更佳。
以ati radeon x800 xl与x800 gto这两款显卡为例,它们具有同样的核心频率与256位的显存位宽,但radeon x800 xl有16个像素着色单元,而x800 gto虽然也使用同样的处理器,但是只可使用其中的12个单元。由下图可以明显看出着色单元的数量对显卡性能的影响。
8、通用着色器:unified shaders
通用着色器在个人计算机市场上还不普及,不过最新上市的direct x 10规格已开始用通用着色器的架构。这代表顶点几何与像素着色器代码结构的功能相似,但都有专属的滚动条。xbox 360的新规格是由ati为微软(microsoft)开发,新一代direct x10展现的潜在需求将创造新的话题。
9、材质贴图单元(tmu: texture mapping units)
材质需要被寻址或是过滤,这项工作由tmu结合像素着色单元、顶点着色单元共同完成,由tmu将材质贴到像素上。
在比较两款不同显卡的材质处理性能时,需要看gpu的材质单元数量;一般来说,具有较多tmu的显卡,材质信息的处理速度较快。
10、光栅处理单元(rop: raster operator units)
光栅处理单元负责将像素数据写入显存,一般以填充率来描述。rop和填充率在3d显卡早期是衡量显卡性能的重要参数。如今,虽然rop的工作仍然非常重要,但随着显卡性能的迅速提高,它已经不再是性能的瓶颈,因此,它已不再作为测量性能的技术指标。
11、管线:pipelines
管线是描述显卡架构的名词,以更准确地衡量gpu实际运算能力。管线并不是一般熟悉的工程专有名词,在gpu上有不同的管线,可在任何时间各自提供不同功能。
传统上,它通常用来指专用tmu上的附加像素着色单元。举例来说,ati radeon 9700显卡有8个像素处理器,其中每个像素着色单元与一个tmu相对应,因此,多将其称为8管线的显卡。如今,随着图形处理器架构的演变,管线这个术语在很多时候已不能真实地反映显卡的真实性能。ati的x1000系列显卡,是首先采用新的架构的显卡,其通过优化底层结构来实现gpu性能的提升。基于在图像处理中,某些处理单元比其它单元更常用,为了增加处理器的整体性能,ati尝试在不增加晶体管数量的前提下,找到最佳性能所需的处理单元数量。在此架构下,像素管线失去了传统的意义,因为像素着色单元不再依附tmu,举例来说,ati radeon x1600显卡有12个像素着色器单元,但只有4个tmu,因此不能说它是12管线的架构,但也不能说它是4管线架构,虽然大家常使用这两种说法。因此,现在gpu上的管线数目仅在比较两个不同的卡片(除了ati’s x1x00系列之外)时才有实际意义,如在比较24管线和16管线的显卡时,才可以认为24管线的显卡性能更更佳。
12、制程:manufacturing process
制程这个名词是指在制作集成电路的制造过程中的结构大小和精密度,结构越小,制程越先进。例如与0.13微米制程相比,0.18微米制程所生产的处理器体积大、效率低,这是因为较小的晶体管,工作时所需的电量通常较低,发热量也相对较低。较小制程也代表工作单元间的距离比较短,数据传输所需的时间也较短;较小制程有距离短、耗电低及其它优点,因此频率频率速度较高。
说得复杂一点,“微米”和“奈米”这 两个名词都是用来形容制程大小。1奈米等于0.001微米,“0.09微米制程”也就是“90奈米制程”。如上所述,较小制程通常与较高频率速度有关。例如,当我们拿0.18微米制程处理器的gpu与0.09微米(90奈米)制程的gpu相比时,一般0.09制程的gpu会有较高的频率。
13、核心频率、clock speed
gpu的核心频率以兆赫(mhz)为单位,该单位代表“每秒百万周期”。一般来说,核心频率越高,gpu的速度越快,每秒工作量越多。比如说,拿nvidia geforce 6600与6600 gt的比较 : 6600 gt的核心频率是500 mhz,但一般6600系列的核心是400 mhz,因为尽管gpu核心相同,但6600 gt额外20%的频率提升将给显卡性能带来明显的变化。 不过,核心频率并非这么绝对,毕竟gpu架构对真实性能也有相当大的影响。以geforce 6600 gt与geforce 6800 gt为例,6600 gt的核心频率为500 mhz,而6800 gt的核心频率只有350 mhz,但因6800 gt是16管线的架构,而6600 gt是8管线的架构,从这个意义来说,16管线、速度为350 mhz的6800 gt的性能,大约和8管线、两倍速度(即700 mhz)的6600 gt相当。?d?d当然,这是一种简化的比较方法。
14、显存大小
显存大小可能是影响显卡性能的因素中最被高估的方面。大多数消费者常常会把卡片上ram的大小拿来作为区分显卡档次的依据,但实际上与其它因素相比,如时针频率及内存接口,显存的大小对显卡整体性能的影响并不大。一般来说,在大部分的情况下,128 mb显存的显卡与256 mb显存的显卡性能大致相当。虽然在某些具体应用中,显存大小与性能间可能存在一定的对应关系,但在大多数情况下,增加显存并不会自动提升效能。如果要提高材质的分辨率,增加显存倒是个有效的办法。如今,游戏开发商经常使用多重材质集来开发游戏,如果显存足够大,那么材质的分辨率就越高,高分辨率的材质可以为游戏画面提供更清晰的材质。
15.显存位宽
显存位宽是影响显存性能的最重要的因素。目前主流的显卡,其显存位宽大约在64~256位之间,高端显卡大多可至512位。
从理论上讲,随着总线位宽的增加,每周期所传输的数据资料量便就大,显卡的性能便会得到明显的提升。例如,比较频率相同但位宽不同的显卡,可以明显看出,128位总线传输的数据是64位总线的两倍,而256位总线则传输四倍的数据。
显存的位宽越高(即每秒通讯量),意味着显存的性能便越高,这也是为什么显存总线位宽比显存大小重要的原因。因为在同样的频率下,64位总线的内存实际的传输速度仅为256位总线的25%而已!将显存位宽与显存大小结合起来考虑,一般认为,使用 256位128 mb显存的显卡,其性能往往高于使用64位512 mb显存的显卡。
16、显存类型
从概念上说,显卡中使用的显存是内存的子集。一般而言,内存分为两种 : sdr(单数据速率)和ddr(双数据速率),后者每频率周期会转换数据两次。早在显卡刚面市时,sdr就被淘汰了,由于ddr的工作效率是sdr的两倍,因此要注意的是,所有的ddr内存,经常在广告 上将实际频率速度提高为两倍。例如,ddr常被当作“1000 mhz ddr”内存(意即有1000 mhz的表现),可是实际的频率速度却是500 mhz。因此,许多人看到1200 mhz ddr显卡被报导指出只有600 mhz的传输速度时,都大感惊讶,但这还不是该小心的地方,因为这只是ddr被报导的频率速度。ddr2和gddr3内存的运作原则上相同,都是双倍的频率速度,ddr、ddr2和gddr3的区别只有在制造技术上,一般来说,ddr2比ddr的速度还快,而ddr3比ddr2的频率速度更快。
17、显存频率
与图形处理器gpu一样,显存工作在一定频率速度下,以兆赫(mhz)来测量,同样地,提高显存频率能够明显地提高显存性能。从这个角度,显存频率速度的数字,是几个能够用来比较显存效能的数字之一。例如,假设其它因素(如内存总线宽度)都相同,比较500 mhz显存频率和700 mhz显存频率的显卡时,可合理推论,通常显存频率为700 mhz的显卡会有较佳的性能。但是,必须明确,显存频率并非决定显卡性能或者显卡中显存性能的唯一指标。64位总线、700 mhz显存的显卡,比128位总线、400 mhz显存的显卡还要慢。128位总线400 mhz 的频率速度,大约与64位总线800 mhz的速度相同。此外,必须注意的是,gpu的核心频率与显存频率是两个完全不同的概念。
18、显卡接口
显卡和计算机其它组件之间的所有数据传输,均通过显卡槽或接口,目前使用的显卡接口有三种 : pci、agp以及pci express。不同的显卡接口数据带宽不同,带宽越高,相应的显卡性能便越佳。很多时候,显卡与主板、cpu等其他组件通讯的带宽往往是制约显卡性能的瓶颈。
最慢的显卡总线,非古老的pci总线(peripheral components interconnect)莫属;而图形加速端口(agp,accelerated graphics port)的表现较好了许多,但agp 1.0和agp 2x规格,其数据带宽仍嫌过低,限制显卡效能的提高,不过,一旦使用agp 4x,即可达到当前显卡要求的实际最高带宽;agp 8x规格的带宽是agp 4x规格的两倍(2.16 gb/s),但这两种标准之间的表现有些微差别。
最新、最高频宽的接口是pci express bus,新的显卡通常使用pci express x16的规格,来结合16个分离的pci express links,可达到4 gb/s的带宽,从理论上讲,这是agp 8x接口带宽的两倍。pci express可使用此带宽上传数据至计算机,或下载数据至显卡上。不过,agp 8x规格的性能优越,至今还未看见有哪个pci express显卡能表现得比agp 8x好上太多(假设其它硬件与参数相同)
19、hdr lighting:高动态光照渲染
hdr是“高动态范围(high dynamic range.)”的缩写,支持hdr光照渲染技术的游戏,要比不支持hdr的游戏更能展现真实的画面,但并非所有的显卡都能展现hdr的图形。
在与directx 9兼容的图形处理器出现前,谈到显卡运算的光照渲染准确范围,显卡的限制一直都很大,那时所有光照渲染都必须以8位(或256)整数阶层来运算。这一情况直到完全支持directx 9等级的图形处理器面世后才得到改善,如今,显卡有能力在全24位或是16.7百万色下,显示高范围的光照渲染准确性。
在16.7百万色彩下,并且directx 9/shader model 2.0兼容的显卡运算能力也得到满足的前提下,pc游戏的hdr光照渲染才有可能实现。hdr光照渲染是个复杂的概念,要看到实际操作才能领会,可以简单地解释为 hdr光照渲染的对比增加(阴影更深,亮光更亮),同时在阴影和光亮区均能够很好地展现图形细节,而使得画面更为逼真。
支持最新的pixel shader 3.0规格的图形处理器,拥有更高的光照渲染准确度(32位),并且可使用浮点精度的混色,这代表所有sm 3.0的绘图卡都能支持特殊的hdr技术,称“openexr”,这是为电影工业所开发的规格。
最后,应该要注意所有类型的hdr需要硬件具有较高的运算能力,如果不是最强大的图形处理器或cpu,系统速度会被拖得很慢。因此,如果您想要体验最新的hdr游戏,一定要配备高效能的硬件。
20、抗锯齿:anti-aliasing
锯齿(aliasing)是一个描述图形呈现时呈现的锯齿状或是块状边角的术语,指屏幕图形中出现的阶梯般的角边;抗锯齿(aa : anti-aliasing)则可以有效地应对这种现象。不过,由于抗锯齿的运算使用大量的运算资源,因此会导致帧速度下降。
同时,抗锯齿技术也受显卡显存性能的制约,一般而言,与低端显卡相比,配备高性能显存的显卡在执行抗锯齿功能时,效果要好得多。
21、高清晰材质库
所有3d游戏都依据目标规格开发,其中一个规格就是游戏所需要的材质内存容量。游戏进行时,所有必备材质都必须能存于显存,否则性能就会受到严重影响,额外需要的材质则被储存在较慢的ram系统或硬盘里。因此,如果游戏开发公司以128 mb显存作为游戏的最低需求,那么支持它的材质就称为“材质库”,不论何时,都不会对显卡要求超过128 mb的内存容量。
22、材质过滤
所有游戏中的3d对象都经过材质处理,随着材质呈现的视角增加,游戏中的材质会越来越模糊且变形,为了解决这个问题,图形处理器开始使用材质过滤。最早的材质过滤被称为双线性的,会呈现非常明显的过滤条纹,画面变得很不好看,一直到了三线性的材质过滤在双线性技术上做了一些改善,才解决了这个问题;这两种过滤方式,对如今的显卡而言,实现均没有问题。
现在最好的过滤方式是各向异性过滤(af : anisotropic filtering),和抗锯齿一样,各向异性过滤有不同的等级。例如,八倍的af(8x af)比四倍af(4x af)产生更佳的过滤质量。同时,各向异性过滤和抗锯齿一样,要求硬件的运算能力更强,且随着af的级别上升对系统的压力更大。