1、GPU可以说是显卡的中枢核心了。GPU全称是Graphic Processing Unit,中文翻译为图形处理器。这是NVIDIA公司在发布GeForce 256图形处理芯片时首先提出的概念。GPU是显示卡的“大脑”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,GPU的作用时是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。GPU通常是显示卡上最大的芯片。那么,除了衡量通常芯片性能的频率之外,GPU的性能还由什么决定呢?在DX10时代之前,GPU采用像素、顶点管线分设的结构。顶点处理单元是显示芯片内部用来处理顶点信息并完成着色工作的并行处理单元。顶点
2、着色单元决定了显卡的多边形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数。像素渲染管线是一个比较笼统的称谓,比较传统的说法是,一条渲染管线是由Pixel Shader Unit(像素渲染单元)和TMU(纹理单元)两部分组成的。它们的分工是:像素渲染单元完成像素处理,纹理单元负责纹理渲染,最后由ROP(光栅操作处理器)负责像素的最终输出。由此看来,一条完整的像素管线在一个时钟周期可以完成至少一次像素运算,并输出一次纹理。同样的频率和架构,GPU的性能不仅取决于管线的数量,还取决于管线个数的比例。于是便出现了同级别的1950GT和7900GS在某些游戏之中性能相差一倍的现象。这是
3、由于在某些游戏中,顶点单元大量空闲,而在另外一些游戏中,像素单元大量空闲。GPU的核心不能得到充分的利用。进入DX10时代之后,NV和ATI都不约而同得意识到分离架构的弊端,于是统一渲染架构诞生了。在统一渲染架构里,之前所介绍的顶点处理单元和像素渲染管线被名叫“streaming processors”(SP)的东西所替代,也就是流处理器,这个东西可以说是统一渲染架构中的核心所在。它拥有之前所介绍的顶点单元、像素渲染单元和纹理单元的功能,可以根据不同类型3D画面的特点进行自由的分工协作,当遇到需要大量顶点单元完成的工作时,可能这些流处理器大部分担当顶点单元的角色,当遇到需要大量像素渲染和纹理渲
4、染的工作时,流处理器中就会有较大比重的去担当像素渲染和纹理渲染的角色,这样就避免了之前分离式渲染架构中出现的资源浪费情况。当然,SP在处理某种工作的时候效率肯定不如专门的管线。但是它可以实现整体效率的最大化。虽然A和N都是采用流处理器,但是两家的结构也有不同,所以不能以流处理器的数量简单的判断显卡的性能。NVIDIA采用的标量1D流处理器设计可以最大化晶体管利用率。理论上,不管执行任何类型的标量/矢量/混合指令,GPU的流处理器都能够按照分配次序按部就班的完成,不存在流处理器闲置的情况,再加上超高的流处理器频率(达到核心频率的两倍以上),GPU的执行效率得到了显著提升。ATI依然沿用了DX9时
5、代的Shader Unit设计,只是将4D ALU改进为4D+1D的5D单元,在遇到复杂指令时的效率依然不够理想。5D ALU对于指令分配器的要求非常高,如果每个Shader Unit没有被分配到打包好的4D或者5D矢量指令,而是1D/2D这样的小指令,那么GPU的执行效率就会非常低,数量巨大的流处理器也成为了一纸空文。所以,虽然3850拥有320个SP,但是性能甚至不及64个SP的9600GT。而且ATI目前没有分频设计,流处理器的频率很低,因此执行效率差距挺大。了解了GPU的主要参数,下面我们再讲一下其他与GPU有关的参数指标。制造工艺:制造工艺决定了GPU的核心面积,从而也影响了GPU的
6、能耗、发热和超频性能。现在主流的制造工艺为65NM和55NM,40NM正在准备之中,预计在ATI明年春天发布的RV870或者RV740上会首次使用。核心代号:就是一个GPU的代号,有的显卡虽然型号不同,但是GPU核心是一样的。区别只是频率和体质。另外值得一提的是,上表未提供核心代号的后缀。高清解码:拥有高清硬解码技术的GPU在播放高清视频的时候可以代替CPU的工作。目前这方面NV和ATI都做的不错,A卡稍强一些。图形API:即图形编程借口。这决定了显卡支持的图形特效和显卡的渲染效率。虽然主流显卡都支持多种图形API,但是由于绝大部分PC游戏都是基于微软DirectX的,所以在此仅讨论显卡所支持
7、的DirectX版本。有关DirectX的详细信息请参看附录2。二、显存 GPU在处理信息的过程中,它会产生大量的临时数据(未处的、正在处理的、已经处理完成的),这就需要一个专门的地方来存放这些临时数据,那就是显存了。显存作为辅助GPU计算的芯片,同显卡的性能息息相关。下面我们就来介绍显存的主要参数。容量:显存容量是显存最直观的指标,。一般地说,显存越大,渲染及2D和3D图形的显示性能就越高。随着时代的发展,分辨率的增加和AA等技术的运用极大的增加了显存的需求。但是显存也不是越大越好。达到一定程度之后,显存增加对性能的影响就微乎其微了。所对于要求分辨率不高的消费者来说,购买中低端显卡的时候完全
8、没有必要追求超大显存,所谓1G显存之类的基本都是商家的噱头。类型:用于显卡的显存,虽然和主板用的内存同样叫DDR、DDR2甚至DDR3,但是由于规范参数差异较大,不能通用,因此也可以称显存为GDDR、GDDR2、GDDR3。DRAM的技术在不断的进步,显存也在不断的更新换代。新一代的显存能带来更高的频率、更低的能耗和更大的带宽。当前的主流显存为GDDR3,GDDR2和GDDR基本已经被淘汰,但是市场上还能见到。GDDR4由于性能不够理想,只是昙花一现,现在的厂商的发展趋势是GDDR5。关于各代显存的具体介绍见附录3。位宽:位宽指的是在一个时钟周期之内能传送的bit数,它是决定显存带宽的重要因素
9、,与显卡性能息息相关。当显存种类相同并且工作频率相同时,位宽越大,它的性能就越高。频率(速度):显存的速度一般以ns为单位。目前常见的显存有1.6ns、1.4ns、1.2ns、1.0ns甚至0.8nsGDDR3的显存。额定工作频率=1/显存速度。当然,对于一些质量较好的显存来说,显存的实际最大工作频率是有一定的余量的。这里还要说一说显存的实际运行频率和等效工作频率。DDR显存因为能在时钟的上升沿和下降沿都能传送数据,因此,在相同的时钟频率和数据位宽度的情况下显存带宽是SDRAM的两倍。换句话说,在显存速度相同的情况下,DDR显存的实际工作频率是普通SDRAM显存的2倍。而现在流行的GDDR3显
10、存由于采用8bit预取设计(DDR2为4bit预取),这样DRAM内核的频率只有接口频率的1/8,DDR3-1600的核心工作频率只有200MHz。值得一提的是,显卡制造时,厂商设定了显存实际工作频率,而实际工作频率不一定等于显存最大频率。此类情况现在较为常见,如0.8ns的显存最大能工作在2200 MHz,而制造时显卡工作频率被设定为2000 MHz,此时显存就存在一定的超频空间。这也就是目前厂商惯用的方法,让显卡以超频为卖点。综合位宽和频率之后,我们就可以得出显存的带宽。带宽是GPU与本地存储器传输的数据量标准。显存带宽的计算方法是:等效频率数据带宽/8。以公版RD4870为例,其显存系统
11、带宽=3600MHz256/8= 115.2GB/sec。在显卡工作过程中,Z缓冲器、帧缓冲器和纹理缓冲器都会大幅占用显存带宽资源。有的时候显存的容量并不重要,相同显存带宽的显卡采用1GB和512MB显存在性能上区别不大。因为这时候系统的瓶颈在显存带宽上,当碰到大量像素渲染工作时,显存带宽不足会造成数据传输堵塞,导致显示芯片等待而影响到速度。 另外,同内存一样,显存也存在延迟问题。这就导致了某些GDDR4频率高于GDDR3而性能却较低的窘境。三、显卡做工及用料 PCB以及上面的原件虽然不直接影响显卡性能,但是却大大影响显卡的稳定性、超频性、寿命和2D画质。比较重要的部分,主要有供电模块、低通滤
12、波电路、PCB本身和其他部分原件等。先说说PCB本身吧。PCB是承载和连接显卡各种原件的基础和中枢。由于布线复杂,显卡都采用多层PCB制作。显卡所采用的PCB板层数对显卡影响很大,它会直接关系到包括核心、显存等的电磁干扰、屏蔽等问题,现在比较常见的是6或者8层的PCB设计,当然PCB层数越多越好。高端的显卡一般会选择10层或者12层PCB来设计显卡,这是因为高端的显卡对PCB的电气性能要求非常的高,即使很小的信号干扰也可能造成严重的后果。高端显卡的屏蔽层也非常重要,例如当初的GF7900GT花屏事件,很大的原因是其使用的P455公版PCB较GeForce 7900GTX的P348型号PCB少了
13、两层屏蔽层。为了保证稳定,顶级的GTX280和当年的卡皇2900XT甚至采用了14层PCB的设计。除了层数之外,PCB的布线也十分重要。优良的走线可以保持信号可靠性,同时兼顾抗电磁干扰能力和尽可能少的对外电磁辐射,为此设计者常常在显卡上大量采用蛇型布线和安排电容来解决这个问题,设计良好的电路除了提高信号稳定性外,还有助于消除电路在电流通过时产生的交越电感现象。说完PCB,再谈谈显卡的心脏供电模块吧。这是一个显卡的供电模块(貌似缩水很大的说)的照片。从左上到右下的原件依次为电容、电感、MOS管。供电模块一般由电容、MOS管、和电感组成。在供电模块,电容主要起滤波作用,通过这些电容,可以过滤掉电源
14、中不纯净的那一部分杂波,使显卡供电更加稳定。电容品质的优劣直接决定了显卡工作的稳定性和显卡的使用寿命。由于电容容量有大有小,我们不能通过电容的多少来简单判断用料的好坏。而电容的耐压值和可承受温度是不能忽视的最重要方面。如果使用耐压值较低的电容,长期工作在临界电压,很容易造成电容的损坏。于是,固态电容近几年便大大流行开来。与普通的液态铝电容相比,固态铝质电解电容器在物理上的区别是使用的导电性高分子介电材料为固态而非液态,在长期不通电的情形下该材料不会与氧化铝产生作用,通电后不致于发生像普通的液态铝电容一样容易造成开机或通电时形成爆浆甚至爆炸的现象。在一般低阻抗电容的使用环境中,固态铝质电解电容器
15、的寿命为液态电容的2.5倍以上,且导电性、频率特性及寿命均较普通电容强,更适用于目前低电压、高电流的应用,所以可以彻底解决普通电容爆浆问题。虽然如此,我们也不能完全迷信固态电容。由于显卡更新换代非常快,固态电容长达几十年的寿命就显得有些多余了。所以,对于一般用户,高品质的液态电容也是不错的选择。MOS管除了能稳定电流之外,它最大的作用是控制电流开关。MOS管成本较低,基本大同小异,需要注意的仅仅是每相供电所拥有的数目。现在数字供电逐步兴起,MOS管也趋向被淘汰了 电感也是起滤波的作用。它有裸露的,也有半封闭、封闭的。封闭的电感不仅彻底隔绝了灰尘和潮汽,还能屏蔽来自机箱内部其它元件带来的电磁干扰
16、。电容和电阻作为常用的电子元件,不仅仅只出现在供电模块中。形式也不一定是直立电容。例如显存周围,就需要大量电容和电阻来保证稳定。而与之相反的显卡,做工肯定不会好到哪里去 值得一提的是,很多显卡正面光秃秃的,显得用料很差,其实元件都集中在背面。例如公版的4850 最后讲以下低通滤波电路。显卡2D的画质并不主要取决于显卡的核心,低通滤波电路最为重要。拥有完整的低通滤波电路与低通滤波电路缩水的显卡,其2D画质的可谓天差地别,千万不要听信商家核心至上的宣传。对低通滤波电路进行偷工减料是大部分缩水卡常用的伎俩。下面是完整的低通滤波电路和缩水的低通滤波电路:正面:反面:缩水掉低通滤波电路的显卡:大家不要小看这个不影响显卡3D性能电路,它对画质的影响可以从下面两图对比看出来:好了,今天的课就讲到这里,除了散热部分(会另外开课讲解),显卡的基础知识基本已经讲完了。希望大家在选购显卡的时候,能充分考虑到各个方面,除了不要被JS所骗之外,千万不要图一时的便宜而影响几年的实用感受。附1:MXM全称为Mobile PCI Express Module,是由nVidia及多间笔记本生产商共同制定,采用和PCI-Express兼容的通讯协定,因此可使用於所有支援PCI-Express
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1