毕业设计显卡的技术与评测Word格式文档下载.docx
《毕业设计显卡的技术与评测Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《毕业设计显卡的技术与评测Word格式文档下载.docx(18页珍藏版)》请在冰豆网上搜索。
1.1PC图形卡的简介
显卡主要分为专业图形卡和娱乐图形卡,近年来图形卡产品有了爆炸式的增长,专业图形卡产品和娱乐图形卡产品的界限越来越模糊。
许多DIYer通过RivaTuner等工具轻易的修改Geforce为Quadro、修改Radeon为FireGL。
但是这样的修改并没有使得专业图形卡的价格有所下降,专业图形卡的价格依然几倍于娱乐图形卡。
专业显示卡主要针对的是需要OpenGL的三维动画软件(如3DSMax、Maya、Softimage|3D等)、渲染软件(如LightScape、3DSVIZ等)、CAD软件(如AutoCAD、Pro/Engineer、Unigraphics、SolidWorks等)、模型设计(如Rhino)以及部分科学应用等专业应用市场。
专业图形处理器针对这些专业图形图像软件进行必要的优化,都有着极佳的兼容性。
可获得无与伦比的性能和品质,从而满足最苛刻专业人员的需要。
适合从电影界的数字内容制作人到工厂的工程师、偏远石油钻探平台的地质学家这样的专业人士。
笔记本上常见的专业移动图形处理器包括AMD旗下的FireGL系列图形处理器和NVIDIA公司的QuadroFX系列图形处理器。
1.2论文概述
本人在公司实习的两个月中,完成了显卡技术评测,理论与实践相结合,让我更深入的了解显卡的技术与应用。
通过公司网站,本着提出问题,分析问题,解决问题的原则,对该课题的理论与实物进行了详尽的阐述。
在文章的第二章,就课题的目的,要求加以说明。
并分析各论证方案,取长补短,确定出本文所使用的方法,思想明确。
第三章中,对所涉及的显卡各部分以图文结合的方式呈现出来,直观具体。
并进一步分析各元件所使用环境,确定本文的设计思路与方向。
第四章主要是显卡的测试说明,对显卡的特性和稳定性测试做出详尽的分析。
论文的电路图依靠ORCAD完成,正是使用了简单易懂的画图工具,才使论文图文结合,更加清晰具体。
第二章任务与论证
2.1设计任务
该设计的目的是制作一个PC显卡,该系统由图形芯片(GPU)、显存、电源,RAMDAC等主要模块组成方框图,如图2.1所示:
图2.1所示系统方框图
2.1.1显卡的功能特性测试
(1)对OpenGL完善的支持
(2)绝对的稳定性
(3)足够高的渲染精度
2.2基本思想
(1)以GPU图形处理器为核心,来完成PC图形显卡的系统控制;
GPU中的3D显示芯片是将三维图像和特效处理功能集中在显示芯片内。
(2)利用PCIExpress(金手指)完成与主机的接口部分。
(3)开关电源部分提供给GPU电源,DDRSDRAMPOWERSUPPLY。
(4)DDR显存作为双倍速率同步动态随机存储器存储大量待处理信息。
(5)(VGA,DVI-I,Displayport)做为显示输出部分,向显示器输出相应的声音视频图像信号。
(6)PC显卡使用主动式散热设计,电源采用SWITCH开关电源设计,并对比LDO线形电源进行论证分析。
(7)对显卡的特性和稳定性进行严格测试,并分析测试结果。
2.3方案论证及设计
2.3.1电源的方案论证
方案1:
电源主要采用SWITCH降压型开关稳压电路(DC-DC变换器),降压开关稳压电路的工作原理:
当开关管断开时,电感的感应电动势使二极管导通,电感电流IL通过二极管和负载构成回路,由输入电源向负载提供能量。
方案2:
电源采用低压差线性稳压器(LDO),基本工作原理:
系统加电后,如果使能脚处于高电平时,电路开始启动,恒流源电路给整个电路提供偏置,基准源电压快速建立,输出随着输入不断上升,当输出即将达到规定值时,由反馈网络得到的输出反馈电压也接近于基准电压值,此时误差放大器将输出反馈电压和基准电压之间的误差小信号进行放大,再经调整管放大到输出,从而形成负反馈,保证了输出电压稳定在规定值上;
同理如果输入电压变化或输出电流变化,这个闭环回路将使输出电压保持不变
2.3.2论证分析
(1)对于显卡供电部分,要认真的分析它的电源需求。
不仅仅是
关心输入电压,输出电压和电流,还要仔细考虑总的功耗,电源实现的效率,电源部分对负载变化的瞬态响应能力,关键器件对电源波动的容忍范围以及相应的允许的电源纹波,还有散热问题等等。
功耗和效率是密切相关的,效率高了,在负载功耗相同的情况下总功耗就少,对于整个系统的功率预算就非常有利了,对比LDO和开关电源,如果一个驱动图像处理器的LDO输入电源是从单节锂电池标称的3.6V,在电流为200mA时输出1.8V电压,那么转换效率仅为50%,开关电源的效率要高一些。
(2)评估效率不仅仅是看在满负载的时候电源电路的效率,还要关注GPU负载的时候效率水平。
至于负载瞬态响应能力,对于一些高性能的应用就会有严格的要求,因为当GPU突然开始运行繁重的任务时,需要的启动电流是很大的,如果电源电路响应速度不够,造成瞬间电压下降过多过低,造成GPU运行出错。
一般来说,要求的电源实际值多为标称值的+-5%,所以可以据此计算出允许的电源纹波,当然要预留余量的。
结合以上两个事实,并为了满足设计要求,我们可以采用方案一,一般对于弱电部分,包括了LDO(线性电源转换器),开关电源电容降压转换器和开关电源电感电容转换器。
相比之下,开关电源最易实现,电路设计灵活,效率高,发热量小,而LDO设计输出纹波小,但缺点是效率有可能不高,发热量大,可提供的电流相较开关电源不大等等。
第三章电路设计与原理
3.1PC图形卡的基本原理及设计
显卡主要由图形芯片(GPU)、显存、电源、RAMDAC等构成,发展基本上经历了三个阶段:
ISA总线、PCI总线、AGP总线,
ISA:
PC上最早期的显卡都是ISA总线或EISA总线的,另外还有一种VESA总线的显示卡,这三种显卡可以统称为ISA类显卡。
在很多超期服务的386、486机器上,我们仍可以看见它们的影子。
PCI:
在一些工控机和特殊的场合PCI卡还在应用,PCI显卡比AGP还贵。
AGP:
AGP1X——AGP2X——AGP4X——AGP8X——PCIExpress
264MB/S——532MB/S——1GB/S——2GB/S——4..8GB/S
3.1.1GPU简介
GPU英文全称(GraphicProcessingUnit)中文翻译为“图形处理器”。
GPU是相对于CPU的一个概念,由于在现代的计算机中(特别是家用系统,游戏的发烧友)图形的处理变得越来越重要,需要一个专门的图形的核心处理器。
GPU是显示卡的“心脏”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。
2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。
3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。
显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。
于是NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。
GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。
GPU所采用的核心技术有硬体T&
L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&
L技术可以说是GPU的标志。
单说GPU就是能够从硬件上支持T&
L(TransformandLighting,多边形转换与光源处理)的显示芯片,因为T&
L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。
一个好的T&
L单元,可以提供细致的3D物体和高级的光线特效;
只大多数PC中,T&
L的大部分运算是交由CPU处理的(这也就是所谓的软件T&
L),由于CPU的任务繁多,除了T&
L之外,还要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上今天复杂三维游戏的要求。
即使CPU的工作频率超过1GHz或更高,对它的帮助也不大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系.
3.1.2RAMDAC简介
RAMDAC决定了刷新频率的高低(与显示器的“带宽”意义近似)。
其工作速度越高,频带越宽,高分辨率时的画面质量越好.该数值决定了在足够的显存下,显卡最高支持的分辨率和刷新率。
如果要在1024×
768的分辨率下达到85Hz的分辨率,RAMDAC的速率至少是1024×
768×
85×
1.344÷
1.06≈90MHz,我们通常在显卡上见不到RAMDAC模块,那是因为厂商将RAMDAC整合到显示芯片中以降低成本,不过仍有部分高档显卡采用了独立的RAMDAC芯片。
3.1.3显存简介
GPU在处理显示的信息的过程中,它会产生大量的临时数据(未处的、正在处理的、已经处理完成的),这就需要一个专门的地方来存放这些临时数据,那就是显存了,它也可能是一个芯片,也可能只是芯片的一部分。
数据位数是显存也是显卡的一个很重要的参数。
在显卡工作过程中,Z缓冲器、帧缓冲器和纹理缓冲器都会大幅占用显存带宽资源。
带宽是3D芯片与本地存储器传输的数据量标准,这时候显存的容量并不重要,也不会影响到带宽,相同显存带宽的显卡采用64MB和32MB显存在性能上区别不大。
因为这时候系统的瓶颈在显存带宽上,当碰到大量像素渲染工作时,显存带宽不足会造成数据传输堵塞,导致显示芯片等待而影响到速度
显存与系统内存一样,也是多多益善。
显存越大,可以储存的图像数据就越多,支持的分辨率与颜色数也就越高。
显存均以标准的大小提供:
16MB、32MB、64MB,128MB,256MB,512MB,以下计算显存容量与分辨率关系的公式:
所需显存=图形分辨率×
色彩精度/8。
例如要上16bit真彩的1024×
768,则需要1024×
16/8=1.5M,即2M显存。
对于三维图形,由于需要同时对Frontbuffer、Backbuffer和Zbuffer进行处理,因此公式为:
所需显存(帧存)=图形分辨率×
3×
例如一帧16bit、1024×
768的三维场景,所需的帧缓存为1024×
16bit/8=4.71M,即需要8M显存。
POWER:
提供给GPU电源,显存供电。
3.2主机接口部分(PCIExpress,AGP)
3.2.1PCIExpress简介及应用
PCIExpress(以下简称PCI-E)采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。
相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI-E的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。
PCI-E的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16,而X2模式将用于内部接口而非插槽模式。
PCI-E规格从1条通道连接到32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。
此外,较短的PCI-E卡可以插入较长的PCI-E插槽中使用,PCI-E接口还能够支持热拔插,这也是个不小的飞跃。
PCI-EX1的250MB/秒传输速度已经可以满足主流声效芯片、网芯和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。
因此,用于取代AGP接口的PCI-E接口位宽为X16,能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽,远远超过AGP8X的2.1GB/s的带宽。
尽管PCI-E技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI-EX1和PCI-EX16已成为PCI-E主流规格,同时很多芯片组厂商在南桥芯片当中添加对PCI-EX1的支持,在北桥芯片当中添加对PCI-EX16的支持。
除去提供极高数据传输带宽之外,PCI-E因为采用串行数据包方式传递数据,所以PCI-E接口每个针脚可以获得比传统I/O标准更多的带宽,这样就可以降低PCI-E设备生产成本和体积。
另外,PCI-E也支持高阶电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。
在兼容性方面,PCI-E在软件层面上兼容目前的PCI技术和设备,支持PCI设备和内存模组的初始化,也就是说过去的驱动程序、操作系统无需推倒重来,就可以支持PCI-E设备。
目前PCI-E已经成为显卡的接口的主流,不过早期有些芯片组虽然提供了PCI-E作为显卡接口,但是其速度是4X的,而不是16X的,例如VIAPT880Pro和VIAPT880Ultra,当然这种情况极为罕见。
3.2.2AGP简介及应用
AGP(AccelerateGraphicalPort),加速图形接口。
随着显示芯片的发展,PCI总线日益无法满足其需求。
英特尔于1996年7月正式推出了AGP接口,它是一种显示卡专用的局部总线。
严格的说,AGP不能称为总线,它与PCI总线不同,因为它是点对点连接,即连接控制芯片和AGP显示卡,但在习惯上我们依然称其为AGP总线。
AGP接口是基于PCI2.1版规范并进行扩充修改而成,工作频率为66MHz。
AGP总线直接与主板的北桥芯片相连,且通过该接口让显示芯片与系统主内存直接相连,避免了窄带宽的PCI总线形成的系统瓶颈,增加3D图形数据传输速度,同时在显存不足的情况下还可以调用系统主内存。
所以它拥有很高的传输速率,这是PCI等总线无法与其相比拟的。
由于采用了数据读写的流水线操作减少了内存等待时间,数据传输速度有了很大提高;
具有133MHz及更高的数据传输频率;
地址信号与数据信号分离可提高随机内存访问的速度;
采用并行操作允许在CPU访问系统RAM的同时AGP显示卡访问AGP内存;
显示带宽也不与其它设备共享,从而进一步提高了系统性能。
AGP标准在使用32位总线时,有66MHz和133MHz两种工作频率,最高数据传输率为266Mbps和533Mbps,而PCI总线理论上的最大传输率仅为133Mbps。
目前最高规格的AGP8X模式下,数据传输速度达到了2.1GB/s。
AGP接口的发展经历了AGP1.0(AGP1X、AGP2X)、AGP2.0(AGPPro、AGP4X)、AGP3.0(AGP8X)等阶段,其传输速度也从最早的AGP1X的266MB/S的带宽发展到了AGP8X的2.1GB/S。
3.3内存控制部分(DDRDDR2GDDR3)
3.3.1DDR显存
DDR是DoubleDataRateSDRAM的缩写,是双倍速率同步动态随机存储器的意思。
DDRSDRAM是在SDRAM基础上发展而来的。
SDRAM在一个时钟周期内只传输一次数据,它是在时钟的上升期进行数据传输;
而DDR内存则是一个时钟周期内传输两次数据,它能够在时钟的上升期和下降期各传输一次数据,因此称为双倍速率同步动态随机存储器。
DDR内存可以在与SDRAM相同的总线频率下达到更高的数据传输。
与SDRAM相比:
DDR运用了更先进的同步电路,使指定地址、数据的输送和输出主要步骤既独立执行,又保持与CPU完全同步;
DDR使用了DLL(DelayLockedLoop,延时锁定回路提供一个数据滤波信号)技术,当数据有效时,存储控制器可使用这个数据滤波信号来精确定位数据,每16次输出一次,并重新同步来自不同存储器模块的数据。
DDL本质上不需要提高时钟频率就能加倍提高SDRAM的速度,它允许在时钟脉冲的上升沿和下降沿读出数据,因而其速度是标准SDRA的两倍。
DDRSDRAM是目前应用最为广泛的显存类型,90%以上的显卡都采用此类显存。
3.3.2DDR2显存
DDR2显存可以看作是DDR显存的一种升级和扩展,DDR2显存把DDR显存的“2bitPrefetch(2位预取)”技术升级为“4bitPrefetch(4位预取)”机制,在相同的核心频率下其有效频率比DDR显存整整提高了一倍,在相同显存位宽的情况下,把显存带宽也整整提高了一倍,这对显卡的性能提升是非常有益的。
从技术上讲,DDR2显存的DRAM核心可并行存取,在每次存取中处理4个数据而非DDR显存的2个数据,这样DDR2显存便实现了在每个时钟周期处理4bit数据,比传统DDR显存处理的2bit数据提高了一倍。
相比DDR显存,DDR2显存的另一个改进之处在于它采用144Pin球形针脚的FBGA封装方式替代了传统的TSOP方式,工作电压也由2.5V降为1.8V。
由于DDR2显存提供了更高频率,性能相应得以提升,但也带来了高发热量的弊端。
加之结构限制无法采用廉价的TSOP封装,不得不采用成本更高的BGA封装(DDR2的初期产能不足,成本问题更甚)。
发热量高、价格昂贵成为采用DDR2显存显卡的通病,如率先采用DDR2显存的的GeForceFX5800/5800Ultra系列显卡就是比较失败的产品。
基于以上原因,DDR2并未在主流显卡上广泛应用。
3.3.3DDR3显存
DDR3显存可以看作是DDR2的改进版,二者有很多相同之处,例如采用1.8V标准电压、主要采用144Pin球形针脚的FBGA封装方式。
不过DDR3核心有所改进:
DDR3显存采用0.11微米生产工艺,耗电量较DDR2明显降低。
此外,DDR3显存采用了“PseudoOpenDrain”接口技术,只要电压合适,显示芯片可直接支持DDR3显存。
当然,显存颗粒较长的延迟时间(CASlatency)一直是高频率显存的一大通病,DDR3也不例外,DDR3的CASlatency为5/6/7/8,相比之下DDR2为3/4/5。
客观地说,DDR3相对于DDR2在技术上并无突飞猛进的进步,但DDR3的性能优势仍比较明显:
(1)功耗和发热量较小:
吸取了DDR2的教训,在控制成本的基础上减小了能耗和发热量,使得DDR3更易于被用户和厂家接受。
(2)工作频率更高:
由于能耗降低,DDR3可实现更高的工作频率,在一定程度弥补了延迟时间较长的缺点,同时还可作为显卡的卖点之一,这在搭配DDR3显存的显卡上已有所表现。
(3)降低显卡整体成本:
DDR2显存颗粒规格多为4MX32bit,搭配中高端显卡常用的128MB显存便需8颗。
而DDR3显存规格多为8MX32bit,单颗颗粒容量较大,4颗即可构成128MB显存。
如此一来,显卡PCB面积可减小,成本得以有效控制,此外,颗粒数减少后,显存功耗也能进一步降低。
(4)通用性好:
相对于DDR变更到DDR2,DDR3对DDR2的兼容性更好。
由于针脚、封装等关键特性不变,搭配DDR2的显示核心和公版设计的显卡稍加修改便能采用DDR3显存,这对厂商降低成本大有好处。
目前,DDR3显存在新出的大多数中高端显卡上得到了广泛的应用。
3.4显示输出部分(VGA,DVI-I,HDMI,Displayport)
3.4.1VGA接口
显卡所处理的信息最终都要输出到显示器上,显卡的输出接口就是电脑与显示器之间的桥梁,它负责向显示器输出相应的图像信号。
CRT显示器因为设计制造上的原因,只能接受模拟信号输入,这就需要显卡能输入模拟信号。
VGA接口就是显卡上输出模拟信号的接口,VGA(VideoGraphicsArray)接口,也叫D-Sub接口。
虽然液晶显示器可以直接接收数字信号,但很多低端产品为了与VGA接口显卡相匹配,因而采用VGA接口。
VGA接口是一种D型接口,上面共有15针空,分成三排,每排五个。
VGA接口是显卡上应用最为广泛的接口类型,多数的显卡都带有此种接口。
有些不带VGA接口而带有DVI接口的显卡,也可以通过一个简单的转接头将DVI接口转成VGA接口,通常没有VGA接口的显卡会附赠这样的转接头。
3.4.2DVI-I接口
DVI接口是1999年由数字显示工作组DDWG(DigitalDisplayWorkingGroup)推出的接口标准,是DigitalVisualInterface的缩写,其造型是一个24针的接插件。
是专为LCD显示器这样的数字显示设备设计的。
DVI接口有多种规格,分为DVI-A、DVI-D和DVI-I。
DVI-A其实就是VGA接口标准,所以带有DVI接口的液晶显示器也并不一定就是真正的数字液晶显示器;
DVI-D则实现了真正的数字信号传输。
而DVI-I通吃上述两个接口,当DVI-I接VGA设备时,就是起到了DVI-A的作用;
当DVI-I接DVI-D设备时,便起了DVI-D的作用。
为了兼容传统的模拟显示设备,现在的大部分显卡都采用了24只数字信号针脚和5只模拟信号针脚的DVI-I接口。
3.4.3HDMI接口
HDMI的英文全称是“High
DefinitionMultimedia”,中文的意思是高清晰度多媒体接口。
HDMI接口可以提供高达5Gbps的数据传输带宽,可以传送无压缩的音频信号及高分辨率视频信号。
同时无需在信号传送前进行数/模或者模/数转换,可以保证最高质量的影音信号传送。
应用HDMI的好处是:
只需要一条HDMI线,便可以同时传送影音信号,而不像现在需要多条线材来连接;
同时,由于无线进行数/模或者模/数转换,能取得更高的音频和视频传输质量。
对消费者而言,HDMI技术不仅能提供清晰的画质,而且由于音频/视频采用同一电缆,大大简化了家庭影院系统的安装。
HDMI接口支持HDCP协议,为看有版权的高清电影电视打下基础。
不过,为了让显卡带有HDMI接口,除了需要专用芯片外,显卡厂商还要支付一笔不斐的HDMI认证费,因此目前带有HDMI接口的显卡还不多。
但是HDCP已成定局,因此未来支持HDCP协议的显卡也会多起来。
3.4.4Displayport
视频电子标准协会(VESA)公布了DisplayPort显示接口标准的最终版本:
DisplayPort1.0。
作为DVI的继任者,DisplayPort将在传输视频信号的同时加入对高清音频信号传输的支持,同时支持更高的分辨率和刷新率。
DisplayPort1.0最大支持10.8Gb/S的传输带宽,而最新的HDMI1.3标准也仅能支持10.2G/s的带宽;
另外,DisplayPortisplayPort可支持WQXGA+(2560×
1600)、QXGA(2048×
1536)等分辨率及30/36bit(每原色10/12bit)的色深,1920×
1200分辨率的色彩支持到了120/24