nVIDIA SLI技术解析.docx

上传人:b****5 文档编号:30037493 上传时间:2023-08-04 格式:DOCX 页数:15 大小:385.91KB
下载 相关 举报
nVIDIA SLI技术解析.docx_第1页
第1页 / 共15页
nVIDIA SLI技术解析.docx_第2页
第2页 / 共15页
nVIDIA SLI技术解析.docx_第3页
第3页 / 共15页
nVIDIA SLI技术解析.docx_第4页
第4页 / 共15页
nVIDIA SLI技术解析.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

nVIDIA SLI技术解析.docx

《nVIDIA SLI技术解析.docx》由会员分享,可在线阅读,更多相关《nVIDIA SLI技术解析.docx(15页珍藏版)》请在冰豆网上搜索。

nVIDIA SLI技术解析.docx

nVIDIASLI技术解析

nVIDIASLI技术解析  

  SLI技术是实现了两款显卡同时出现在一块主板上,构成一套SLI双显卡并行系统,这一技术的应用更大程度的满足了用户对高品质画质的需求。

  SLI桥接器。

  通过SLI桥接器连接的两片GeForce7950GX2显卡。

  

  如图所示,我们可以看到,nVIDIA的SLI互连不再是和Voodoo2一样借助线缆,而是使用一块两端有“MIO”接口的PCB连接子卡。

卡上的接口有点儿类似PCIExpress×1,而在显卡的顶部位置则预留了对应的接口。

这样,该SLI连接卡就可以将两块nVIDIA显卡连接起来,实现SLI并行运作。

nVIDIA官方表示,选择PCB卡连接可充分保证信号通讯的质量与速度,显卡间的数据传输采用数字形式进行,这样可有效防止因信号干扰而导致画面不同步的弊端(nVIDIA已经公布了可用驱动支持nVIDIAGeForce6600标准版组建SLI系统,而这种新型的SLi系统无需通过连接卡便能实现)。

Voodoo2所采用的技术是模拟传输方式,数字信号先被转换为模拟信号后才进行合成,因为干扰的影响,在某些时候会出现数据不匹配的问题,导致合成后的画面往往难以同步或出现其他问题,这也是Voodoo2SLI技术的主要缺陷。

而改用数字信号传输,显然就不存在这个问题,显卡处理完的帧数据被集合起来合成,然后才转为模拟信号输出,从而确保画面的完整性。

NV40核心内的SLI功能控制逻辑  

  nVIDIA将SLI控制功能直接的集成到在显卡的GPU芯片内部,从上图的芯片的逻辑图中可以很容易的看到,在显示核心的左侧左侧偏下的位置有一个很小的区域专门负责SLI运作,该区域所掌管的职能包括两块显卡的连接、通讯,渲染任务的指派以及画面的合成等等。

由于指令的传输工作相对简单,在芯片的FCBGA封装中也只有极少几根针脚用于SLI模式。

但由于别的GPU并没有集成这一控制逻辑,所以别的显卡并不支持这一技术,但由于特殊的原理的所以SLI技术并不支持AGP总线,SLI技术只可运行在PCI-E模式下,对主板提出了新的要求。

不过最令人称奇的还是它的并行能力,nVIDIA的研发专家声称,SLI技术最多可以支持8块GPU并行运作,虽然在消费市场没有什么意义,但在工作站领域,8块GPU并行意味着可获得超高的渲染效率。

  

  以上介绍的只是SLI最表象的特征,真正的关键在于这套系统的运作机制。

SLI的两款显卡地位并不是对等的,一块显卡作为主卡(Master),另一块则作为副卡(Slave)。

其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作,而副卡只是接收来自主卡的任务进行相关处理,然后将结果传送回主卡。

这里,我们需要明确数据传送的两个途径。

两块显卡都是通过PCIExpress接口与主板连接,而这两块卡之间还有一个通讯的PCB卡。

其中,连接两块显卡的PCB卡用于任务指派指令以及后期处理结果的传送,这部分的数据量不会很大,所以PCB卡所使用的接口和自身结构都较为简单。

但是,显卡在渲染过程中必须调用大量的数据,这部分数据只能通过PCIExpress接口从系统中获取。

换言之,在SLI系统中有两部分不同的数据流向,一部分为主卡将任务指令通过PCB连接卡传送给副卡,副卡将渲染完毕的结果数据返回给主卡合成,另一部分为处理过程中从PCIExpress接口得到的原始数据。

Voodoo2的传统奇偶分工方式  

  Voodoo2的SLI技术采用帧线方式划分任务:

一幅渲染的画面被分成奇数渲染帧和偶数渲染帧两个部分,然后交给两块显卡分别渲染,完毕之后再统一合成。

虽然nVIDIA继续沿用了“ScalableLinkInterface”的名号,但工作的方式已经有本质性的不同。

在nVIDIA的SLI系统中,一幅渲染的画面被划分为上下两个部分,主显卡完成上部分画面,副显卡则完成下半部分的画面,然后副显卡将渲染完毕的画面传输给主显卡,主显卡再将它与自己渲染的上半部分画面合成为一幅完整的画面。

这样,一个完整的SLI并行渲染任务就完成了。

同理,倘若有四块GPU并行运作,那么画面会被分成四个部分分别渲染,8个GPU并行也是如此。

nVIDIASLI的智能分工方式  

  传统的多GPU技术多半采用任务均分的方式,两块显卡完成的渲染任务量完全均等,Voodoo2的SLI及之后的Voodoo5系列都是如此,ATi的MAXX显卡和XGI的VolariDuo系列产品也是采纳类似的思想。

但这种任务均等分派的设计并不科学:

首先,主显卡或主GPU必须承担额外的控制、任务分配、画面合成和输出等工作,用于渲染的运算资源较少,但它必须完成与副卡一样多的任务。

结果自然是,副卡率先将任务完成,把结果数据回传后便处于等待状态,直到主卡将本批次任务处理完毕之后才可以继续进行任务指派;第二,同一幅画面不同区域的复杂度并不相同,所需的运算量也不一样,如果使用Voodoo2的帧线划分方式那也没什么,但nVIDIA的SLI采用划分上下画面的方式,如在常见的赛车游戏中,画面上半部分几乎是静态的,而下半部分就非常复杂,需要处理的数据量很大,如果单纯将画面作均等的划分也不科学。

  

  为此,nVIDIA另行开发了一套动态负载平衡技术,画面的上下划分并不是按照固定的一半一半方式,而是根据画面的复杂情况进行划分,如可能为4:

5或3:

2等非均等的模式。

这样的分配并不是为了保证工作量在两块卡间的绝对平均分配,而是要将两块显卡完成渲染任务的时间保持一致,以此达到效能的最优化。

考虑到主显卡需要承担额外的控制任务,用于实际渲染运算的资源较少,动态负载平衡算法就可以根据这一前提,将任务量适当多给副卡分担。

这样,nVIDIA所构建的SLI系统就可以保证两块显卡都工作在最佳效率条件下。

要提到的是,这项动态负载平衡算法并不是集成在GPU芯片内部,而是在驱动程序中整合,nVIDIA可以方便对其进行修改,以提供更佳的性能。

  

  以下是这种动态负载平衡技术进行均衡的多种渲染的过程:

1.待渲染的画面被分成上下两部份

2.渲染完毕后统一交给主卡进行合成

3.主卡将合成后的画面输出到显示器  

  但是,这种动态平衡技术并非万能的,nVIDIASLI的无法支持在不同的显卡间构建并行系统,而两块显卡协同工作时上下两部分画面的V-Sync(垂直同步)也是一个问题,如果打开该功能势必会对游戏性能产生一定的影响,不过nVIDIA表示已采用缓存技术来解决这个问题,另外建立SLI工作模式后的两块显卡也都支持超频,但必须使两块显卡的频率完全保持一致。

  

  nVIDIA在推出SLI技术时就受到了人们的关注,客观上地说,Multi-GPU的确是一项可以切实提升图形显示性能的技术,它通过双卡并联输出,其理论图形性能可得到将近一倍的提升,游戏爱好者可以充分体验到这种速度提升快感,而对于专业设计人员来说,SLI也将带来效率的翻倍也使得渲染工作的时间几乎可缩短一半。

  

  通过这种先进的SLI技术我们可以得到几乎翻倍的图形显示性能,把它引入实际应用也不再不切实际了,它不再像以前组建Voodoo2SLI那样昂贵,普通消费者也可以轻易体现到这种先进的技术,这一方面是因为受到ATiCrossfire带来的压力,而对于长远来说,nVIDIA可以在负载平衡算法以及核心开发上下功夫,这种SLI技术和市场定位也要不断演变,让更多的消费者都能轻易组建自己的SLI系统,例如使新旧显卡一起工作在SLI模式下,用户升级时不用抛弃旧显卡而只需购买一张更快的显卡来构建SLI系统。

SLI的发展前景是光明的,要是能使SLI普及化,将会对整个显卡市场产生深远的影响。

  

  不过,在nVIDIA刚推出这种双卡并联技术时,作为普通消费者的我们是可望不可及的,因为早期支持开启SLI模式只有Geforce6800等高端显卡,另外支持SLI亦要使用唯一的nForce4SLI芯片组平台,整套配置成本上是相当昂贵的。

因为高姿态的SLI技术对于一般应用实在是不切实际,所以在SLI面世一年后,来自各方面的压力,NV终于走下神台,通过更新驱动,SLI双卡模式在中低端的显卡产品上都能实现,SLI从此普及起来。

  

  在SLI推出初期,硬件上实现SLI其实并不是问题,但是对于当时来说,对应支持双卡加强输出的大型图形处理软件和游戏等都屈指可数,软件未能普及支持SLI技术也是阻碍SLI前进的一大关键因素,直到进入2005年下半年,业界才逐渐推出针对SLI优化的程序和游戏,如经典的3DMark06、Quake4、F.E.A.R等都是可对应SLI加速的软体和游戏,而到如今2007年,支持SLI技术的软体不断增多,SLI也越来越普及了。

  [技术]SLI常见问题及答案

  SLI是什么?

其工作原理是什么?

  SLI(可灵活伸缩的连接接口)是一项旨在实现高性能的技术,让用户可以通过在一套系统中配置多颗nVIDIAGPU,巧妙地组合并提升图形芯片的性能。

SLI的工作原理是以一种智能化的方式提高两颗GPU的几何和填充率性能。

  该技术与3dfx的SLI有何不同?

  nVIDIASLI在许多方面都与其大不相同。

第一,3dfxSLI是在基于PCI架构的共享总线上实现的。

PCI总线的总线吞吐量约为100MB/s,而PCIExpress则是一种点到点接口,可提供约60倍于PCI总线的总带宽。

第二,3dfxSLI执行隔行扫描,属于模拟应用,因此可能由于数模转换差异和其他因素等造成图像质量欠佳。

此外,3dfxVoodoo技术仅执行三角形设置,需要由CPU完成几何运算,因此3dfxSLI只能提高简单纹理填充率的性能,并且该技术利用的是帧间灵活伸缩性。

nVIDIASLI技术则是基于PCIExpress技术,采用一种完全数字化的帧组合方法,对图像质量无任何影响,可提高几何性能,支持多种实现灵活伸缩性的算法,能够根据应用需要选用最有效的方法来实现灵活伸缩性。

  SLI技术是否支持AGP架构?

  不。

SLI技术是专门针对PCIExpress架构而设计的。

这种新的总线拥有更高带宽(为AGP8X的两倍至四倍),支持同步数据传输,并可驱动多台高速图形处理装置。

而AGP8X则仅可驱动一台高速图形处理装置,因此不太适用于SLI。

  SLI桥接器的功能是什么?

  SLI桥接器是GPU之间的专用连接工具,可传输同步、显示和像素数据。

SLI桥接器可使GPU之间的通讯速率最高达到1GB/s,同时不会占用PCIExpress总线的带宽。

SLI桥接器适用于GeForce6600GT以及更高版本的产品。

对于其他所有SLI-Ready图形显卡,GPU之间的数据通讯都是通过PCI-Express总线,而不是通过SLI桥接器。

对于这些主流GPU,PCI-Express总线通常有足够的带宽来对额外的通讯进行有效地管理。

功能更强的GPU(GeForce6600GT以及更高版本的产品)需要SLI桥接器来实现最佳的缩放效果。

  SLI技术可支持哪些操作系统?

  SLI技术可支持32位和64位WindowsXP/vista以及32位和64位Linux操作系统(IA-32和AMD-64/EM64T)。

  SLI技术可支持哪些应用程序?

  SLI可支持所有游戏程序,包括OpenGL和Direct3D游戏程序。

SLI能使用SLI交替渲染(AFR)或分屏渲染(SFR)实现3D伸缩性能,或能使用SLI反锯齿模式实现增强的视觉效果。

  为什么不是所有的游戏都通过SLI得到效能提升?

  使用SLI技术后,图形芯片所运行的应用程序的性能可得到空前的提高,最高可达以前的两倍。

当今最热门的游戏和新一代游戏都属于此范围。

然而,有些应用程序、典型的老一代应用程序受到图形芯片处理能力之外的因素限制。

  最常见的限制是受CPU束缚的应用程序。

如果应用程序受到CPU束缚,增强图形处理能力也无法提高性能。

在1024x786低分辨率下,无其他功能开启,此情况最为常见。

打开反锯齿和各向异性过滤器,或切换到更高的分辨率,常常可以让瓶颈回到GPU上。

  对于受CPU性能影响较大的应用程序,nVIDIA提供一种新的SLI渲染模式,即SLI反锯齿。

此渲染模式可使客户激活SLI8x或SLI16x反锯齿,并增强所有游戏程序的视觉效果。

  什么是SLI抗锯齿技术?

  SLI抗锯齿技术是一种全新的独立式渲染模式,通过由两片显卡分担抗锯齿处理任务,将抗锯齿性能提升至两倍。

启用后,SLI抗锯齿可提供2种全新抗锯齿设置:

SLI8x和SLI16x。

  基于SLI的系统是否支持输出至电视机或高清电视机?

  支持。

SLI系统可将信号输出至标清电视机和高清电视机。

  在SLI模式下,屏幕上出现的绿线是为什么?

  如果屏幕上出现纵向或横向的绿线,表明激活了nVIDIA显示控制面板中的“显示GPU负载平衡”。

激活此选项后,将显示您的GPU如何分配图像负载。

对于使用AFR(交替渲染)进行渲染的游戏,纵向线条将根据缩放的总量变粗或变细。

对于使用SFR(分屏渲染)进行渲染的游戏,横向线条将上下移动,以显示负载如何在各个GPU之间获得平衡。

如果屏幕的上半部分和下半部分情况相似,横向线条将保持在屏幕中间位置。

注意:

如果同时启用了Vsynch,则可能不会显示这些线条(并不表示未启用SLI模式)。

  不同品牌的图形显卡是否能在SLI模式下兼容?

  当前的nVIDIA驱动程序已经可以在SLI模式下支持两个不同品牌的图形显卡,客户需要匹配GPU模式类型。

  能否将一片由制造商进行了超频的显卡与标准显卡进行混合配置?

  可以。

  能否混合配置显存规格不同的显卡?

  虽然建议用户最好不要这样配置,nVIDIA支持用户借助Coolbits实现这种配置。

在购置第二片显卡时,用户应当尽量选择与已有显卡具备相同规格显存的显卡,以便获得最佳价值和最优性能。

例如,如果原有的显卡是GeForce8600GT256MB,那么新买的显卡最好也是GeForce8600GT256MB。

不过,利用Coolbits,用户可以将两片显卡均设置为使用其中规格较低的显存并以SLI模式运行。

  SLI能不能支持两片以上显卡?

  SLI技术并不局限于只使用两片GPU,在CES2006展会上,nVIDIA已经展出了支持4颗而不是1颗、2颗或3颗GPU的四重SLI技术,而3-waySLI和混合SLI技术也将在近期公布。

 [回顾]从曙光女神到交叉火力

ATi的RageFuryMAXX显卡。

  

  其实不只是3dfx与后来收购它的nVIDIA才有双卡互联技术,ATi的RageFURYMAXX也是有关类似的方案的。

资深一些的DIYer一定对当年ATi的RageFuryMAXX记忆犹新,这款显卡在一块PCB板上采用两块Rage128pro芯片协同工作。

虽然它是一种单显卡形态,但与Voodoo2SLI、metebytePGC方案并没有本质性区别,都是两颗芯片“分工合作”实现性能大幅提升。

不过在具体的任务指派机制上,RageFURYMAXX又有不同:

它没有采用画面分割、分别渲染、合成的套路,而是让一颗Rage128Pro芯片渲染第一幅画面,另一颗Rage128Pro芯片渲染第二幅画面,完成之后第一颗芯片再渲染第三幅画面,依此类推。

相比前两者,RageFURYMAXX的好处是只需用到一条AGP槽,但付出的代价是单块显卡高昂的价格!

  

  在开发之时,RageFuryMAXX被ATi寄以厚望用以与GeForce256进行对抗,这一点从其名字中就可以看出来——“MAXX(曙光女神)”是美国空军秘密研发的高超音速侦察机的名字,据说它采用一种全新的推进技术,可以在6万多米的高空上以8马赫(8倍音速)的速度飞行。

ATi认为他的新显卡将没有对手,采用这个名称名副其实。

RageFuryMAXX可以说开创了单PCB双核芯的先河,但是由于市场的不成熟,还有RageFuryMAXX上复杂的AGP桥接架构,以及当时操作系统和软件支持上的不足,RageFuryMaxx在双核心市场中也只是昙花一现而已。

simFUSION6000工作站显卡,采用双PCB,每个PCB上集成2个Radeon9800芯片。

  

  2003年,正是ATi的Radeon9800系列风光无限的时候,但是他在多卡互联的探索并没有停止,上图的这款产品,就是ATi连同Evan&Sutherlands的推出的simFUSION6000工作站显卡,集成了多达四颗Radeon9800芯片,采用双PCB连接、每个PCB上集成2个核心,后期甚至还推出过采用四颗Radeon9800XT芯片的类似产品。

在同一年,Sapphire(蓝宝)也展示过一片采用Radeon9800Pro芯片的单PCB双GPU的的工程版显示卡。

  

  在多卡互联的探索上,ATi的脚步并不比其他厂商落后,只是限于技术和市场的接受程度,ATi早期很少在家用市场涉及类似的产品。

随着近年来对3D图形性能需求的快速发展以及GPU发展遭遇瓶颈,并且加上竞争对手nVIDIA的SLI技术带来的巨大压力,ATi终于在2005年6月发布了名为CrossFire(也就是所谓的“交叉火力”简称“交火”)的双卡互联技术。

ATi的第一代CrossFire。

  

  第一代CrossFire应用在RadeonX800或者X850显卡上,对应的RadeonXpress200CrossFire主板拥有2个PCIExpressX16插槽连接两块显卡,两块显卡将会通过专用的数据线通过DVI-I接口连接到一起,然后从属显卡的数据将会输出到另一块主显卡上,最终合成并输出到显示屏,一些多GPU渲染模式也会被相应实现。

ATi第二代的RadeonX1900CrossFire。

  

  为了解决第一代CrossFire高分辩率限制的问题,ATi把新一代Radeon中低端显卡家族的CrossFire技术改良了,并不需要采用Compositing引擎,也就是说不通过专门的信号通道,而是直接通过主板的PCI-E带宽传送数据实现CrossFire。

而在高端显卡的CrossFire方面则通过改进Compositing引擎来将最高分辨率提升至2048x1536。

目前第三代的CrossFire已经取消主副卡之分,两片显卡通过交火连接桥进行连接。

  

  在经历过两代CrossFire后,ATi从RV570开始将双卡互联引擎集成到图形核心内(也就是原生CrossFire),也从这一代的交火技术中,不再有主副卡之分,通过交火连接桥将两片显卡顶部交火接口的金手指连接起来,ATI的两个桥接器可以实现24bit(12bit×2)、350MHz的传输速率,另外要注意的是,ATI留有了两个交火金手指接口,单独只插一个桥接器不能够组建CrossFire。

新的交火技术不仅为我们带来了更加简便的连接方式,同时在成本、性能方面都有了不小的改善。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 党团建设

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1