gpu破解解决方案.docx

资源描述

gpu破解解决方案.docx

《gpu破解解决方案.docx》由会员分享，可在线阅读，更多相关《gpu破解解决方案.docx（5页珍藏版）》请在冰豆网上搜索。

gpu破解解决方案.docx

gpu破解解决方案

　　篇一：

GPU服务器解决方案

　　SiTon-GPU服务器

　　4个GPU,4万亿次/1,792核个人超级计算机

　　特性和优势

　　大规模CUDA并行架构，使工作站的功耗和成本分别降至原来的1/20和1/10，性能却能

　　与小型集群媲美

　　支持4个TeslaC2050/C2070/C2075计算处理器（每个处理器有448个核心，共1,792个核

　　心）

　　可提供Teraflops的单精度浮点运算性能和Teraflops的双精度浮点运算性能CUDA程序环境，支持多种编程语言和API，包括C、C++、OpenCL、DirectCompute

　　或Fortran

　　具备内存数据保护功能，加强了应用数据的完整性和可靠性。

注册文件、L1/L2高速缓

　　存、共享内存和DRAM都处于ECC保护状态

　　NVIDIA?

并行数据缓存（DataCache?

）技术，能够对无法预知数据地址的算法进行

　　加速，例如物理解算器、光线追踪、以及稀疏矩阵乘法等等

　　NVIDIA?

GigaThread?

引擎通过更快的上下文切换、同时内核执行以及改善的线程块

　　调度功能，最大限度提升了吞吐量

　　适用于生命科学，地球科学，工程和科学，分子生物学，医学诊断，电子设计自动化

　　（EDA），政府和国防，可视化，金融建模，以及石油和天然气等应用程序的理想选择

　　规格:

　　支持4个TeslaC2050/C2070/C2075计算处理器（每个处理器有448个核心，共1,792个核

　　心）

　　每台服务器可提供Teraflops的单精度浮点运算性能和Teraflops的双精度浮点

　　运算性能

　　IEEE754单双精度浮点运算标准

　　支持12或24GB的专用DDR5内存（每颗TeslaC2050GPU3GB，每颗Tesla

　　C2070/C20756GB）

　　4x384-bitGDDR5内存位宽（每个GPU384-bitGDDR5接口）

　　地址：

北京市海淀区北三环西路48号科技会展中心1号楼A座15C电话：

/62

　　显存总带宽达576GB/s（每个GPU144GB/s）支持2颗32纳米英特尔至强处理器Westmere

　　5600系列，每处理器6内核,12线程，和12MB二级缓存

　　支持TrustedExecution,AdvancedEncryptionSecurity,以及新的指令集（AESNI）,Turbo

　　Boost,Intel?

Virtualization,Intel?

QuickPath

　　Intel5520芯片组，处理器集成内存控制器

　　IntelQuickPath总线架构，高达GT/s/GT/s/GT/s的总线带宽最高192GB1333/1066/800MHzDDR3ECCRegistered内存8x"SAS/SATA热插拔硬盘位两个额外的单插槽卡扩展槽

　　机器尺寸：

7"（178mm）x"（452mm）x"（746mm）（高x宽x深）

　　产品示例图：

　　地址：

北京市海淀区北三环西路48号科技会展中心1号楼A座15C电话：

/62

　　配置一：

　　地址：

北京市海淀区北三环西路48号科技会展中心1号楼A座15C电话：

/62

　　配置二：

　　北京思腾创新科技发展有限公司

　　官方网站：

/retype/zoom/433c7dc249649b6648d747c9?

pn=4&x=0&y=794&raww=584&rawh=75&o=jpg_6_0_______&type=pic&aimh=&md5sum=e5ab11145ca3e623e8f3bdc66bb40bfd&sign=c715216fa7&zoom=&png=41475-47877&jpg=64018-139769"target="_blank">点此查看

　　本店掌柜手机：

刘立辉

　　地址：

北京市海淀区北三环西路48号科技会展中心1号楼A座15C电话：

/62

　　篇二：

CitrixGPU解决方案

　　一：

应用虚拟化

　　二：

标准桌面虚拟化

　　三：

HDX3DProGraphics

　　四：

FlexCastProvisioning流模式

　　五：

Multi-GPUPass-throughforXenDesktop&XenApp

　　1.GPUPass-through的原理

　　2.GPUPass-through对GPU的硬件要求

　　3.GPUPass-through适用场景

　　4.GPUPass-through配置命令

　　5.GPUPass-through限制条件

　　6.GPUPass-through注意事项

　　针对不同的绘图应用程序、图形的类型（二维/三维）和图纸文件的大小，Citrix提供五种不同的解决方案，都能够满足将图纸文件集中到数据中心统一管理以实现对安全性的要求。

下文中详细描述四种方案在性能、硬件需求等方面的需求。

　　一：

应用虚拟化

　　使用CitrixXenApp发布绘图应用程序，用户使用普通PC或瘦客户机远程访问。

XenApp可以让多个用户同时访问，分享服务器资源。

示意图如下：

　　应用虚拟化方案适合用于发布OA应用、财务应用以及二维轻量图形应用，优点是多用户共享后台服务器资源，对硬件需求较少，例如4GB内存的PC服务器可以支撑50个Office用户的同时访问。

同时由于高效的ICA协议，应用虚拟化解决方案对网络要求很低，每个会话只占用20Kbps左右的带宽。

　　但是对于图形处理要求高（特别是需要图形加速卡才能工作的）或者有特殊License控制的应用软件，这种方案并不适用。

　　二：

标准桌面虚拟化

　　CitrixXenDesktopFlexCast中标准VDI解决方案，使用XenServer将一台物理机虚拟成多个虚拟的WindowsXP操作系统，在虚拟机中安装各种应用软件，使用CitrixICA协议将桌面远程交付给终端用户。

其示意图如下：

　　与应用虚拟化方案相比，该方案由于每个用户独占一个虚拟机操作系统，可以有效支持某些特殊License要求的应用程序，同时图形应用的性能稍好。

由于使用了服务器虚拟化技术，多个用户可以共享同一台物理服务器，例如一台两路四核、16GB服务器可以同时支持30个左右512M内存的XP用户。

　　但是由于服务器虚拟化技术无法利用图形显示卡，重负荷的图形应用远程访问时性能较差。

例如Catia的文件，50M左右的三维部件图形能尚可，但是几百兆的整机图三维旋转不连续。

　　三：

使用ICA协议访问远程刀片工作站：

HDX3DProGraphics

　　在图纸类研发设计企业中，用户会用到的画图软件有些资源需求一般，如Autocad、Pro/E常用于2D图，有些资源需求较大，如Catia常用于大型的3D图，XenApp如果服务器够强劲的话，可以满足Autocad、Pro/E等2D图纸设计需要，但Catia等大型的3D图XenApp就不合适了，服务器的负载会很重，50M左右的三维部件图形能尚可，但是几百兆的整机图三维旋转时，客户端就只能看到不连续的旋转效果了。

所以大型的3D设计需要采用XenDesktop来实现，在服务器端为每个用户单独分配一台虚拟机，而不是像XenApp一样多人共用一台机。

　　但采用XenDesktop也带来一个核心的问题，由于每个用户的操作系统是虚拟出来的，但是目前的虚拟机所虚拟出来的显卡，是不支持图形加速功能的，大型的3D设计图就算你给操作系统再多的CPU和内存，但由于没有专门的图形加速卡来处理，

　　所以

　　客户端还是只能看到不连续的旋转效果图。

CitrixXenDesktopFlexCast中的HDX3D方式可以代替使用ICA代替这些专用传输协议，在100Kbps左右的带宽条件下就可以使三维图形软件流畅工作。

　　简单说Citrix的HDX3DProGraphics就是不采用虚拟机，而直接采用物理机的方式来解决图形加速卡的问题。

在后台为每个用户准备好一台物理的服务器，服务器可以是塔式的服务器，也可以是刀片的服务器。

然后在这些服务器上安装CitrixHDX3DProGraphics客户端程序（当然还有VDA的客户端），再通过XenDesktop将这些机器安装好了3D画图软件的桌面，发布给画图的客户端人员通过Citrix客户端来使用。

　　其示意图如下：

　　和前两种方案相比，使用ICA协议访问远程刀片工作站的解决方案可以提供最好的图形效果，因为CitrixXenDesktop的HDX3D代理可以有效利用刀片工作站上的图形加速卡，远程桌面的图像信息经过图形加速卡处理后再交由ICA协议传输到客户终端。

和硬件厂商的专用传输协议相比，对网络资源的占用大大减少，但是性能基本上保持一致。

由于每个用户都需要占用一台刀片工作站，因此成本较高，管理工作量也比较大。

四：

无盘工作站（PVS的流模式）

　　由于HDX3DProGraphics模式每个用户都需要占用一台刀片工作站，因此成本较高，管理工作量也比较大。

CitrixXenDesktop桌面虚拟化FlexCast中还提供Provisioning

　　无盘

　　的解决方案，将用户原来带3D图形加速卡的高性能机器，本地硬盘的操作系统、应用程序和用户文件整体打包，制作成类似Ghost的镜像文件，保存到后台ProvisioningServer服务器上或者是后台存储上，然后拔除本地硬盘。

在系统BIOS中改成使用网卡PXE启动，利用PXE功能和后台ProvisioningServer取得联系，再将镜像文件通过Streaming技术加载到前端的PC中，所有的操作运算其实都发生在本地的CPU、内存，并调用本地的图形加速卡处理。

　　FlexCastProvisioning是XenDesktop产品组件，部署和实现不需要硬件架构调整，除了拔硬盘。

其实意图如下：

　　这种方案在保证数据安全的前提下需要的投资最小，性能和传统的PC最接近，基本没有损耗。

　　但是由于在Streaming过程中，大量数据会在网络中传输，该方案对网络要求较高。

同时如果客户端硬件配置不标准，有很多个性化的不同镜像，就会带来很大的管理工作量。

　　五：

MultiGPUPass-through

　　Pass-through的原理

　　第三种HDX3DProGraphics模式会带来成本上的问题，而第四种的FlexCastProvisioning流模式也导致网络开销过大，有没有一种折衷的方式呢？

答案是有的，就是利用XenServer版本正式支持的GPU透传模式。

　　Multi-GPUPass-through，即GPU透传模式就是将主机的多块物理GPU按照一比一的比例分配给此主机上运行的虚拟桌面，并且通过CitrixXenDesktop的HDX3DPro技术让此虚拟桌面里面的应用程序直接调用GPU板卡处理能力，实现三维运算工作站集中管理和维护。

下图左边就是第三种模式的工作原理图，右边就是Multi-GPUPass-through的工作原理图。

　　Multi-GPUPass-

展开阅读全文