ImageVerifierCode 换一换
格式:PPTX , 页数:23 ,大小:4.31MB ,
资源ID:14061583      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14061583.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(FPGA深度学习硬件加速方案PPT资料.pptx)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

FPGA深度学习硬件加速方案PPT资料.pptx

1、FPGA硬件加速为Hadoop+深度学习插上翅膀,专业引领梦想,我们致力于提供硬件加速的专业技术解决方案、产品和服务。#加速云 硬件加速产品可以广泛应用于数据中心、云计算、机器视觉、深度学习、仿真、金融、高性能计算等领域。#,云计算,深度学习金融计算,仿真,网络安全,医疗健康,基因比对,天气预报,分子化学,地震预测,加速云的技术应用场景,专业的解决方案和产品,01,02,解决方案Hadoop平台加速方案深度学习加速方案网络安全加速方案仿真加速和硬件在环仿真方案Spark平台加速方案金融行业数据加速方案大数据存储加速方案高性能计算方案机器视觉加速方案,硬件平台PCIe加速卡加速模块VPX 加速平

2、台机器视觉加速套件高密度服务器定制加速服务器,软件及IP集成开发环境(SIDE)深度学习库IPOPENBLAS 库IP压缩解压缩IP纠删码IP加解密IPFFT IP各种定制IP03,硬件加速平台-PCIe加速板卡SC-OPM,硬件加速平台-PCIe加速板卡SC-OPS,最新14nm 工艺FPGA S10,逻辑容量2800K,9.2TFLOPS单精度浮点,18.4TFLOPS16位 定点8个内存控制器,支持2400MHz 72bit DDR4(ES 2133MHz),最大支持64GB内存PCIe3.0 8lane或16lane(H-Lite支持)支持2个40GE或100GE接口(H-Lite支持

3、)标准全高3/4长(112*250mm)正在研发阶段,预计2017年4月份出样机,6月份量产,硬件加速平台-核心计算模块SC-IMB,硬件加速平台-机器视觉开发套件SC-VMB,高密度异构计算平台,SC-HPC08S,19英寸4U标准机箱支持8个PCIe 3.0 16Lane 槽位220V 3+1冗余电源,最大支持4000W两个E5 处理器,每个支持32GB内存2*PCIe 3.0 16Lane(20GB)互联带宽(X86 和异构计算卡之间)支持FPGA加速卡(SC-OPM/SC-OPS),支持GPGPU卡(K20/K40/K80/M4/M60/P4/P40)在FPGA加速卡时卡间支持40GE

4、/100GE(接 口也可以配置为SRIO/infinband/Serdes/)互 联超高性能功耗比(在插入SC-OPS时,整个系 统支持73.6TFLOPS单精度浮点,功耗为 1200W)可以广泛应用于数字信号处理、高性能计算、深度学习等领域,高密度异构计算平台,SC-HPC16S,19英寸5U标准机箱支持16个PCIe 3.0 16Lane 槽位220V 3+1冗余电源,最大支持8000W两个E5 处理器,每个支持32GB内存2*PCIe 3.0 16Lane(20GB)互联带宽(X86 和异构计算卡之间)支持FPGA加速卡(SC-OPM/SC-OPS),支持GPGPU卡(K20/K40/K

5、80/M4/M60/P4/P40)在FPGA加速卡时卡间支持40GE/100GE(接 口也可以配置为SRIO/infinband/Serdes/)互 联超高性能功耗比(在插入SC-OPS时,整个系 统支持150 TFLOPS单精度浮点,功耗为 2000W)可以广泛应用于数字信号处理、高性能计算、深度学习等领域,为什么选择FPGA,更高的性能功耗比更高的性能功耗比可以节省 数据中心运营成本,支持更多应用场景对随机操作、位操作和串行算法很 好支持可以适应更多应用场景,提 高系统性能;#低功耗和小型化可以 满足更多对功耗小型化有要求的场 景,更灵活快速部署通过加速云FPGA深度学习编译器 具有快速迁

6、移相应深度学习算法 到加速卡上。#利用局部可重构技 术可以远程快速部署,满足数据 中心云化需求,更高性价比低功耗可以降低系统运营成本,高集 成度可以降低建设成本,更高的性能 功耗比使的整体系统获得更高性价比,01,02,04,03,解决方案和产品优势,FPGA加速深度学习,01,海量数据,计算能力,03,02,算法,深度学习的应用模式,高性能灵活的RTL级加速库,深度学习库FDNN,高性能计算库FBlas,参数可配的深度学习基础库:#卷积、池化、全连接、非线性函数参数可配置的CNN/DNN/RNN库,可以兼容CAFFE/TensorFlow模型数据常见各种模型:#VGG16,Goolenet,

7、Lenet,Yolo,SSD,Resnet,Faster-RCNN 参数可配置的深度学习训练库:#除CNN/DNN/RNN库外,后向更新算法、随机 初始化算法、SGD算法,参数可配的OpenBlas库Level2/3:#矩阵乘、矩阵分解、矩阵求逆线性方程求解、微分方程求解三角函数、非线性函数、超越函数 傅里叶运算接口兼容OpenBlas库接口,“所设即所加速”的深度学习加速器,接口适配层,模型分析层,模型配置层,DDR4,P C Ie,D M A,40GE,深度学习 模型,深度学习库/底层驱动FPGA深度学习加速器框架,通过加速云高性能FPGA深度学习加速器,可以方便和Caffe Tensor

8、Flow集成,快速将Caffe TensorFlow训练的模型和数据运行到加速云的FPGA加速卡上(SC-OPM)取得很好的加速比。#也可以和加速云高密度异构计算平台配合实现高效的深度学习训练。#,17,深度学习加速解决方案,采用SC-OPM加速卡(半高半长:#56*167mm)Altera Arria 10 GX660器件,集成 660k LE和1.5T FLOPS 单精度浮点处理能力整体网络为7层,总运算量为84M单精度浮点,激活函数为sigmod/softmax各层网络参数可以软件配置下载单卡可以实现60路(单精度浮点)语音识别声学模型,8ms全部完成,功耗33瓦单卡可以实现120150

9、路(16位定点)语音识别声学模型,8ms全部完成采用SC-HPC08S/SC-HPC16S高密度异构计算平台可以实现更高密度语音加速池方案(单系统实现7201440路语音识别),整体系统最高不超过900W功耗17,18,深度学习加速解决方案,18,采用SC-OPM加速卡(半高半长:#56*167mm)Altera Arria 10 GX660器件,集成 660k LE和1.5T FLOPS 单精度浮点处理能力四层LSTM+1层全连接,各层网络参数可以软件配置下载可以实现40000T/S的流量,延时超低,数据长度可以混合长度单卡只有33W,Convert,LSTM FW CELL0,Matrix

10、,Bais,LSTM BW CELL0,Matrix,Bais,Input data,N.1 0,0 1.N,Bais,0 1.N,LSTM FW CELL1,Matrix,Bais,LSTM BW CELL1,Matrix,Bais,0 1.N0 1.NConcat,F CMatrix,0 1.N,0 1.N,0 1.N,0 1.N,LSTM 模型,全连 接模型,Wiwfwowc(256*256)(256*256)(256*256)(256*256),uiwfwowc(256*256)(256*256)(256*256)(256*256),56,2,256,256,256,256,256,L

11、STM参数矩阵,LSTM偏置矩阵,19,深度学习加速解决方案,19,采用SC-OPM加速卡(半高半长:#56*167mm)Altera Arria 10 GX660器件,集成 660k LE和1.5T FLOPS 单精度浮点处理能力2层卷积和2层全连接27400帧/S,单卡只有33W,FPGA加速Hadoop,压缩,EC,排序,KVS,网络,安全,21,Hadoop加速解决方案,21,采用SC-HPC08S/SC-HPC16S高密度异构计算平台可以实现更高密度压缩解压缩,纠删码加速池方案(单系统实现1632GB的压缩解压缩性能或2448GB的纠删码性能),整体系统最高不超过900W功耗,FPGA加速Hadoop应用,视 频 分 析,Hadoop生态,直 播,数 据 库,H P C,数 据 挖 掘,基 因 处 理,广 告 推 送,CPU,FPGA,基于FPGA硬件加速的Hadoop融合架构,HAI,DDR4,P C Ie,D M A,40GE/100GE,算法,加速库,底层驱动,

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1