ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:174.05KB ,
资源ID:12685444      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12685444.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于DSP的数据加密技术.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于DSP的数据加密技术.docx

1、基于DSP的数据加密技术基于DSP的数据加密技术综述 目录摘要: 3Abstract: 3一、引言 4二、软件算法 52.1、RSA加密算法描述 52.2、Montgomery 模乘算法 62.3、实现RSA快速加密 62.31、 乘幂运算的快速实现 62.4、Montgomery 模乘算法改进的RSA算法实现 72.4.1、改进的模乘算法 72.4.2、2 个CSA 加法器的Montgomery 模乘算法 72.4.3、 实现RSA 加密系统的结构图 9三、硬件加密 1031、 长整数模运算的快速实现 103.2、 TMS320C54X芯片的特点,及编程过程中应注意的地方 11四、参考文献

2、12五、课程总结 12摘要: RSA是最早提出的公钥密码体制,其原理简单,安全性好,但由于其密钥较长才能保证一定的安全性,因而计算量大,如果用软件加密其速度太慢,用硬件实现可以大大提高RSA的速度。与此同时应用Montgomery 模乘算法来提高RSA的速度。在Montgomery 模乘算法改进的基础上, 提出了一种实现Montgomery 模乘算法的结构,该结构只需使用一个CSA (carry save adder) 加法器. 与目前使用两个CSA 加法器的模乘算法相比, 所提出的算法加快了RSA 加密处理器的实现, 并提高了整个加密系统的时间效率。DSP芯片系列提供了一种专用的乘法器,其完

3、成一次乘法的时间只要一个周期,这使实现RSA的速度加快,怎样实现呢?那么就介绍一种适合DSP TMS320C54X 芯片,用汇编语言实现的一种快速的RSA,并实现了良好的加速算法。Abstract:RSA is the earliest public key algorithm. Its theory is very simple and its security is very high,but it must use a long key to assure its security, so its computation is very large. Using hardware to

4、implement data encryption is more faster than using softer. And use the modified Montgomery modular multiplication, Based on the modified Montgomery modular multiplication this paper proposed a new arch itec2tu re of u sing CSA (carry save adder ) for the implement at ion of Montgomery modular multi

5、plication. Compared with the present algorithm using two CSA modular multiplication, the proposed algorithm only uses one CSA , so it speeds up the imp lamentation of RSA cryptoprocesser, and also imp roves the time .efficiency. There is a particular multiplier, which can compute a multiplication at

6、 a cycle, this means it can make RSA faster. How can it be done? then a kind of the design of fast RSA implementation base on DSP TMS320C54X chipset ,using assembler language is introduced. As a result, it gets a high speed. Key words: RSA; DSP; Fast Implementation; Modular Arithmetic Montgomery mod

7、ular multiplication algorithm; CSA一、引言随着数字通信和电子商务,网络技术的高速发展和普及, 网络信息安全成为当今一个重要话题. 对数据安全的需求日益迫切,如何保证网络上信息安全成为一项重要的研究课题,而数据加密是保护信息的一种重要方法 为了保证信息安全,公开密钥体制得到广泛的认可, 而RSA 是其中一个重要的公开加密系统. 由于在RSA 加密算法中, 主要是模指数运算, 而模指数运算重复使用了模乘算法, 所以模乘算法是实现RSA 加密系统的关键所在, 如何提高模乘算法的效率, 影响到整个RSA 加密系统的工作效率. 而Montgomery 模乘算法在计算指数

8、运算上效率较高, 而且易于实现.在RSA 加密处理器的硬件实现上, 有两种比较好的加密结构: 一种是基于硬件资源合理利用上的L2R ( left to right) 二进位方法; 一种是在实现速度较快基础上, 所需硬件资源较大的R2L ( right to left ) 二进位方法 1 . 本文在Montgomery 模乘算法优化的基础上, 使用L 2R 二进位方法, 并对Mon t2gom ery 模乘使用CSA 加法器 2 改进前后, RSA 加密处理器在处理时间上作相应的分析和比较. 但单纯由软件来加密虽然升级方便,但安全性和速度都与经过特殊设计的硬件加密无法相比,因此采用专用的芯片的P

9、C安全卡,即利用专用的汇编语言实现算法并装载到卡上,再在专用的芯片上运行是一种性能高且成本低的解决方案。 TI公司推出的TMS320C54X系列的DSP具有性能适中,价格低廉和产品成熟等特点,并且其乘法指令执行快,并行性高,较适合于加密算法,因而采用TMS320C54X DSP作为PC安全卡的主CPU二、软件算法2.1、RSA加密算法描述RSA 公钥算法是由MIT 的Rivest、Shamir 和Adleman 在1978 年提出来的。RSA 方案是唯一被广泛接受并实现的通用公开密钥密码算法,目前已成为公钥密码的国际标准。该算法的数学基础是初等数论中的欧拉( Euler) 定理,其安全性建立在

10、大整数因子分解的困难性之上。RSA 作为公钥密码体制,利用了单向陷门函数的原理,如图1 所示。图(1)RSA 算法归纳如下:( 1) 选择2 个大素数p、q,为了保证安全,通常要求每个都图1 RSA 利用单向陷门函数原理大于10100 ( 即超过100 位的十进制) ;( 2) 计算n = pq 和( n) = ( p 1) ( q 1) ;( 3) 选择一个与( n) 互素的数,令其为e;( 4) 找到1 个d,使其满足d = e-1 mod( n) ;( 5) 选好这些参数后,将明文划分成块,使得每个明文报文块长度满足M n。加密M 时,计算:C = Me mod n ( 1)解密时计算:

11、M = Cd mod n ( 2)由于模运算的对称性,可以证明,在确定的范围内,加密和解密函数是互逆的。为实现加密,需要公开 e,n ,为实现解密需要 d,n 。2.2、Montgomery 模乘算法RSA 加密系统主要是进行模指数运算. 假设N是2 个大的素数p 和q 的乘积, 而公开密钥e 可以根据e = d -1 mod (p - 1) (q - 1) 通过欧几里得乘法逆元算法获得.加密时: 明文M , 公开密钥(e, N ) (0 M N ) P = P - N步骤5: return (P )结果为REDC(A ,B ) = AB 2-(n+2)mod N .2) 一个CSA 的Mon

12、 tgomery 模乘算法由于目前采用的改进Mon tgom ery 模乘算法实现时, 使用了2 个CSA 加法器, 虽然每个加法可以在一个时钟周期完成, 但是随着加密数据长度n 的增加, 所需加法单元也会越来越大. 例如n = 1 024 bit 时, 也需要2 048个加法单元, 因此, 所使用的硬件资源仍然很大. 为了节省硬件资源, 同时加快模乘算法, 本文对模乘算法做了相应的改进算法2输入: A ,B ,N (modulus)输出: P = (A B 2-n) mod Nn: m umber of bit s in AA i: ith bit of AS 0: the lowest b

13、it of SC0: the lowest bit of CB 0: the lowest bit of BR : precomputed value of (B + N )步骤1: P = 0; S = 0; C= 0步骤2 : for i= 0 to n- 1 do2a: if (S0= C0) and not Ai then: L = 0if (S 0C0) and notAi then:L = Nif no t (S0 x or C0 x or B0) andA i then: L = Bif (S0 x or C0 x or B0 ) and Aithen:L = R2b: (S ,

14、 C) = S + C+ L2c: S = S 2; C= C2步骤3: P = S + C步骤4: if (P N ) P = P - N步骤5: return (P )结果为REDC (A ,B ) = AB 2-(n+2) mod N .算法一 图(3) 算法二2.4.3、 实现RSA 加密系统的结构图由于CPA 加法器是一种进位传播加法器, 如果进行高比特的加法, 不仅需要较多的硬件资源, 而且会有很大的时延, 因此不利于系统时钟频率的提高.为了保证整个加法能够在一个时钟周期完成, 提高Montgomery 模乘算法的时间和工作效率, 需使用CSA 加法器替代模乘算法中的CPA 加法器

15、。在CPA 加法中, 执行1 024 bit 的加法需要32个时钟, 为了适应该加法结构, 输入的1 024 bit 寄存器包括32 bit 的寄存器.使用32 bit 的CPA 加法器和移位寄存器, 减少了硬件资源. 同时, 移位寄存器也使32 bit IO 接口成为可能. 基于L 2R 的实现Montgomery 算法的RSA 处理器的结构框架图如图4所示.图(4)三、硬件加密31、 长整数模运算的快速实现 通常的长整数模运算都是用加减法来完成的,因为PC机的加减法指令的执行速度比乘除法要快得多,利用加减法可以使指令的执行速度大幅度的提高,但对于C54X则不同,C54X芯片中的17bit*

16、17bit专用乘法器使得其乘法指令的执行只需一个时钟周期,与加减指令的速度完全相同,这样就要考虑更多地用乘法来完成模运算假设要做运算 R=T mod N (3.1.1) 其中N为k位的长整数,T为2k位的长整数,设字长为m,则N共有n=k/m个字,T有2n个字,同时记X=2m 将T写为表达式:T=T12k+T0 (3.1.2) 并将T1表示为: T1=tn-1Xn-1+tn-2Xn-2+.+t0 (3.1.3) 将式(3.1.2)和(3.1.3)代入式(3.1.1)即得R=(tn-1(X2n-1 mod N)+tn-2(X2n-2mod N)+.+t0(Xnmod N)+T0)mod N (3

17、.1.4) 从(3.1.4)式可看出,可以预求n个Xn+I modN的值,分别记为: r0=Xnmod N r1=Xn+1mod N rn-1=X2n-1mod N 有R1=tn-1rn-1+tn-2rn-2+.+t0r0+T0 (3.1.5) 执行完式(3.1.5)之后,R1的k比特以上部分(记为R11)的位数不会超过 m+n,对于C54X,m=16,只要选择的kN) then R20=R20-NEnd这样得到的结果R20就是最后的结果R 由上面的算法可见,整个模运算是由三步组成的,其中前两步是将加减法转换为乘/累加来做的,第三步的加法循环只有10次,这充分利用了C54X芯片的乘法优势,使模

18、运算的速度有了很大的提高。完成一次模运算的时间为用减法完成模运算时间的38.5. 3.2、 TMS320C54X芯片的特点,及编程过程中应注意的地方(1)芯片共有3条数据总线,1条程序总线,4条相应的地址总线,多条数据总线可同时读取多个数据,使得C54X具有功能强大的指令集。很多指令的效率很高。(2)8个辅助寄存器使得程序编制更灵活。(3)有2个40-bit累加器,1个17-bit17-bit乘法器,可很方便的进行乘/累加运算,另外单指令周期的乘法指令使模运幂运算的速度大幅度提高。(4)320C54X芯片采用了六级流水线机制,但没有解决流水线相关的问题,因此在编程时必须注意指令的连接关系,必要

19、时要加上空操作,合理调配指令顺序,尽量减少指令的相关性,可大大提高程序的运行速度。(5)许多指令都分为有符号数和无符号数两种,应根据所用数的类型选用指令。(6)TMS32054X芯片的地址形成方式比较特殊,16位地址的高9位由DP给出,低7位由指令给出,这样使得直接寻址的指令的执行速度比较快,但必须先将DP设置为正确的值。因此在程序调试过程中,数据的存储位置尚未完全确定,最好避免利用DP寻址的指令,防止由于存储位置的变化引起程序运行错误。四、参考文献1 卢开澄. 计算机密码学 M.北京:清华大学出版社,1998.81-96 2 周建江,戴明桢,等. TMS320C54X DSP 结构、原理及应

20、用 M.北京:北京航空航天大学出版社,2001.1-603阮飞 当前我国信息安全领域面临的重大问题 信息安全与通信保密, 2003( 12)4佟晓筠,王翥,郭长勇,等 基于RSA 等算法软件加密技术的研究与实现微处理机,2003( 6) :5何彩燕,吴红公钥制RSA 算法应用中要注意的几个问题 现代计算机,2004,178( 5) :6 尹勇,欧光军,关荣锋 DSP 集成开发环境CCS 开发指南 北京: 北京航空航天大学出版社,2003五、课程总结1、第一章 离散时间信号与系统数字信号是由模拟信号经过采样得到离散时间信号,在经过量化和编码最终得到的。在采样的过程中,他的采样频率必须高于两倍信号

21、的最高频率,则整个连续信号就可以完全用它的采样值来代表,而不会丢掉任何信息。任何一个时间离散信号都可以用单位脉冲序列信号及其移位的线性组合来描述他。单位阶跃信号和他的移位的线性组合可以用来描述一个离散时间的持续时间。判断一个系统是否为线性系统:Linear system : 齐次性与叠加性即 y1(n)=Tx1(n) ,y2(n)=Tx2(n) y (n)=Tax1(n) bx2(n) = ay1(n) by2(n) *加权信号和的响应=响应的加权和。Time-invariant: 时不变特性 即 y(n-n0)=Tx(n-n0)所有存在一个最小的正整数,满足:,则称序列是周期序列,周期为。两

22、个序列中只要有一个是无限长序列,则卷积之后是无限长序列,卷积是线性运算,长序列可以分成短序列再进行卷积,但必须看清起点在哪里。Z变换是分析离散信号与系统的一种有力的数学工具,他类似于拉普拉斯变换之对连续信号与系统。在离散时间系统分析中,从对系统数学模型的求解方法来讲,基本可以分为时域方法和变换域方法两类,时域法是直接分析时间变量的函数研究离散时间系统的时域特性。第二章 离散傅里叶变换离散傅里叶变换建立了有限长序列与离散频谱之间的联系,他在理论上具有重大意义。DFT隐含有周期性,周期为N,有限N长序列x(n)的N点离散傅里叶变换(DFT)X(k)也可以定义为x(n)的周期延拓序列X(n)N的离散

23、傅里叶级数(DFS) 的主值序列。周期序列的主周期序列指把周期序列截取主周期0N-1得到的有限长序列。循环卷积的计算方法,循环卷积与线性卷积的关系,用DFT计算线性卷积的方法。设x1(n)( 0 nM-1),x2(n)(0 n N-1)循环卷积:L取M、N中较长的一个(设MN,则L=M)。较短的一个需要补0至L(两个序列的长度要求相等)。循环卷积可以用DFT(FFT)实现;用循环卷积实现线性卷积:LM+N-1若不满足这个条件,则只在N-1 n M-1范围内两者相等。DFSDFT线性线性序列移位循环移位共轭对称性共轭对称性周期卷积循环卷积圆周卷积和线性卷积的对比圆周卷积线性卷积针对FFT引出的一

24、种表示方法信号通过线性系统时,信号输出等于输入与系统单位冲激响应的卷积两序列长度必须相等,不等时按要求补足零值点两序列长度可以不等如x1(n)为 N1点,x2(n)为 N2点卷积结果长度与两信号长度相等皆为N卷积结果长度为N=N1+N2-1第三章 快速傅里叶变换DFT在数字信号处理起着非常重要的作用,而这是与DFT存在着高效算法,即FFT。他不是一种新型变换,而是减少DFT计算量的一些高效算法。FFT的运算量的计算,与DFT运算量的比较N点的FFT的运算量为复乘: CM=(N/2)M=(N/2) log2 N复加: CA =N M=N log2 NN点的DFT的运算量为复乘: CM =N2复加

25、: CA =N(N-1)第四章 数字滤波网络 数字滤波器的功能本质上是将一组输入数字序列通过一定的运算后转变为另一组输出数字序列,其结构表示需要采用加法器,乘法器,延时器等。IIR滤波器的结构和信号流图:直接型;级联型;并联型。FIR数字滤波器的结构和信号流图:直接型;快速卷积型、频率采样型。FIR数字滤波器:非递归结构,无反馈,但在频率采样结构等某些结构中也包含有反馈的递归部分。级联型结构简化了滤波器发的实现方式,采用一些二阶节,通过适当的系数变换就可以实现整个系统,并且各级联形式子系统的零,极点就是整个系统的零,极点,所以调整子系统系数可以直接控制系统的传输特征。第五章 滤波器设计原理滤波

26、器是一种具有一定传输特性的信号处理装置。从广义上讲,凡是有能力进行信号处理的装置都可以成为滤波器。但一般所讲的滤波器是一种选频器件,他对某些频率的信号衰减很小,允许信号通过,而对其他不需要的衰减很大,尽量阻止这些信号的通过。比较成熟的几种滤波器:Butterworth滤波器,Chebyshev滤波器。对滤波器的技术要求: 中心频率,通带带宽,通带插入损耗,通带波动,阻带衰减。 第六章 IIR 数字滤波器的设计第八章 数字信号处理的实现及应用自从数字信号处理器(Digital Signal Processor)问世以来,由于它具有高速、灵活、可编程、低功耗和便于接口等特点,已在图形、图像处理,语音、语言处理,通用信号处理,测量分析,通信等领域发挥越来越重要的作用。随着技术成本的降低,控制界已对此产生浓厚兴趣,已在不少场合得到成功应用。DSP在多媒体通信中的应用,多媒体包括文字、语言、图像、图形和数据等媒体。多媒体信息中绝大部分是视频数据和音频数据,儿数字化的音、视频数据的数

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1