ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:19.42KB ,
资源ID:13585334      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/13585334.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(armthumb切换 转载Word下载.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

armthumb切换 转载Word下载.docx

1、当然,若两者结合使用,充分发挥其各自的优点,会取得更好的效果。-Thumb指令集(16bit) Thumb指令集可以看作是ARM指令压缩形式的子集,它是为减小代码量而提出,具有16bit的代码密度。Thumb指令体系并不完整,只支持通用功能,必要时仍需要使用ARM指令,如进入异常时。其指令的格式与使用方式与ARM指令集类似,而且使用并不频繁,Thumb指令集作一般了解。 在编写Thumb指令时,先要使用伪指令CODE16声明,编写ARM指令时,则可使用CODE32伪指令声明。 1、Thumb指令集没有协处理器指令、信号量指令、以及访问CPSR或SPSR的指令,没有乘加指令及64位乘法指令等,且

2、指令的第二操作数受到限制; 2、大多数的Thumb数据处理指令采用2地址格式; 3、除了跳转指令B有条件执行功能之外,其他指令均为无条件执行,而且分支指令的跳转范围有更多限制; 4、数据处理指令是对通用寄存器进行操作,在大多数情况下,操作的结果放入其中一个操作数寄存器中,而不是放入第3个寄存器中;访问寄存器R8R15受到一定的限制,除MOV、ADD指令访问R8R15外,其他数据处理指令总是更新CPSR中ALU状态标志,访问寄存器R8R15的Thumb数据处理指令不能更新CPSR中的ALU状态指示。 5、Thumb状态下,单寄存器加载和存储指令只能访问寄存器R0R7; 6、LDM、STM指令可以

3、将任何范围为R0R7的寄存器子集加载或存储; 7、PUSH、POP指令使用栈寄存器R13作为基址堆栈操作。 8、The Thumb instruction set format:-大多数ARM数据处理指令采用的是3地址格式(除了64位乘法指令外)。 所有异常都会使微处理器返回到ARM模式状态,并在ARM的编程模式中处理。由于ARM微处理器字传送地址必须可被4整除(即字对准),半字传送地址必须可被2整除(即半字对准)。而Thumb指令是2个字节长,而不是4个字节,所以,由Thumb执行状态进入异常时其自然偏移与ARM不同。 16位Thumb指令集是从32位ARM指令集提取指令格式的,每条Thum

4、b指令有相同处理器模型所对应的32位ARM指令。 只要遵循ATPCS调用规则,Thumb子程序和ARM子程序就可以互相调用。在这种嵌入式系统软件开发中,为了增强系统的灵活性以及提高系统的整体性能经常需要使用16位的Thumb指令。如何有效、准确地使用ARM/Thumb状态切换(Interworking)是关系到整个系统成败的关键环节,也是在具体项目开发过程中相对比较难掌握的内容。本文主要介绍ARM体系结构中的ARM/Thumb状态切换(Interworking)。1 ARM/Thumb 指令的性能比较在ARM处理器中,内核同时支持32位的ARM指令和16位的Thumb令。对于ARM指令来说,所

5、有的指令长度都是32位,并且执行周期大多为单周期,指令都是有条件执行的。而THUMB指令的特点如下:指令执行条件经常不会使用;源寄存器与目标寄存器经常是相同的;使用的寄存器数量比较少;常数的值比较小;内核中的桶式移位器(barrel shifter)经常是不使用的; 也就是说16位的Thumb指令一般可以完成和32位ARM相同的任务。当用户使用C程序来处理应用时,如果编译为Thumb指令,那么它的目标代码大小只有编译为ARM指令时的65%左右,这样就增加了指令密度。从另一方面来看,处理器在这两种状态下的性能是依赖于指令执行的存储器的宽度的。下面的图一具体说明二者的性能比较。可以看出,在存储器是

6、32位的情况下,ARM性能较好,这时因为同样的代码编译的结果Thumb指令将会比ARM多,Thumb指令仍旧花费指令周期来从32-bit块内存预取。在16-bit内存上,即使有比ARM多的代码,这时Thumb性能也较好,因为Thumb每一条指令预取需要一个周期而每条ARM指令需要两个周期。另外在16-bit内存上,Thumb的性能降低了;这是因为数据去操作和特殊的堆栈操作,即使在Thumb下,堆栈操作仍是32-bit操作,导致低的性能在16-bit内存架构上。一个改进的方法是提供32-bit的内存来放置堆栈。在这种情况下的性能提高到了32-bit内存架构的水平。主要的差别是因为使用的整型的(3

7、2-bit)全局数据将仍被存储在16-bit内存上。 另外,与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。 图一 显然,ARM指令集和Thumb指令集各有其优点,若对系统的执行效率有较高的要求,应使用32位的存储系统和ARM指令集,若对系统的成本及功耗有较高的要求,则应使用16为的存储系统和Thumb指令集。2切换(Interwoking)的基本概念及切换时的子函数调用 在我们的实际系统应用中,因为ARM/Thumb指令具有不同的特点,所以不同的场合开发人员会有不同的选择。Thumb指令低密度及在窄存储器时性能高的特点使得它在大多数基于C代码的系统中有非常广泛的应用,但是

8、有些场合中系统只能使用ARM指令,比如:如果对于速度有比较高的要求,ARM指令在宽存储器中会提供更高的性能;某些功能只能由ARM指令来实现,比如:访问CPSR寄存器来使能/禁止中断或者改变处理器工作模式;访问协处理器CP15;执行C代码不支持的DSP算术指令;异常中断(Exception)处理。在进入异常中断后,内核自动切换到ARM状态。即在异常中断处理程序入口的一些指令是ARM指令,然后根据需要程序可以切换到Thumb状态,在异常中断处理程序返回前,程序再切换到ARM状态。ARM处理器总是从ARM状态开始执行。因而,如果要在调试器中运行Thumb程序,必须为该Thumb程序添加一个ARM程序

9、头,然后再切换到Thumb状态,调用该Thumb程序。 所以在实际系统中,内核状态需要经常的切换(Interworking)来满足系统性能需求。具体的切换是通过Branch Exchange即BX 指令来实现的。指令格式为: Thumb状态 BX Rn ARM状态 BX<condition> Rn其中Rn可以是寄存器R0R15中的任意一个。指令可以通过将寄存器Rn的内容拷贝到程序计数器PC来完成在4Gbyte地址空间中的绝对跳转,而状态切换是由寄存器Rn的最低位来指定的,如果操作数寄存器的状态位Bit0=0,则进入ARM状态,如果Bit0=1,则进入Thumb状态,图二给出了具体得

10、切换过程。图二下面是某系统中使用的程序切换实例。 CODE32 /ARM状态下的代码 LDR R0, =Into_Thumb+1 /产生跳转地址并且设置最低位 BX R0 /Branch Exchange 进入Thumb状态 … CODE16 /Thumb状态下的子函数 LDR R3, =Back_to_ARM /产生字对齐的跳转地址,最低位被清除 BX R3 /Branch Exchange 返回到ARM状态 CODE32 /ARM状态下的子函数 Bach_to_ARM在上面的程序中,CODE16/CODE32伪指令告诉汇编编译器后面的指令序列分别为Thumb/ARM指令。 在非

11、Interworking函数调用中,调用函数使用BL(Branch with Link)指令,即将返回地址保存在连接寄存器LR中,同时跳转到被调用的子函数程序入口。从子函数返回时执行指令 MOV PC, LR(当然也可能是其他形式的指令,如出栈指令)将LR值直接放入PC中,从而返回到调用函数中的下一条指令的地址,然后继续执行程序。 在Interworking函数的调用中,需要在编译时对此函数所在的源程序指定编译开关选项:-apcs / interwork ,即保证程序遵守ARM/Thumb程序混合使用的ATPCS规则。一般来说,这时生成的目标代码会增加2%左右。这样在编译器(compiler)

12、处理这个函数时就会用BX 指令取代MOV PC,LR指令,而且连接器(linker)会自动的产生一小段代码(veneers)来改变处理器状态(ARM/Thumb),具体过程如图3所示。图三编译/连接命令为: armcc -apcs/interwork arm_code.c –o arm_code.o tcc -apcs/interwork thumb_code.c &o thumb_code.o armlink arm_code.o thumb_code.o对于C/C+程序来说,当编译时如果增加 &apcs/interwork 选项,那就是告诉连接器自动增加一小段代码(veneer

13、)来实现函数调用时ARM/Thumb的状态切换。但是对于使用C程序中的Interwork选项,需要注意的是:对于一个C /C+源程序中不能同时包含ARM/Thumb指令;如果C/C+程序间接的调用另一种指令系统下的子程序,编译该程序时需要增加-apcs/interwork选项;如果调用程序和被调用程序是不同的指令,而被调用程序是Non-Interworking代码,这时不要使用函数指针来调用该被调用程序。下面的图四显示了C/C+程序在增加编译选项-apcs/interwork时将代码分别编译为ARM/THUMB指令时的情况。由于在Thumb状态下不能直接使用POP LR,所以使用了暂时寄存器R3。对于汇编程序来说,如果本代码是被调用的函数,则需按照以下步骤处理:增加 &apcs/interwork 选项;用BX来返回;EXPORT本函数名;如果本代码是调用函数,那就只需要用BL指令来

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1