armthumb切换转载.docx

资源描述

armthumb切换转载.docx

《armthumb切换转载.docx》由会员分享，可在线阅读，更多相关《armthumb切换转载.docx（7页珍藏版）》请在冰豆网上搜索。

armthumb切换转载.docx

armthumb切换转载

Thumb、ARM指令状态切换收藏

与ARM指令集相比较，Thumb指令集中的数据处理指令的操作数仍然是32位，指令地址也为32位，但Thumb指令集为实现16位的指令长度，舍弃了ARM指令集的一些特性，如大多数的Thumb指令是无条件执行的，而几乎所有的ARM指令都是有条件执行的；大多数的Thumb数据处理指令的目的寄存器与其中一个源寄存器相同。

由于Thumb指令的长度为16位，即只用ARM指令一半的位数来实现同样的功能，所以，要实现特定的程序功能，所需的Thumb指令的条数较ARM指令多。

在一般的情况下，Thumb指令与ARM指令的时间效率和空间效率关系为：

—Thumb代码所需的存储空间约为ARM代码的60％～70％

—Thumb代码使用的指令数比ARM代码多约30％～40％

—若使用32位的存储器，ARM代码比Thumb代码快约40％

—若使用16位的存储器，Thumb代码比ARM代码快约40％～50％

—与ARM代码相比较，使用Thumb代码，存储器的功耗会降低约30％

显然，ARM指令集和Thumb指令集各有其优点，若对系统的性能有较高要求，应使用32位的存储系统和ARM指令集，若对系统的成本及功耗有较高要求，则应使用16位的存储系统和Thumb指令集。

当然，若两者结合使用，充分发挥其各自的优点，会取得更好的效果。

--------------------------------------------

Thumb指令集（16bit）

Thumb指令集可以看作是ARM指令压缩形式的子集，它是为减小代码量而提出，具有16bit的代码密度。

Thumb指令体系并不完整，只支持通用功能，必要时仍需要使用ARM指令，如进入异常时。

其指令的格式与使用方式与ARM指令集类似，而且使用并不频繁，Thumb指令集作一般了解。

在编写Thumb指令时，先要使用伪指令CODE16声明，编写ARM指令时，则可使用CODE32伪指令声明。

1、Thumb指令集没有协处理器指令、信号量指令、以及访问CPSR或SPSR的指令，没有乘加指令及64位乘法指令等，且指令的第二操作数受到限制；

2、大多数的Thumb数据处理指令采用2地址格式；

3、除了跳转指令B有条件执行功能之外，其他指令均为无条件执行，而且分支指令的跳转范围有更多限制；

4、数据处理指令是对通用寄存器进行操作，在大多数情况下，操作的结果放入其中一个操作数寄存器中，而不是放入第3个寄存器中；访问寄存器R8~R15受到一定的限制，除MOV、ADD指令访问R8~R15外，其他数据处理指令总是更新CPSR中ALU状态标志，访问寄存器R8~R15的Thumb数据处理指令不能更新CPSR中的ALU状态指示。

5、Thumb状态下，单寄存器加载和存储指令只能访问寄存器R0~R7；

6、LDM、STM指令可以将任何范围为R0~R7的寄存器子集加载或存储；

7、PUSH、POP指令使用栈寄存器R13作为基址堆栈操作。

8、TheThumbinstructionsetformat:

---------------------------------------

大多数ARM数据处理指令采用的是3地址格式（除了64位乘法指令外）。

所有异常都会使微处理器返回到ARM模式状态，并在ARM的编程模式中处理。

由于ARM微处理器字传送地址必须可被4整除（即字对准），半字传送地址必须可被2整除（即半字对准）。

而Thumb指令是2个字节长，而不是4个字节，所以，由Thumb执行状态进入异常时其自然偏移与ARM不同。

16位Thumb指令集是从32位ARM指令集提取指令格式的，每条Thumb指令有相同处理器模型所对应的32位ARM指令。

---------------------------------------

只要遵循ATPCS调用规则，Thumb子程序和ARM子程序就可以互相调用。

在这种嵌入式系统软件开发中，为了增强系统的灵活性以及提高系统的整体性能经常需要使用16位的Thumb指令。

如何有效、准确地使用ARM/Thumb状态切换（Interworking）是关系到整个系统成败的关键环节，也是在具体项目开发过程中相对比较难掌握的内容。

本文主要介绍ARM体系结构中的ARM/Thumb状态切换（Interworking）。

1．ARM/Thumb指令的性能比较

在ARM处理器中，内核同时支持32位的ARM指令和16位的Thumb令。

对于ARM指令来说，所有的指令长度都是32位，并且执行周期大多为单周期，指令都是有条件执行的。

而THUMB指令的特点如下：

指令执行条件经常不会使用；

源寄存器与目标寄存器经常是相同的；

使用的寄存器数量比较少；

常数的值比较小；

内核中的桶式移位器（barrelshifter）经常是不使用的；

也就是说16位的Thumb指令一般可以完成和32位ARM相同的任务。

当用户使用C程序来处理应用时，如果编译为Thumb指令，那么它的目标代码大小只有编译为ARM指令时的65%左右，这样就增加了指令密度。

从另一方面来看，处理器在这两种状态下的性能是依赖于指令执行的存储器的宽度的。

下面的图一具体说明二者的性能比较。

可以看出，在存储器是32位的情况下，ARM性能较好，这时因为同样的代码编译的结果Thumb指令将会比ARM多，Thumb指令仍旧花费指令周期来从32-bit块内存预取。

在16-bit内存上，即使有比ARM多的代码，这时Thumb性能也较好，因为Thumb每一条指令预取需要一个周期而每条ARM指令需要两个周期。

另外在16-bit内存上，Thumb的性能降低了；这是因为数据去操作和特殊的堆栈操作，即使在Thumb下，堆栈操作仍是32-bit操作，导致低的性能在16-bit内存架构上。

一个改进的方法是提供32-bit的内存来放置堆栈。

在这种情况下的性能提高到了32-bit内存架构的水平。

主要的差别是因为使用的整型的（32-bit）全局数据将仍被存储在16-bit内存上。

另外，与ARM代码相比较，使用Thumb代码，存储器的功耗会降低约30%。

图一

显然，ARM指令集和Thumb指令集各有其优点，若对系统的执行效率有较高的要求，应使用32位的存储系统和ARM指令集，若对系统的成本及功耗有较高的要求，则应使用16为的存储系统和Thumb指令集。

当然，若两者结合使用，充分发挥其各自的优点，会取得更好的效果。

2．切换（Interwoking）的基本概念及切换时的子函数调用

在我们的实际系统应用中，因为ARM/Thumb指令具有不同的特点，所以不同的场合开发人员会有不同的选择。

Thumb指令低密度及在窄存储器时性能高的特点使得它在大多数基于C代码的系统中有非常广泛的应用，但是有些场合中系统只能使用ARM指令，比如：

如果对于速度有比较高的要求，ARM指令在宽存储器中会提供更高的性能；

某些功能只能由ARM指令来实现，比如：

访问CPSR寄存器来使能/禁止中断或者改变处理器工作模式；访问协处理器CP15；执行C代码不支持的DSP算术指令；

异常中断（Exception）处理。

在进入异常中断后，内核自动切换到ARM状态。

即在异常中断处理程序入口的一些指令是ARM指令，然后根据需要程序可以切换到Thumb状态，在异常中断处理程序返回前，程序再切换到ARM状态。

ARM处理器总是从ARM状态开始执行。

因而，如果要在调试器中运行Thumb程序，必须为该Thumb程序添加一个ARM程序头，然后再切换到Thumb状态，调用该Thumb程序。

所以在实际系统中，内核状态需要经常的切换（Interworking）来满足系统性能需求。

具体的切换是通过BranchExchange—即BX指令来实现的。

指令格式为：

Thumb状态BXRn

ARM状态BX<condition>Rn

其中Rn可以是寄存器R0—R15中的任意一个。

指令可以通过将寄存器Rn的内容拷贝到程序计数器PC来完成在4Gbyte地址空间中的绝对跳转，而状态切换是由寄存器Rn的最低位来指定的，如果操作数寄存器的状态位Bit0=0，则进入ARM状态，如果Bit0=1，则进入Thumb状态，图二给出了具体得切换过程。

图二

下面是某系统中使用的程序切换实例。

CODE32//ARM状态下的代码

LDRR0,=Into_Thumb+1

//产生跳转地址并且设置最低位

BXR0

//BranchExchange进入Thumb状态

…

CODE16//Thumb状态下的子函数

…

LDRR3,=Back_to_ARM

//产生字对齐的跳转地址，最低位被清除

BXR3

//BranchExchange返回到ARM状态

CODE32//ARM状态下的子函数

Bach_to_ARM

…

在上面的程序中，CODE16/CODE32伪指令告诉汇编编译器后面的指令序列分别为Thumb/ARM指令。

在非Interworking函数调用中，调用函数使用BL（BranchwithLink）指令，即将返回地址保存在连接寄存器LR中，同时跳转到被调用的子函数程序入口。

从子函数返回时执行指令MOVPC,LR（当然也可能是其他形式的指令，如出栈指令）将LR值直接放入PC中，从而返回到调用函数中的下一条指令的地址，然后继续执行程序。

在Interworking函数的调用中，需要在编译时对此函数所在的源程序指定编译开关选项：

-apcs/interwork，即保证程序遵守ARM/Thumb程序混合使用的ATPCS规则。

一般来说，这时生成的目标代码会增加2%左右。

这样在编译器（compiler）处理这个函数时就会用BX指令取代MOVPC,LR指令，而且连接器（linker）会自动的产生一小段代码（veneers）来改变处理器状态（ARM/Thumb），具体过程如图3所示。

图三

编译/连接命令为：

armcc-apcs/interworkarm_code.c–oarm_code.o

tcc-apcs/interworkthumb_code.c–othumb_code.o

armlinkarm_code.othumb_code.o

对于C/C++程序来说，当编译时如果增加–apcs/interwork选项，那就是告诉连接器自动增加一小段代码（veneer）来实现函数调用时ARM/Thumb的状态切换。

但是对于使用C程序中的Interwork选项，需要注意的是：

对于一个C/C++源程序中不能同时包含ARM/Thumb指令；

如果C/C++程序间接的调用另一种指令系统下的子程序，编译该程序时需要增加-apcs/interwork选项；

如果调用程序和被调用程序是不同的指令，而被调用程序是Non-Interworking代码，这时不要使用函数指针来调用该被调用程序。

下面的图四显示了C/C++程序在增加编译选项-apcs/interwork时将代码分别编译为ARM/THUMB指令时的情况。

由于在Thumb状态下不能直接使用POPLR，所以使用了暂时寄存器R3。

对于汇编程序来说，如果本代码是被调用的函数，则需按照以下步骤处理：

增加–apcs/interwork选项；

用BX来返回；

EXPORT本函数名；

如果本代码是调用函数，那就只需要用BL指令来

展开阅读全文

armthumb切换 转载.docx

armthumb切换转载.docx