Thumb指令集.docx
《Thumb指令集.docx》由会员分享,可在线阅读,更多相关《Thumb指令集.docx(15页珍藏版)》请在冰豆网上搜索。
Thumb指令集
Thumb指令集
Thumb指令集概述
为兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持执行效率很高的32位ARM指令集以外,同时支持16位的Thumb指令集。
Thumb指令集是ARM指令集的一个子集,是针对代码密度问题而提出的,它具有16位的代码宽度。
与等价的32位代码相比较,Thumb指令集在保留32位代码优势的同时,大大的节省了系统的存储空间。
Thumb不是一个完整的体系结构,不能指望处理器只执行Thumb指令集而不支持ARM指令集。
当处理器在执行ARM程序段时,称ARM处理器处于ARM工作状态,当处理器在执行Thumb程序段时,称ARM处理器处于Thumb工作状态。
Thumb指令集并没有改变ARM体系底层的编程模型,只是在该模型上增加了一些限制条件,只要遵循一定的调用规则,Thumb子程序和ARM子程序就可以互相调用。
与ARM指令集相比较,Thumb指令集中的数据处理指令的操作数仍然是32位,指令地址也为32位,但Thumb指令集为实现16位的指令长度,舍弃了ARM指令集的一些特性,如大多数的Thumb指令是无条件执行的,而几乎所有的ARM指令都是有条件执行的,大多数的Thumb数据处理指令采用2地址格式。
由于Thumb指令的长度为16位,即只用ARM指令一半的位数来实现同样的功能,所以,要实现特定的程序功能,所需的Thumb指令的条数较ARM指令多。
在一般的情况下,Thumb指令与ARM指令的时间效率和空间效率关系为:
●Thumb代码所需的存储空间约为ARM代码的60%~70%。
●Thumb代码使用的指令数比ARM代码多约30%~40%。
●若使用32位的存储器,ARM代码比Thumb代码快约40%。
●若使用16位的存储器,Thumb代码比ARM代码快约40%~50%。
●与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。
显然,ARM指令集和Thumb指令集各有其优点,若对系统的性能有较高要求,应使用32位的存储系统和ARM指令集,若对系统的成本及功耗有较高要求,则应使用16位的存储系统和Thumb指令集。
当然,若两者结合使用,充分发挥其各自的优点,会取得更好的效果。
Thumb指令集与ARM指令集在以下几个方面有区别:
●跳转指令。
条件跳转在范围上有更多的限制,转向子程序只具有无条件转移。
●数据处理指令。
对通用寄存器进行操作,操作结果需放入其中一个操作数寄存器,而不是第三个寄存器。
●单寄存器加载和存储指令。
Thumb状态下,单寄存器加载和存储指令只能访问寄存器R0~R7。
●批量寄存器加载和存储指令。
LDM和STM指令可以将任何范围为R0~R7的寄存器子集加载或存储,PUSH和POP指令使用堆栈指针R13作为基址实现满递减堆栈,除R0~R7外,PUSH指令还可以存储链接寄存器R14,并且POP指令可以加载程序指令PC。
●Thumb指令集没有包含进行异常处理时需要的一些指令,因此,在异常中断时还是需要使用ARM指令。
这种限制决定了Thumb指令不能单独使用需要与ARM指令配合使用。
Thumb寄存器和ARM寄存器之间的关系
Thumb寄存器在ARM寄存器上的映射如图所示。
图Thumb寄存器在ARM寄存器上的映射
1.Thumb状态寄存器集是ARM状态寄存器集的子集
程序员可直接访问8个通用寄存器R0~R7、PC、堆栈指针SP、链接寄存器LR和CPSR。
每个特权模式都有分组的SP、LR和SPSR。
2.Thumb状态寄存器与ARM状态寄存器的关系
Thumb状态寄存器与ARM状态寄存器有如下关系:
●Thumb状态R0~R7与ARM状态R0~R7相同。
●Thumb状态CPSR和SPSR与ARM状态CPSR和SPSR相同。
●Thumb状态SP映射到ARM状态R13。
●Thumb状态LR映射到ARM状态R14。
●Thumb状态PC映射到ARM状态PC(R15)。
3.在Thumb状态中访问高寄存器
在Thumb状态中高寄存器(寄存器R0~R7为低寄存器,寄存器R8~R15为高寄存器)不是标准寄存器集的一部分,汇编语言程序员对它们的访问受到限制,但可以将它们用于快速暂存。
可以使用MOV指令的特殊变量将一个值从低寄存器R0~R7转移到高寄存器R8~R15,或者从高寄存器到低寄存器。
CMP指令可用于比较高寄存器和低寄存器的值。
ADD指令可用于将高寄存器的值与低寄存器的值相加。
3.4.3Thumb指令分类介绍
Thumb指令集分为:
分支指令、数据传送指令、单寄存器加载和存储指令以及多寄存器加载和存储指令。
Thumb指令集没有协处理器指令、信号量(semaphore)指令以及访问CPSR或SPSR的指令。
1.存储器访问指令
(1)LDR和STR——立即数偏移
加载寄存器和存储寄存器。
存储器的地址以一个寄存器的立即数偏移(immediateoffset)指明。
指令格式:
opRd,[Rn,#immed_5×4]
opHRd,[Rn,#immed_5×2]
opBRd,[Rn,#immed_5×1]
其中:
●op:
为LDR或STR。
●H:
指明无符号半字传送的参数。
●B:
指明无符号字节传送的参数。
●Rd:
加载和存储寄存器。
Rd必须在R0~R7范围内。
●Rn:
基址寄存器。
Rn必须在R0~R7范围内。
●immed_5×N:
偏移量。
它是一个表达式,其取值(在汇编时)是N的倍数,在(0~31)*N范围内,N=4、2、1。
●STR:
用于存储一个字、半字或字节到存储器中。
●LDR:
用于从存储器加载一个字、半字或字节。
●Rn:
Rn中的基址加上偏移形成操作数的地址。
立即数偏移的半字和字节加载是无符号的。
数据加载到Rd的最低有效字或字节,Rd的其余位补0。
字传送的地址必须可被4整除,半字传送的地址必须可被2整除。
指令示例:
LDRR3,[R5,#0]
STRBR0,[R3,#31]
STRHR7,[R3,#16]
LDRBR2,[R4,#1abel-{PC}]
(2)LDR和STR——寄存器偏移
加载寄存器和存储寄存器。
用一个寄存器的基于寄存器偏移指明存储器地址。
指令格式:
opRd,[Rn,Rm]
其中,op是下列情况之一:
●LDR:
加载寄存器,4字节字。
●STR:
存储寄存器,4字节字。
●LDRH:
加载寄存器,2字节无符号半字。
●LDRSH:
加载寄存器,2字节带符号半字。
●STRH:
存储寄存器,2字节半字。
●LDRB:
加载寄存器,无符号字节。
●LDRSB:
加载寄存器,带符号字节。
●STRB:
存储寄存器,字节。
●Rm:
内含偏移量的寄存器,Rm必须在R0~R7范围内。
带符号和无符号存储指令没有区别。
STR指令将Rd中的一个字、半字或字节存储到存储器。
LDR指令从存储器中将一个字、半字或字节加载到Rd。
Rn中的基址加上偏移量形成存储器的地址。
寄存器偏移的半字和字节加载可以是带符号或无符号的。
数据加载到Rd的最低有效字或字节。
对于无符号加载,Rd的其余位补0;或对于带符号加载,Rd的其余位复制符号位。
字传送地址必须可被4整除,半字传送地址必须可被2整除。
指令示例:
LDRR2,[Rl,R5]
LDRSHR0,[R0,R6]
STRBRl,[R7,R0]
(3)LDR和STR——PC或SP相对偏移
加载寄存器和存储寄存器。
用PC或SP中值的立即数偏移指明存储器中的地址。
没有PC相对偏移的STR指令。
指令格式:
LDRRd,[PC,#immed_8×4]
LDRRd,[label
LDRRd,[[SP,#immed_8×4]
STRRd,[SP,#immed_8×4]
其中:
●immed_8×4:
偏移量。
它是一个表达式,取值(在汇编时)为4的整数倍,范围在0~1020之间。
●label:
程序相对偏移表达式。
label必须在当前指令之后且1KB范围内。
●STR:
将一个字存储到存储器。
●LDR:
从存储器中加载一个字。
PC或SP的基址加上偏移量形成存储器地址。
PC的位[1]被忽略,这确保了地址是字对准的。
字或半字传送的地址必须是4的整数倍。
指令示例:
LDRR2,[PC,#1016]
LDRR5,localdata
LDRR0,[SP,#920]
STRRl,[SP,#20]
(4)PUSH和POP
低寄存器和可选的LR进栈以及低寄存器和可选的PC出栈。
指令格式:
PUSH{reglist}
POP{reglist}
PUSH{reglist,LR}
POP{reglist,PC}
其中:
●reglist:
低寄存器的全部或其子集。
括号是指令格式的一部分,它们不代表指令列表可选。
列表中至少有1个寄存器。
Thumb堆栈是满递减堆栈,堆栈向下增长,且SP指向堆栈的最后入口。
寄存器以数字顺序存储在堆栈中。
最低数字的寄存器存储在最低地址处。
POP{reglist,PC}这条指令引起处理器转移到从堆栈弹出给PC的地址,这通常是从子程序返回,其中LR在子程序开头压进堆栈。
这些指令不影响条件码标志。
指令示例:
PUSH{R0,R3,R5}
PUSH{R1,R4-R7}
PUSH{R0,LR}
POP{R2,R5}
POP{R0-R7,PC}
(5)LDMIA和STMIA
加载和存储多个寄存器。
指令格式:
opRn!
,{reglist}
其中,op为LDMIA或STMIA。
reglist为低寄存器或低寄存器范围的、用逗号隔开的列表。
括号是指令格式的一部分,它们不代表指令列表可选,列表中至少应有1个寄存器。
寄存器以数字顺序加载或存储,最低数字的寄存器在Rn的初始地址中。
Rn的值以reglist中寄存器个数的4倍增加。
若Rn在寄存器列表中,则:
●对于LDMIA指令,Rn的最终值是加载的值,不是增加后的地址。
●对于STMIA指令,Rn存储的值有两种情况:
若Rn是寄存器列表中最低数字的寄存器,则Rn存储的值为Rn的初值;其他情况则不可预知,当然,reglist中最好不包括Rn。
指令示例:
LDMIAR3!
{R0,R4}
LDMIAR5!
{R0~R7}
STMIAR0!
{R6,R7}
STMIAR3!
{R3,R5,R7}
2.数据处理指令
(1)ADD和SUB——低寄存器
加法和减法。
对于低寄存器操作,这2条指令各有如下3种形式:
●两个寄存器的内容相加或相减,结果放到第3个寄存器中。
●寄存器中的值加上或减去一个小整数,结果放到另一个不同的寄存器中。
●寄存器中的值加上或减去一个大整数,结果放回同一个寄存器中。
指令格式:
opRd,Rn,Rm
opRd,Rn,#expr3
opRd,#expr8
其中:
●op为ADD或SUB。
●Rd:
目的寄存器。
它也用做“opRd,#expr8”的第1个操作数。
●Rn:
第一操作数寄存器。
●Rm:
第二操作数寄存器。
●expr3:
表达式,为取值在-7~+7范围内的整数(3位立即数)。
●expr8:
表达式,为取值在-255~+255范围内的整数(8位立即数)。
“opRd,Rn,Rm”执行Rn+Rm或Rn-Rm操作,结果放在Rd中。
“opRd,Rn,#expr3”执行Rn+expr3或Rn-expr3操作,结果放在Rd中。
“opRd,#expr8”执行Rd+expr8或Rd-expr8操作,结果放在Rd中。
expr3或expr8为负值的ADD指令汇编成相对应的带正数常量的SUB指令。
expr3或expr8为负值的SUB指令汇编成相对应的带正数常量的ADD指令。
Rd、Rn和Rm必须是低寄存器(R0~R7)。
这些指令更新标志N、Z、C和V。
指令示例:
ADDR3,Rl,R5
SUBR0,R4,#5
ADDR7,#201
(2)ADD——高或低寄存器
将寄存器中值相加,结果送回到第一操作数寄存器。
指令格式:
ADDRd,Rm
其中:
●Rd:
目的寄存器,也是第一操作数寄存器。
●Rm:
第二操作数寄存器。
这条指令将Rd和Rm中的值相加,结果放在Rd中。
当Rd和Rm都是低寄存器时,指令“ADDRd,Rm”汇编成指令“ADDRd,Rd,Rm”。
若Rd和Rm是低寄存器,则更新条件码标志N、Z、C和V;其他情况下这些标志不受影响。
指令示例:
ADDR12,R4
(3)ADD和SUB——SP
SP加上或减去立即数常量。
指令格式:
ADDSP,#expr
SUBSP,#expr
其中:
expr为表达式,取值(在汇编时)为在-508~+508范围内的4的整倍数。
该指令把expr的值加到SP的值上或用SP的值减去expr的值,结果放到SP中。
expr为负值的ADD指令汇编成相对应的带正数常量的SUB指令。
expr为负值的SUB指令汇编成相对应的带正数常量的ADD指令。
这条指令不影响条件码标志。
指令示例:
ADDSP,#32
SUBSP,#96
(4)ADD——PC或SP相对偏移
SP或PC值加一立即数常量,结果放入低寄存器。
指令格式:
ADDRd,Rp,#expr
其中:
●Rd:
目的寄存器。
Rd必须在R0~R7范围内。
●Rp:
SP或PC。
●expr:
表达式,取值(汇编时)为在0~1020范围内的4的整倍数。
这条指令把expr加到Rp的值中,结果放入Rd。
若Rp是PC,则使用值是(当前指令地址+4)AND&FFFFFFC,即忽略地址的低2位。
这条指令不影响条件码标志。
指令示例:
ADDR6,SP,#64
ADDR2,PC,#980
(5)ADC、SBC和MUL
带进位的加法、带进位的减法和乘法。
指令格式:
opRd,Rm
其中:
●op为ADC、SBC或MUL。
●Rd:
目的寄存器,也是第一操作数寄存器。
●Rm:
第二操作数寄存器,Rd、Rm必须是低寄存器。
ADC将带进位标志的Rd和Rm的值相加,结果放在Rd中,用这条指令可组合成多字加法。
SBC考虑进位标志,从Rd值中减去Rm的值,结果放入Rd中,用这条指令可组合成多字减法。
MUL进行Rd和Rm值的乘法,结果放入Rd中。
Rd和Rm必须是低寄存器(R0~R7)。
ADC和SBC更新标志N、Z、C和V。
MUL更新标志N和Z。
在ARMv4及以前版本中,MUL会使标志C和V不可靠。
在ARMv5及以后版本中,MUL不影响标志C和V。
指令示例:
ADCR2,R4
SBCR0,R1
MULR7,R6
(6)按位逻辑操作AND、ORR、EOR和BIC
指令格式:
opRd,Rm
其中:
●op为AND、ORR、EOR或BIC。
●Rd:
目的寄存器,它也包含第一操作数,Rd必须在R0~R7范围内。
●Rm:
第二操作数寄存器,Rm必须在R0~R7范围内。
这些指令用于对Rd和Rm中的值进行按位逻辑操作,结果放在Rd中,操作如下:
●AND:
进行逻辑“与”操作。
●ORR:
进行逻辑“或”操作。
●EOR:
进行逻辑“异或”操作。
●BIC:
进行“RdANDNOTRm”操作。
这些指令根据结果更新标志N和Z。
程序示例:
ANDR1,R2
ORR R0,R1
EOR R5,R6
BIC R7,R6
(7)移位和循环移位操作ASR、LSL、LSR和ROR
Thumb指令集中,移位和循环移位操作作为独立的指令使用,这些指令可使用寄存器中的值或立即数移位量。
指令格式:
opRd,Rs
opRd,Rm,#expr
其中:
●op是下列其中之一:
●ASR:
算术右移,将寄存器中的内容看做补码形式的带符号整数。
将符号位复制到空出位。
●LSL:
逻辑左移,空出位填零。
●LSR:
逻辑右移,空出位填零。
●ROR:
循环右移,将寄存器右端移出的位循环移回到左端。
ROR仅能与寄存器控制的移位一起使用。
●Rd:
目的寄存器,它也是寄存器控制移位的源寄存器。
Rd必须在R0~R7范围内。
●Rs:
包含移位量的寄存器,Rs必须在R0~R7范围内。
●Rm:
立即数移位的源寄存器,Rm必须在R0~R7范围内。
●expr:
立即数移位量,它是一个取值(在汇编时)为整数的表达式。
整数的范围为:
若op是LSL,则为0~31;其他情况则为1~32。
对于除ROR以外的所有指令:
●若移位量为32,则Rd清零,最后移出的位保留在标志C中。
●若移位量大于32,则Rd和标志C均被清零。
这些指令根据结果更新标志N和Z,且不影响标志V。
对于标志C,若移位量是零,则不受影响。
其他情况下,它包含源寄存器的最后移出位。
指令示例:
ASRR3,R5
LSRR0,R2,#16 ;将R2的内容逻辑右移16次后,结果放入R0中
LSRR5,R5,av
(8)比较指令CMP和CMN
指令格式:
CMPRn,#expr
CMPRn,Rm
CMNRn,Rm
其中:
●Rn:
第一操作数寄存器。
●expr:
表达式,其值(在汇编时)为在0~255范围内的整数。
●Rm:
第二操作数寄存器。
CMP指令从Rn的值中减去expr或Rm的值,CMN指令将Rm和Rn的值相加,这些指令根据结果更新标志N、Z、C和V,但不往寄存器中存放结果。
对于“CMPRn,#expr”和CMN指令,Rn和Rm必须在R0~R7范围内。
对于“CMPRn,Rm”指令,Rn和Rm可以是R0~R15中的任何寄存器。
指令示例:
CMPR2,#255
CMPR7,R12
CMNRl,R5
(9)传送、传送非和取负(MOV、MVN和NEG)
指令格式:
MOVRd,#expr
MOVRd,Rm
MVNRd,Rm
NEGRd,Rm
其中:
●Rd:
目的寄存器。
●expr:
表达式,其取值为在0~255范围内的整数。
●Rm:
源寄存器。
MOV指令将#expr或Rm的值放入Rd。
MVN指令从Rm中取值,然后对该值进行按位逻辑“非”操作,结果放入Rd。
NEG指令取Rm的值再乘以-1,结果放入Rd。
对于“MOVRd,#expr”、MVN和NEG指令,Rd和Rm必须在R0~R7范围内。
对于“MOVRd,Rm”指令,Rd和Rm可以是寄存器R0~R15中的任意一个。
“MOVRd,#expr”和MVN指令更新标志N和Z,对标志C或V无影响。
NEG指令更新标志N、Z、C和V。
“MOVRd,Rm”指令中,若Rd或Rm是高寄存器(R8~R18),则标志不受影响;若Rd和Rm都是低寄存器(R0~R7),则更新标志N和Z,且清除标志C和V。
指令示例:
MOVR3,#0
MOVR0,R12
MVNR7,R1
NEGR2,R2
(10)测试位TST
指令格式:
TSTRn,Rm
其中:
●Rn:
第一操作数寄存器。
●Rm:
第二操作数寄存器。
TST对Rm和Rn中的值进行按位“与”操作。
但不把结果放入寄存器。
该指令根据结果更新标志N和Z,标志C和V不受影响。
Rn和Rm必须在R0~R7范围内。
指令示例:
TSTR2,R4
3.分支指令
(1)分支B指令
这是Thumb指令集中唯一的有条件指令。
指令格式:
B{cond}label
其中,label是程序相对偏移表达式,通常是在同一代码块内的标号。
若使用cond,则label必须在当前指令的-256~+256字节范围内。
若指令是无条件的,则label必须在±2KB范围内。
若cond满足或不使用cond,则B指令引起处理器转移到label。
label必须在指定限制内。
ARM链接器不能增加代码来产生更长的转移。
指令示例:
Bdloop
BEGsectB
(2)带链接的长分支BL指令
指令格式:
BLlabel
其中,1abel为程序相对转移表达式。
BL指令将下一条指令的地址复制到R14(链接寄存器),并引起处理器转移到1abel。
BL指令不能转移到当前指令±4MB以外的地址。
必要时,ARM链接器插入代码以允许更长的转移。
指令示例:
BLextract
(3)分支,并可选地切换指令集BX
指令格式:
BX Rm
其中,Rm装有分支目的地址的ARM寄存器。
Rm的位[0]不用于地址部分。
若Rm的位[0]清零,则位[1]也必须清零,指令清除CPSR中的标志T,目的地址的代码被解释为ARM代码,BX指令引起处理器转移到Rm存储的地址。
若Rm的位[0]置位,则指令集切换到Thumb状态。
指令示例:
BX R5
(4)带链接分支,并可选地交换指令集BLX
指令格式:
BLX Rm
BLX label
其中,Rm装有分支目的地址的ARM寄存器。
Rm的位[0]不用于地址部分。
若Rm的位[0]清零,则位[1]必须也清零,指令清除CPSR中的标志T,目的地址的代码被解释为ARM代码。
Label为程序相对偏移表达式,“BLXlabel”始终引起处理器切换到ARM状态。
BLX指令可用于:
●复制下一条指令的地址到R14。
●引起处理器转移到label或Rm存储的地址。
●如果Rm的位[0]清零,或使用“BLXlabel”形式,则指令集切换到ARM状态。
指令不能转移到当前指令±4Mb范围以外的地址。
必要时,ARM链接器插入代码以允许更长的转移。
指令示例:
BLX R6
BLX armsub
4.中断和断点指令
(1)软件中断SWI指令
指令格式:
SWIimmed_8
其中,immed_8为数字表达式,其取值为0~255范围内的整数。
SWI指令引起SWI异常。
这意味着处理器状态切换到ARM态;处理器模式切换到管理模式,CPSR保存到管理模式的SPSR中,执行转移到SWI向量地址。
处理器忽略immed_8,但immed_8出现在指令操作码的位[7:
0]中,而异常处理程序用它来确定正在请求何种服务,这条指令不影响条件码标志。
指令示例:
SWI12
(2)断点BKPT指令
指令格式:
BKPTimmed_8
其中,immed_8为数字表达式,取值为0~255范围内的整数。
BKPT指令引起处理器进入调试模式。
调试工具利用这一点来调查到达特定地址的指令时的系统状态。
尽管immed_8出现在指令操作码的位[7:
0]中,处理器忽略immed_8。
调试器用它来保存有关断点的附加信息。
指令示例:
BKPT67