第4节 汇编语言源程序格式.docx
《第4节 汇编语言源程序格式.docx》由会员分享,可在线阅读,更多相关《第4节 汇编语言源程序格式.docx(15页珍藏版)》请在冰豆网上搜索。
第4节汇编语言源程序格式
第4节汇编语言源程序格式
第4章汇编语言程序设计 汇编语言源程序格式 汇编语言上机过程 汇编语言与C语言混合编程技术 常用ARM源程序文件类型
汇编语言程序的结构1
汇编语言程序的结构2
汇编语言程序的结构3
汇编语言程序的结构4 ARM的汇编语言程序一般由几个段组成,每个段均由AREA伪操作定义。
段可以分为多种,如代码段、数据段、通用段,每个段又有不同的属性,如代码段的默认属性为READONLY,数据段的默认属性为READWRITE。
本程序定义了两个段,第一个段为代码段codesec,它在存储器中存放用于程序执行的代码以及main函数的本地字符串;第二个段为数据段constdatasec,存放了全局的字符串,由于本程序没有对数据进行写操作,该数据段定义属性为READONLY。
汇编语言的行构成1 格式:
[标签]指令/伪操作/伪指令操作数[;语句的注释] 所有的标签必须在一行的开头顶格写,前面不能留空格,后面也不能跟C语言中的标签一样加上“:
”; ARM汇编器对标识符的大小写敏感,书写标号及指令时字母的大小写要一致; 注释使用“;”符号,注释的内容从“;”开始到该行的结尾结束 汇编语言的行构成2 标签 标签是一个符号,可以代表指令的地址、变量、数据的地址和常量。
一般以字母开头,由字母、数字、下划线组成。
当符号代表地址时又称标号,可以以数字开头,其作用范围为当前段或者在下一个ROUT伪操作之前。
指令/伪操作 指令/伪操作是指令的助记符或者定义符,它告诉ARM的处理器应该执行什么样的操作或者告诉汇编程序伪指令语句的伪操作功能。
汇编语言的标号1 标号代表地址。
标号分为段内标号和段外标号。
段内标号的地址值在汇编时确定,段外编号的地址值在链接时确定。
在程序段中,标号代表其所在位置与段首地址的偏移量。
根据程序计数器(PC)和偏移量计算地址即程序相对寻址。
在映像中定义的标号代表标号到映像首地址的偏移量。
映像的首地址通常被赋予一个寄存器,根据该寄存器值与偏移量计算地址即寄存器相对寻址。
例如:
loopSUBSr0,r0,#1;每次循环使r0=r0-1 BNEloop;跳转到loop标号去执行 汇编语言的标号2 在宏中也可以使用局部符号。
局部标号是0~99的十进位数开始,可以重复定义。
局部标号引用格式:
%{F|B}{A|T}N{routname} %:
局部标号引用操作。
F:
编译器只向前搜索。
B:
编译器只向后搜索。
A:
编译器搜索宏的所有嵌套层次。
T:
编译器搜索宏的当前层。
例如:
01SUBSr0,r0,#1;每次循环使r0=r0-1 BNE%B01;跳转到01标号去执行 汇编语言的常量 常量:
其值在程序运行过程中不能被改变的量。
(1)数字常量:
数字常量有3种表示方式:
十进制数,如1、2、123 十六进制数,如0x123,0xabc n进制数,形式为n_XXX,n的范围是2到9,XXX是具体数字
(2)字符常量:
由单引号及中间的字符组成,包括C语言中的转义字符,如’a’,’\n’ (3)字符串常量:
由一对双引号及中间的字符串表示,中间也可以使用C语言中的转义字符,比如:
“abcdef\0xa\r\n” (4)逻辑常量:
{TRUE},{FALSE},注意带大括号 汇编程序的变量代换1 这里所说的变量,是相对于汇编程序的“变量”,是用于汇编程序进行处理的,但一旦编译到程序中,则不会改变,成为常量。
在字符串变量的前面有一个$字符,在汇编时编译器将用该字符串变量的内容代替该串变量。
在数字变量前面有一个代换操作符“$”,编译器会将该数字变量的值转换为十六进制的字符串,并用该十六进制的字符串代换“$”后的数字变量。
需要将“$”字符加入到字符串中,可以用“$$”代替,此时编译器将不再进行变量代换,而是把“$$”看作一个“$”。
在两个“|”之间的“$”并不进行变量的代换,但如果“|”在双引号内,则将进行变量代换。
使用“.”来表示字符串中变量名的结束。
汇编程序的变量代换2
字符串“aaastr1:
$str1.l1:
$l1,a1:
$num1.ccc”中的3个变量将在编译时被替换。
程序运行后看到下面结果:
aaastr1:
bbbl1:
T,a1:
0000004Fccc 伪指令 在ARM汇编语言源程序中有些特殊助记符,它们没有相对应的操作码或者机器码,通常称为伪指令,它们所完成的操作称为伪操作。
伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,由汇编程序在源程序的汇编期间进行处理,仅在汇编过程中起作用。
在ARM的汇编程序中,有如下几种伪指令:
符号定义伪指令 数据定义伪指令 汇编控制伪指令 信息报告伪指令 宏指令以及其他伪指令 符号定义伪指令 作用:
用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等。
符号定义有如下几种伪指令:
用于定义局部变量的LCLA、LCLL和LCLS。
用于定义全局变量的GBLA、GBLL和GBLS。
用于对变量赋值的SETA、SETL和SETS。
为通用寄存器列表定义名称的RLIST。
符号定义伪指令1-1
(1)LCLA、LCLL和LCLS 格式:
LCLA/LCLL/LCLS局部变量名 说明:
LCLA、LCLL和LCLS伪指令用于定义一个汇编程序中的局部变量并初始化。
其中:
LCLA定义一个局部的数字变量,初始化为0。
LCLL定义一个局部的逻辑变量,初始化为F。
LCLS定义一个局部的字符串变量,初始化为空串。
这3条伪指令用于声明局部变量,在其局部作用范围内变量名必须惟一,例如在宏内。
符号定义伪指令1-2
符号定义伪指令2-1 2)GBLA、GBLL和GBLS 格式:
GBLA/GBLL/GBLS变量名 说明:
GBLA、GBLL和GBLS伪操作定义一个汇编程序中的全局变量并初始化。
其中:
GBLA定义一个全局数字变量,并初始化为0。
GBLL定义一个全局逻辑变量,并初始化为F。
GBLS定义一个全局字符串变量,并初始化为空串。
这3条伪指令用于定义全局变量,因此在整个程序范围内变量名必须惟一。
符号定义伪指令2-2 例如:
GBLAnum1;定义一个全局的数字变 ;量,变量名为num1 num1SETA0xabcd;将该变量赋值为0xabcd GBLLl2;定义一个全局的逻辑变 ;量,变量名为l2 l2SETL{FALSE};将该变量赋值为假 GBLSstr3;定义一个全局的字符串变 ;量,变量名为str3 str3SETS"Hello!
";将该变量赋值为“Hello!
” 符号定义伪指令3-1 (3)SETA、SETL和SETS 格式:
变量名SETA/SETL/SETS表达式 说明:
SETA:
给一个数字变量赋值。
SETL:
给一个逻辑变量赋值。
SETS:
给一个字符串变量赋值。
格式中的变量名必须为已经定义过的全局或局部变量,表达式为将要赋给变量的值。
符号定义伪指令3-2 例如:
LCLAnum1;定义一个局部的数字 ;变量,变量名为num1 num1SETA0x1234;将该变量赋值 ;为0x1234 LCLSstr3;定义一个局部的字符串变 ;量,变量名为str3 str3SETS“Hello!
”;将该变量赋值为 ;“Hello!
” 符号定义伪指令4 4)RLIST 格式:
名称RLIST{寄存器列表} 说明:
RLIST可用于对一个通用寄存器列表定义名称,该名称可在ARM指令LDM/STM中使用。
在LDM/STM指令中,列表中的寄存器为根据寄存器的编号由低到高访问次序,与列表中的寄存器排列次序无关。
例如:
pblockRLIST{R0-R3,R7,R5,R9} ;将寄存器列表名称定义为pblock,可在ARM指令 ;LDM/STM中通过该名称访问寄存器列表 数据定义伪指令 作用:
为数据分配存储单元,同时初始化。
有如下几种:
DCB字节分配 DCW/DCWU半字(2字节)分配 DCD/DCDU字(4字节)分配 DCQ/DCQU8个字节分配 DCFS/DCFSU单精度浮点数分配 DCFD/DCFDU双精度浮点数分配 SPACE分配一块连续的存储单元 FIELD定义一个结构化的内存表的数据域 MAP定义一个结构化的内存表首地址 数据定义伪指令1
(1)DCB 格式:
标号DCB表达式 说明:
分配一块字节单元并用伪指令中指定的表达式进行初始化。
表达式可以为使用双引号的字符串或0~255的数字。
DCB可用“=”代替。
例如:
Array1DCB1,2,3,4,5;数组 str1DCB"Yourarewelcome!
" ;构造字符串并分配空间 数据定义伪指令2
(2)DCW/DCWU 格式:
标号DCW/DCWU表达式 说明:
DCW分配一段半字存储单元并用表达式值初始化,它定义的存储空间是半字对齐的。
DCWU功能与DCW类似,只是分配的字存储单元不严格半字对齐。
例如:
Arrayw1DCW0xa,-0xb,0xc,-0xd ;构造固定数组并分配半字存储单元 数据定义伪指令3 (3)DCD/DCDU 格式:
标号DCD/DCDU表达式 说明:
DCD伪指令用于分配一块字存储单元并用伪指令中指定的表达式初始化,它定义的存储空间是字对齐的。
DCD也可用“&”代替。
DCDU功能与DCD类似,只是分配的存储单元不严格字对齐。
例如:
Arrayd1DCD1334,234,345435 ;构造固定数组并分配字为单元的存储单元 LabelDCDstr1;该字单元存放str1的地址 数据定义伪指令4 (4)DCQ/DCQU 格式:
标号DCQ/DCQU表达式 说明:
DCQ用于分配一块以8个字节为单位的存储区域并用伪指令中指定的表达式初始化,它定义的存储空间是字对齐的。
DCQU功能与DCQ类似,只是分配的存储单元不严格字对齐。
例如:
Arrayd1DCQ234234,98765541 ;构造固定数组并分配字为单元的存储空间。
;注意:
DCQ不能给字符串分配空间 数据定义伪指令5 (5)DCFD/DCFDU 格式:
标号DCFD/DCFDU表达式 说明:
DCFD用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化,它定义的存储空间是字对齐的。
每个双精度的浮点数占据两个字单元。
DCFDU功能与DCFD类似,只是分配的存储单元不严格字对齐。
例如:
Arrayf1DCFD6E2 Arrayf2DCFD1.23,1.45 数据定义伪指令6 (6)DCFS/DCFSU 格式:
标号DCFS/DCFSU表达式 说明:
DCFS用于为单精度的浮点数分配一片连续的字存储单元并用表达式初始化,它定义的存储空间是字对齐的。
每个单精度浮点数使用一个字单元。
DCFSU功能与DCFS类似,只是分配的存储单元不严格字对齐。
例如:
Arrayf1DCFS6E2,-9E-2,-.3 Arrayf2DCFSU1.23,6.8E9 数据定义伪指令7 7)SPACE 格式:
标号SPACE表达式 说明:
SPACE用于分配一片连续的存储区域并初始化为0,表达式为要分配的字节数。
SPACE也可用“%”代替。
例如:
freespaceSPACE1000 ;分配1000字节的存储空间 数据定义伪指令8 (8)MAP 格式:
MAP表达式[,基址寄存器] 说明:
MAP定义一个结构化的内存表的首地址。
此时,内存表的位置计数器{VAR}(汇编器的内置变量)设置成该地址值。
“^”可以用来代替MAP。
表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。
MAP可以与FIELD伪操作配合使用来定义结构化的内存表。
例如:
MAP0x130,R2;内存表首地址为0x130+R2 数据定义伪指令9 (9)FIELD 格式:
标号FIELD字节数 说明:
FIELD用于定义一个结构化内存表中的数据域。
“#”可用来代替FIELD。
FIELD常与MAP配合使用来定义结构化的内存表:
FIELD伪指令定义内存表中的各个数据域,MAP则定义内存表的首地址,并为每个数据域指定一个标号以供其他的指令引用。
需要注意的是MAP和FIELD伪指令仅用于定义数据结构,并不分配存储单元。
例如:
MAP0xF10000 ;定义结构化内存表首地址为0xF10000 countFIELD4 ;定义count的长度为4字节,位置为0xF1000+0 xFIELD4 ;定义x的长度为4字节,位置为0xF1004 yFIELD4 ;定义y的长度为4字节,位置为0xF1008 汇编控制伪指令 作用:
指引汇编程序的执行流程。
常用的伪操作包括:
(1)MACRO和MEND:
宏定义的开始与结束。
(2)IF、ELSE和ENDIF:
根据逻辑表达式的成立与否决定是否在编译时加入某个指令序列。
(3)WHILE和WEND:
根据逻辑表达式的成立与否决定是否循环执行这个代码段。
(4)MEXIT:
从宏中退出。
MACRO和MEND 格式 MACRO [$标号]宏名[$参数1,$参数2,……] 指令序列 MEND 其中,$标号在宏指令被展开时,标号可被替换成相应的符号(在一个符号前使用$,表示程序在汇编时将使用相应的值来替代$后的符号),$参数1为宏指令的参数,当宏指令被展开时将被替换成相应的值,类似于函数中的形式参数。
宏指令可以重复使用,与子程序有些类似,子程序可以节省存储空间,提供模块化的程序设计。
但是使用子程序结构时需要保存/恢复现场,从而增加了系统的开销。
使用说明:
在子程序比较短而需要传递的参数比较多的情况下,可使用宏汇编技术。
宏定义伪指令 例子 MACRO;宏定义开始 $labeljump$a1,$a2;宏的名称为jump,有2个参数a1和a2 $label.loop1;$label.loop1为宏体的内部标号 … BGE$label.loop1 $label.loop2 BL$a1;参数$a1为一个子程序的名称 BGT$label.loop2 … ADR$a2 … MEND;宏定义结束 宏定义伪指令 在程序中调用该宏 examjumpsub,det;调用宏jump,宏的标号为exam,参数1为sub,参数2为det 程序被汇编后,宏的展开结果:
… examloop1 … BGEexamloop1 examloop2 BLsub BGTexamloop2 ADRdet IF、ELSE和ENDIF 格式:
IF逻辑表达式 代码段1 ELSE 代码段2 ENDIF 说明:
能根据逻辑表达式的成立与否决定是否在编译时加入某个指令序列。
IF、ELSE和ENDIF分别可以用“[”,“|”,“]”代替。
如果IF后面的逻辑表达式为真,则编译代码段1,否则编译代码段2。
ELSE及代码段2也可以没有,这时,当IF后面的逻辑表达式为真时,则代码段1,否则继续编译后面的指令。
WHILE和WEND 格式:
WHILE逻辑表达式 代码段 WEND 说明:
WHILE和WEND伪指令能根据逻辑表达式的成立与否决定是否循环执行这个代码段。
当WHILE后面的逻辑表达式为真时,则执行代码段,该代码段执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。
例如:
GBLAnum;声明全局的数字变量num numSETA9;由num控制循环次数 … WHILEnum>0 subr0,r0,1 addr1,r1,1 WEND 其他伪指令 在汇编程序中经常会使用一些其他的伪指令,包括以下18条:
ASSERTAREA ALIGNCODE16/CODE32 ENTRYEND EQUIMPORT EXPORT/GLOBALEXTERN INCBINGET/INCLUDE RNROUT ADRADRL LDRNOP 其他伪指令1
(1)ASSERT 格式:
ASSERT逻辑表达式 说明:
ASSERT用来表示程序的编译必须满足一定的条件,如果逻辑表达式不满足,则编译器会报错,并终止汇编。
例如:
ASSERTver>7;保证ver>7 其他伪指令2 2)AREA 格式:
AREA段名属性,…… 说明:
AREA用于定义一个代码段、数据段或者特定属性的段。
如果段名以数字开头,那么该段名需用“|”字符括起来,如|7wolf|,用C的编译器产生的代码一般也用“|”括起来。
属性部分表示该代码段/数据段的相关属性,多个属性可以用“,”分隔。
常见属性如下:
①DATA:
定义数据段,默认属性是READWRITE。
②CODE:
定义代码段,默认属性是READONLY。
③READONLY:
表示本段为只读。
④READWRITE:
表示本段可读写。
⑤ALIGN=表达式,表示段的对齐方式为2的表达式次方,例如:
表达式=3,则对齐方式为8字节对齐。
表达式的取值范围为0~31。
⑥COMMON属性:
定义一个通用段,这个段不包含用户代码和数据。
其他伪指令3 (3)ALIGN 格式:
ALIGN[表达式[,偏移量]] 说明:
ALIGN伪操作可以通过填充字节使当前的位置满足一定的对齐方式。
表达式的值为2的幂,如1、2、4、8、16等,用于指定对齐方式。
如果伪操作中没有指定表达式,则编译器会将当前位置对齐到下一个字的位置。
偏移量也是个数字表达式,如果存在偏移量,则当前位置自动对齐到2的表达式值次方+偏移量。
例如:
AREA||.data||,DATA,READWRITE,ALIGN=2 其他伪指令4 (4)CODE16/CODE32 格式:
CODE16/CODE32 说明:
CODE16伪操作指示编译器后面的代码为16位的Thumb指令。
CODE32伪操作指示编译器后面的代码为32位的ARM指令。
如果在汇编源代码中同时包含Thumb和ARM指令时,可以用“CODE32”通知编译器后的指令序列为32位的ARM指令,用“CODE16”伪指令通知编译器后的指令序列为16位的Thumb指令。
CODE16/CODE32不能对处理器进行状态的切换。
例如:
CODE32;32位的ARM指令 AREA||.text||,CODE,READONLY … LDRR0,=0x8500; BXR0;程序跳转,并将处理器切换到Thumb状态 … CODE16;16位的Thumb指令 ADDR3,R3,1 END;源文件结束 其他伪指令5-1 (5)ENTRY 格式:
ENTRY 说明:
ENTRY用于指定汇编程序的入口。
在一个完整的汇编程序中至少要有一个ENTRY,程序中也可以有多个,此时,程序的真正入口点可在链接时指定,但在一个源文件里最多只能有一个ENTRY或者没有ENTRY。
其他伪指令5-2
其他伪指令6 (6)END 格式:
END 说明:
END告诉编译器已经到了源程序的结尾。
例如:
AREAconstdata,DATA,READONLY … END;结尾 其他伪指令7 (7)EQU 格式:
名称EQU表达式[,类型] 说明:
EQU用于将程序中的数字常量、标号、基于寄存器的值赋予一个等效的名称,这一点类似于C语言中的#define. 可用“*”代替EQU。
如果表达式为32位的常量,我们可以指定表达式的数据类型,类型域可以有以下3种:
CODE16/CODE32/DATA 例如:
num1EQU1234;定义num1为1234 addr5EQUstr1+0x50 d1EQU0x2400,CODE32;定义d1的为0x2400,且该处为32位的ARM指令 其他伪指令8 (8)EXPORT/GLOBAL 格式:
EXPORT/GLOBAL标号[,WEAK] 说明:
EXPORT在程序中声明一个全局标号,其他文件中的代码可以被该标号引用。
用户也可以用GLOBAL代替EXPORT。
[,WEAK]可选项声明其他文件有同名的标号,则该同名标号优先于该标号被引用。
例如:
AREA||.text||,CODE,READONLY mainPROC … ENDP EXPORTmain;声明一个可全局引用的函数main … END 其他伪指令9 (9)IMPORT 格式:
IMPORT标号[,WEAK] 说明:
告诉编译器,这个标号要在当前源文件中使用,但标号是在其他的源文件中定义的。
[,WEAK]:
如果所有的源文件都没有找到这个标号的定义,编译器也不会提示错误信息,同时编译器也不会到当前没有被INCLUDE进来的库中去查找该符号。
例如:
AREAmycode,CODE,READONLY IMPORT_printf ;通知编译器当前文件要引用函数_printf … END IMPORT 使用说明 使用IMPORT为操作声明一个符号是在其他源文件中定义的。
如果链接器在链接处理时不能解析该符号,而且IMPORT为操作中没有指定[WEAK]选项,则链接器将会报告错误。
如果链接器在链接处理时不能解析该符号,而IMPORT伪操作中指定了[WEAK]选项,则链接器不会报告错误,而是进行下面的操作:
如果该符号被B或BL指令引用,则该符号被设置成下一条指令的地址,该B或者BL指令相当于一条NOP指令。
例如“Bsign”,“sign”不能被解析,则该指令被忽略为NOP指令,继续执行下面的指令,也就是将sign理解为下一条指令的地址。
其他情况下该符号被设置为0。
其他伪指令10 10)EXTERN 格式:
EXTERN标号[,WEAK] 说明:
告诉编译器,标号要在当前源文件中引用,但是该标号是在其他的源文件中定义的。
与IMPORT不同的是,如果当前源文件实际上没有引用该标号,该标号就不会被加入到当前文件的符号表中。
[,WEAK]:
即使所有的源文件都没有找到这个标号的定义,编译器也不给出错误信息。
例如:
AREA||.text||,CODE,READONLY … EXTERN_printf,WEAK;告诉编译器当前文件要引用标号,如果找不到,则不提示错误 … END 其他伪指令11 (11)GET/INCLUDE 格式:
GET文件名 说明:
GET将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置展开进行汇编处理。
INCLUDE和GET的作用是等效的。
使用方法:
在某源文件中定义一些宏指令,用MAP和FIELD定义结构化的数据类型,用EQU定义常量的符号名称,然后用GET/INCLUDE将这个源文件包含到其他的源文件中。
使用方法与C语言中的“#include”相似。
GET/INCLUDE只能用于包含源文件,包含其他文件则需要使用INCBIN伪指令。
例如:
AREAmycode,DATA,READONLY GETE:
\code\prog1.s;通知编译器在当前源文件包含源文件E:
\code\prog1.s GETprog2.s;通知编译器当前源文件包含可搜索目录下的prog2.s … END 其他伪指令12 (12)INCBIN 格式:
INCBIN文件名 说明:
INCBIN将一个数据文件或者目标文件包含到当前的源文件中,编译时被包含的文件不作任何变动地存放在当前文件中,编译器从后面开始继续处理。
例如:
AREAconstdata,DATA,READONLY INCBINdata1.dat;源文件包含文件data1.dat INCBINE:
\DATA\data2.bin ;源文件包含文件E:
\