1、第4节 汇编语言源程序格式第4节 汇编语言源程序格式第4章 汇编语言程序设计汇编语言源程序格式汇编语言上机过程汇编语言与C语言混合编程技术常用ARM源程序文件类型汇编语言程序的结构1汇编语言程序的结构2汇编语言程序的结构3汇编语言程序的结构4ARM的汇编语言程序一般由几个段组成,每个段均由AREA伪操作定义。段可以分为多种,如代码段、数据段、通用段,每个段又有不同的属性,如代码段的默认属性为READONLY,数据段的默认属性为READWRITE。本程序定义了两个段,第一个段为代码段codesec,它在存储器中存放用于程序执行的代码以及main函数的本地字符串;第二个段为数据段constdata
2、sec,存放了全局的字符串,由于本程序没有对数据进行写操作,该数据段定义属性为READONLY。汇编语言的行构成1格式:标签 指令/伪操作/伪指令 操作数 ;语句的注释所有的标签必须在一行的开头顶格写,前面不能留空格,后面也不能跟C语言中的标签一样加上“:”;ARM汇编器对标识符的大小写敏感,书写标号及指令时字母的大小写要一致;注释使用“;”符号,注释的内容从“;”开始到该行的结尾结束汇编语言的行构成2标签标签是一个符号,可以代表指令的地址、变量、数据的地址和常量。一般以字母开头,由字母、数字、下划线组成。当符号代表地址时又称标号,可以以数字开头,其作用范围为当前段或者在下一个ROUT伪操作之
3、前。指令/伪操作指令/伪操作是指令的助记符或者定义符,它告诉ARM的处理器应该执行什么样的操作或者告诉汇编程序伪指令语句的伪操作功能。汇编语言的标号1标号代表地址。标号分为段内标号和段外标号。段内标号的地址值在汇编时确定,段外编号的地址值在链接时确定 。在程序段中,标号代表其所在位置与段首地址的偏移量。根据程序计数器(PC)和偏移量计算地址即程序相对寻址。在映像中定义的标号代表标号到映像首地址的偏移量。映像的首地址通常被赋予一个寄存器,根据该寄存器值与偏移量计算地址即寄存器相对寻址。例如:loop SUBS r0,r0,#1 ;每次循环使r0=r0-1BNE loop ;跳转到loop 标号去
4、执行汇编语言的标号2在宏中也可以使用局部符号。局部标号是099的十进位数开始,可以重复定义。局部标号引用格式:F|BA|T Nroutname% :局部标号引用操作。F :编译器只向前搜索。B :编译器只向后搜索。A :编译器搜索宏的所有嵌套层次。T :编译器搜索宏的当前层。例如:01 SUBS r0,r0,#1 ;每次循环使r0=r0-1BNE %B01 ;跳转到01标号去执行汇编语言的常量常量:其值在程序运行过程中不能被改变的量。(1)数字常量:数字常量有3种表示方式:十进制数,如1、2、123十六进制数,如 0x123,0xabcn进制数,形式为n_XXX,n的范围是2到9,XXX是具体
5、数字(2)字符常量:由单引号及中间的字符组成,包括C语言中的转义字符,如a,n(3)字符串常量:由一对双引号及中间的字符串表示,中间也可以使用C语言中的转义字符,比如:“abcdef0xarn”(4)逻辑常量:TRUE,FALSE,注意带大括号汇编程序的变量代换1这里所说的变量,是相对于汇编程序的“变量”,是用于汇编程序进行处理的,但一旦编译到程序中,则不会改变,成为常量。在字符串变量的前面有一个$字符,在汇编时编译器将用该字符串变量的内容代替该串变量。在数字变量前面有一个代换操作符“$”,编译器会将该数字变量的值转换为十六进制的字符串,并用该十六进制的字符串代换“$”后的数字变量。需要将“$
6、”字符加入到字符串中,可以用“$”代替,此时编译器将不再进行变量代换,而是把“$”看作一个“$”。在两个“|”之间的“$”并不进行变量的代换,但如果“|”在双引号内,则将进行变量代换。使用“.”来表示字符串中变量名的结束。汇编程序的变量代换2字符串“aaa str1:$str1. l1:$l1,a1:$num1.ccc”中的3个变量将在编译时被替换。程序运行后看到下面结果:aaa str1:bbb l1:T,a1:0000004Fccc伪指令在ARM汇编语言源程序中有些特殊助记符,它们没有相对应的操作码或者机器码,通常称为伪指令,它们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程
7、序作各种准备工作的,由汇编程序在源程序的汇编期间进行处理,仅在汇编过程中起作用。在ARM的汇编程序中,有如下几种伪指令:符号定义伪指令数据定义伪指令汇编控制伪指令信息报告伪指令宏指令以及其他伪指令符号定义伪指令作用:用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等。符号定义有如下几种伪指令:用于定义局部变量的LCLA、LCLL和LCLS。用于定义全局变量的GBLA、GBLL和GBLS。用于对变量赋值的SETA、SETL和SETS。为通用寄存器列表定义名称的RLIST。符号定义伪指令1-1(1)LCLA、LCLL和LCLS格式:LCLA/LCLL/LCLS 局部变量名说明:LCL
8、A、LCLL和LCLS伪指令用于定义一个汇编程序中的局部变量并初始化。其中:LCLA定义一个局部的数字变量,初始化为0。LCLL定义一个局部的逻辑变量,初始化为F。LCLS定义一个局部的字符串变量,初始化为空串。这3条伪指令用于声明局部变量,在其局部作用范围内变量名必须惟一,例如在宏内。符号定义伪指令1-2符号定义伪指令2-12)GBLA、GBLL和GBLS格式:GBLA/GBLL/GBLS 变量名说明:GBLA、GBLL和GBLS伪操作定义一个汇编程序中的全局变量并初始化。其中:GBLA定义一个全局数字变量,并初始化为0。GBLL定义一个全局逻辑变量,并初始化为F。GBLS定义一个全局字符串
9、变量,并初始化为空串。这3条伪指令用于定义全局变量,因此在整个程序范围内变量名必须惟一。符号定义伪指令2-2例如:GBLA num1 ;定义一个全局的数字变;量,变量名为num1num1 SETA 0xabcd;将该变量赋值为0xabcdGBLL l2 ;定义一个全局的逻辑变;量,变量名为l2l2 SETL FALSE ;将该变量赋值为假GBLS str3 ;定义一个全局的字符串变;量,变量名为str3str3 SETS Hello! ;将该变量赋值为“Hello!”符号定义伪指令3-1(3)SETA、SETL和SETS格式:变量名 SETA/SETL/SETS 表达式说明:SETA:给一个数
10、字变量赋值。SETL:给一个逻辑变量赋值。SETS:给一个字符串变量赋值。格式中的变量名必须为已经定义过的全局或局部变量,表达式为将要赋给变量的值。符号定义伪指令3-2例如:LCLA num1 ;定义一个局部的数字;变量,变量名为num1num1 SETA 0x1234 ;将该变量赋值;为0x1234LCLS str3 ;定义一个局部的字符串变;量,变量名为str3str3 SETS “Hello!” ;将该变量赋值为;“Hello!”符号定义伪指令44)RLIST格式:名称 RLIST 寄存器列表说明:RLIST可用于对一个通用寄存器列表定义名称,该名称可在ARM指令LDM/ STM中使用。
11、在LDM/STM指令中,列表中的寄存器为根据寄存器的编号由低到高访问次序,与列表中的寄存器排列次序无关。例如:pblock RLIST R0-R3,R7,R5,R9;将寄存器列表名称定义为pblock,可在ARM指令;LDM/STM中通过该名称访问寄存器列表数据定义伪指令作用:为数据分配存储单元,同时初始化。有如下几种:DCB 字节分配DCW/DCWU 半字(2字节)分配DCD/DCDU 字(4字节)分配DCQ/DCQU 8个字节分配DCFS/DCFSU 单精度浮点数分配DCFD/DCFDU 双精度浮点数分配SPACE 分配一块连续的存储单元FIELD 定义一个结构化的内存表的数据域MAP 定
12、义一个结构化的内存表首地址数据定义伪指令1(1)DCB格式:标号 DCB 表达式说明:分配一块字节单元并用伪指令中指定的表达式进行初始化。表达式可以为使用双引号的字符串或0255的数字。DCB可用“=”代替。例如:Array1 DCB 1,2,3,4,5 ;数组str1 DCB Your are welcome!;构造字符串并分配空间数据定义伪指令2(2)DCW/DCWU格式:标号 DCW/DCWU 表达式说明: DCW分配一段半字存储单元并用表达式值初始化,它定义的存储空间是半字对齐的。DCWU功能与DCW类似,只是分配的字存储单元不严格半字对齐。例如:Arrayw1 DCW 0xa,-0x
13、b,0xc,-0xd;构造固定数组并分配半字存储单元数据定义伪指令3(3)DCD/DCDU格式:标号 DCD/DCDU 表达式说明:DCD伪指令用于分配一块字存储单元并用伪指令中指定的表达式初始化,它定义的存储空间是字对齐的。DCD也可用“&”代替。DCDU功能与DCD类似,只是分配的存储单元不严格字对齐。例如:Arrayd1 DCD 1334,234,345435;构造固定数组并分配字为单元的存储单元Label DCD str1;该字单元存放str1的地址数据定义伪指令4(4)DCQ/DCQU格式:标号 DCQ/DCQU 表达式说明:DCQ用于分配一块以8个字节为单位的存储区域并用伪指令中指
14、定的表达式初始化,它定义的存储空间是字对齐的。DCQU功能与DCQ类似,只是分配的存储单元不严格字对齐。例如:Arrayd1 DCQ 234234,98765541;构造固定数组并分配字为单元的存储空间。;注意:DCQ不能给字符串分配空间数据定义伪指令5(5)DCFD/DCFDU格式:标号 DCFD/DCFDU 表达式说明:DCFD用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化,它定义的存储空间是字对齐的。每个双精度的浮点数占据两个字单元。DCFDU功能与DCFD类似,只是分配的存储单元不严格字对齐。例如:Arrayf1 DCFD 6E2Arrayf2 DCFD 1
15、.23,1.45数据定义伪指令6(6)DCFS/DCFSU格式:标号 DCFS/DCFSU 表达式说明:DCFS用于为单精度的浮点数分配一片连续的字存储单元并用表达式初始化,它定义的存储空间是字对齐的。每个单精度浮点数使用一个字单元。DCFSU功能与DCFS类似,只是分配的存储单元不严格字对齐。例如:Arrayf1 DCFS 6E2 ,-9E-2,-.3Arrayf2 DCFSU 1.23,6.8E9数据定义伪指令77)SPACE格式:标号 SPACE 表达式说明:SPACE用于分配一片连续的存储区域并初始化为0,表达式为要分配的字节数。SPACE也可用“%”代替。例如:freespace S
16、PACE 1000;分配1000字节的存储空间数据定义伪指令8(8)MAP格式:MAP 表达式 ,基址寄存器说明:MAP定义一个结构化的内存表的首地址。此时,内存表的位置计数器VAR(汇编器的内置变量)设置成该地址值。“”可以用来代替MAP。表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。MAP可以与FIELD伪操作配合使用来定义结构化的内存表。例如:MAP 0x130,R2 ;内存表首地址为0x130R2数据定义伪指令9(9)FIELD格式: 标号 FIELD 字节数
17、说明:FIELD用于定义一个结构化内存表中的数据域。“#”可用来代替FIELD。FIELD常与MAP配合使用来定义结构化的内存表:FIELD伪指令定义内存表中的各个数据域,MAP则定义内存表的首地址,并为每个数据域指定一个标号以供其他的指令引用。需要注意的是MAP和FIELD伪指令仅用于定义数据结构,并不分配存储单元。例如:MAP 0xF10000;定义结构化内存表首地址为0xF10000count FIELD 4;定义count的长度为4字节,位置为0xF1000+0x FIELD 4;定义x的长度为4字节,位置为0xF1004y FIELD 4;定义y的长度为4字节,位置为0xF1008汇
18、编控制伪指令作用:指引汇编程序的执行流程。常用的伪操作包括:(1)MACRO和MEND:宏定义的开始与结束。(2)IF、ELSE和ENDIF:根据逻辑表达式的成立与否决定是否在编译时加入某个指令序列。(3)WHILE和WEND:根据逻辑表达式的成立与否决定是否循环执行这个代码段。(4)MEXIT:从宏中退出。MACRO和MEND格式MACRO$标号 宏名 $参数1,$参数2,指令序列MEND其中,$标号在宏指令被展开时,标号可被替换成相应的符号(在一个符号前使用$,表示程序在汇编时将使用相应的值来替代$后的符号), $参数1为宏指令的参数,当宏指令被展开时将被替换成相应的值,类似于函数中的形式
19、参数。宏指令可以重复使用,与子程序有些类似,子程序可以节省存储空间,提供模块化的程序设计。但是使用子程序结构时需要保存/恢复现场,从而增加了系统的开销。使用说明:在子程序比较短而需要传递的参数比较多的情况下,可使用宏汇编技术。宏定义伪指令例子MACRO ;宏定义开始$label jump $a1,$a2 ;宏的名称为jump,有2个参数a1和a2$label.loop1 ; $label.loop1 为宏体的内部标号BGE $label.loop1$label.loop2BL $a1 ;参数$a1为一个子程序的名称BGT $label.loop2ADR $a2MEND ;宏定义结束宏定义伪指令
20、在程序中调用该宏exam jump sub,det ;调用宏jump,宏的标号为exam, 参数1为sub,参数2为det程序被汇编后,宏的展开结果:examloop1BGE examloop1examloop2BL subBGT examloop2ADR detIF、ELSE和ENDIF格式:IF 逻辑表达式代码段1ELSE代码段2ENDIF说明:能根据逻辑表达式的成立与否决定是否在编译时加入某个指令序列。 IF、ELSE和ENDIF分别可以用“”,“|”,“”代替。如果IF后面的逻辑表达式为真,则编译代码段1,否则编译代码段2。ELSE及代码段2也可以没有,这时,当IF后面的逻辑表达式为真
21、时,则代码段1,否则继续编译后面的指令。WHILE和WEND格式:WHILE 逻辑表达式代码段WEND说明: WHILE和WEND伪指令能根据逻辑表达式的成立与否决定是否循环执行这个代码段。当WHILE后面的逻辑表达式为真时,则执行代码段,该代码段执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。例如:GBLA num ;声明全局的数字变量numnum SETA 9 ;由num控制循环次数WHILE num0sub r0,r0,1add r1,r1,1WEND其他伪指令在汇编程序中经常会使用一些其他的伪指令,包括以下18条:ASSERT AREAALIGN CODE
22、16/CODE32ENTRY ENDEQU IMPORTEXPORT/GLOBAL EXTERNINCBIN GET/INCLUDERN ROUTADR ADRLLDR NOP其他伪指令1(1)ASSERT格式:ASSERT 逻辑表达式说明:ASSERT用来表示程序的编译必须满足一定的条件,如果逻辑表达式不满足,则编译器会报错,并终止汇编。例如:ASSERT ver7 ;保证ver7其他伪指令22)AREA格式: AREA 段名 属性,说明:AREA用于定义一个代码段、数据段或者特定属性的段。如果段名以数字开头,那么该段名需用“|”字符括起来,如|7wolf|,用C的编译器产生的代码一般也用“
23、|”括 起来。属性部分表示该代码段/数据段的相关属性,多个属性可以用“,”分隔。常见属性如下: DATA:定义数据段,默认属性是READWRITE。 CODE:定义代码段,默认属性是READONLY 。 READONLY:表示本段为只读。 READWRITE:表示本段可读写。 ALIGN=表达式,表示段的对齐方式为2的表达式次方,例如:表达式=3,则对齐方式为8字节对齐。表达式的取值范围为031。 COMMON属性:定义一个通用段,这个段不包含用户代码和数据。其他伪指令3(3)ALIGN格式:ALIGN 表达式,偏移量说明:ALIGN伪操作可以通过填充字节使当前的位置满足一定的对齐方式。表达式
24、的值为2的幂,如1、2、4、8、16等,用于指定对齐方式。如果伪操作中没有指定表达式,则编译器会将当前位置对齐到下一个字的位置。偏移量也是个数字表达式,如果存在偏移量,则当前位置自动对齐到2的表达式值次方偏移量。例如:AREA |.data|,DATA,READWRITE,ALIGN=2其他伪指令4(4)CODE16/CODE32格式: CODE16/CODE32说明:CODE16伪操作指示编译器后面的代码为16位的Thumb指令。CODE32伪操作指示编译器后面的代码为32位的ARM指令。如果在汇编源代码中同时包含Thumb和ARM指令时,可以用“CODE32”通知编译器后的指令序列为32位
25、的ARM指令,用“CODE16”伪指令通知编译器后的指令序列为16位的Thumb指令。CODE16/CODE32不能对处理器进行状态的切换。例如:CODE32 ; 32位的ARM指令AREA |.text|,CODE,READONLYLDR R0,0x8500;BX R0 ;程序跳转,并将处理器切换到Thumb状态CODE16 ;16位的Thumb指令ADD R3,R3,1END ;源文件结束其他伪指令5-1(5)ENTRY格式:ENTRY说明:ENTRY用于指定汇编程序的入口。在一个完整的汇编程序中至少要有一个ENTRY,程序中也可以有多个,此时,程序的真正入口点可在链接时指定,但在一个源文
26、件里最多只能有一个ENTRY或者没有ENTRY。其他伪指令5-2其他伪指令6(6)END格式:END说明:END告诉编译器已经到了源程序的结尾。例如:AREA constdata,DATA,READONLYEND ;结尾其他伪指令7(7)EQU格式: 名称 EQU 表达式 ,类型说明:EQU用于将程序中的数字常量、标号、基于寄存器的值赋予一个等效的名称,这一点类似于C语言中的define.可用“*”代替EQU。如果表达式为32位的常量,我们可以指定表达式的数据类型,类型域可以有以下3种:CODE16/CODE32/DATA例如:num1 EQU 1234 ;定义num1为1234addr5 E
27、QU str1+0x50d1 EQU 0x2400,CODE32 ;定义d1的为0x2400,且该处为32位的ARM指令其他伪指令8(8)EXPORT/GLOBAL格式:EXPORT/GLOBAL 标号 ,WEAK说明:EXPORT在程序中声明一个全局标号,其他文件中的代码可以被该标号引用。用户也可以用GLOBAL代替EXPORT。,WEAK可选项声明其他文件有同名的标号,则该同名标号优先于该标号被引用。例如:AREA |.text|,CODE,READONLYmain PROCENDPEXPORT main ;声明一个可全局引用的函数mainEND其他伪指令9(9)IMPORT格式:IMPO
28、RT 标号 ,WEAK说明:告诉编译器,这个标号要在当前源文件中使用,但标号是在其他的源文件中定义的。,WEAK:如果所有的源文件都没有找到这个标号的定义,编译器也不会提示错误信息,同时编译器也不会到当前没有被INCLUDE进来的库中去查找该符号。例如:AREA mycode,CODE,READONLYIMPORT _ printf;通知编译器当前文件要引用函数_ printfENDIMPORT使用说明使用IMPORT为操作声明一个符号是在其他源文件中定义的。如果链接器在链接处理时不能解析该符号,而且IMPORT为操作中没有指定WEAK选项,则链接器将会报告错误。如果链接器在链接处理时不能解析
29、该符号,而IMPORT伪操作中指定了WEAK选项,则链接器不会报告错误,而是进行下面的操作:如果该符号被B或BL指令引用,则该符号被设置成下一条指令的地址,该B或者BL指令相当于一条NOP指令。例如“B sign ”,“sign”不能被解析,则该指令被忽略为NOP指令,继续执行下面的指令,也就是将sign理解为下一条指令的地址。其他情况下该符号被设置为0。其他伪指令1010)EXTERN格式:EXTERN 标号 ,WEAK说明:告诉编译器,标号要在当前源文件中引用,但是该标号是在其他的源文件中定义的。与IMPORT不同的是,如果当前源文件实际上没有引用该标号,该标号就不会被加入到当前文件的符号
30、表中。,WEAK:即使所有的源文件都没有找到这个标号的定义,编译器也不给出错误信息。例如:AREA |.text|,CODE,READONLYEXTERN _ printf,WEAK ;告诉编译器当前文件要引用标号,如果找不到,则不提示错误END其他伪指令11(11)GET/INCLUDE格式: GET 文件名说明:GET将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置展开进行汇编处理。INCLUDE和GET的作用是等效的。使用方法:在某源文件中定义一些宏指令,用MAP和FIELD定义结构化的数据类型,用EQU定义常量的符号名称,然后用GET/INCLUDE将这个源文件包含到其他
31、的源文件中。使用方法与C语言中的“#include”相似。GET/INCLUDE只能用于包含源文件,包含其他文件则需要使用INCBIN伪指令。例如:AREA mycode,DATA,READONLYGET E:codeprog1.s ;通知编译器在当前源文件包含源文件E:code prog1.sGET prog2.s ;通知编译器当前源文件包含可搜索目录下的prog2.sEND其他伪指令12(12)INCBIN格式:INCBIN 文件名说明:INCBIN将一个数据文件或者目标文件包含到当前的源文件中,编译时被包含的文件不作任何变动地存放在当前文件中,编译器从后面开始继续处理。例如:AREA constdata,DATA,READONLYINCBIN data1.dat ;源文件包含文件data1.datINCBIN E:DATAdata2.bin;源文件包含文件E:
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1