1、汇编语言Emu8086使用指南十进制系统目前使用最多的是十进制十进制系统有个数字, 利用这些数字能表示任何数值,例如这些数字是由每一位数字乘以“基数”的幂累加而成的(上一个例子中基数是10 因为十进制中有十个数字)。位置对于每一个数字是很重要的。例如,你将上一个例子中的“7”放到结尾:547数值就成为:特别提醒:任何数字的0次幂都是1,0的0次幂也是1二进制计算机没有人类聪明(至少现在是这样),制造一个只有开关或者称为 0,1 两种状态的电子机器很容易。计算机使用二进制系统,只有两个数字 0, 1基地为2每一位二进制数称作一位(BIT),4 BIT 组成一个半字节(NIBBLE),8BIT组成
2、一个字节(BYTE),两个字节组成一个字(WORD),两个字组成一个双字(DOUBLE WORD)(很少使用):习惯上在一串二进制后面加上“b”,这样,我们可以知道101b是二进制表示十进制的5。二进制10100101b表示十进制的165,计算方法如下:十六进制系统十六进制系统使用16个数字0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F基底是 16. 十六进制非常紧凑,便于阅读。将二进制转换为十六进制很容易,半字节(4bits) 对应一位十六进制如下表Decimal(base 10)Binary(base 2)Hexadecimal(base 16
3、)000000100011200102300113401004501015601106701117810008910019101010A111011B121100C131101D141110E151111F习惯上我们在一个十六进制数的后面加上 H,以便和其他进制区别, 这样我们就知道 5Fh是一个十六进制数表示十进制的 95。习惯上,我们也在以字母开头(从到)的十六进制数前面 加上0例如: 0E120h. 十六进制 1234h 等于4660:十进制到另外进制的换算 在换算中,将十进制数不断除以目标进制的基底,每一次都要记录下商和余数,直到商。 余数用来表示结果。下面是一个十进制(基底是)到十六
4、进制(基底是)的换算:结果为27H上例中所有的余数都小于,不必使用字母。再举一个更复杂的例子:十进制 43868 换算为十六进制:结果是 0AB5Ch, 使用 上面提到的表 将大于的数字替换成字母。 运用同样的原理,我们可以换算为二进制(用作除数),或者是先换算成十六进制,再用上面的表换算成二进制:于是,得到二进制: 1010101101011100b 有符号数 对于十六进制数0FFh无法确定它是正数还是负数,因为它可以表示十进制的255 或者 - 1。位可以表示个状态,于是,我们可以假定前个表示正数(从0到127),接下来的个数(从128到256)表示负数 。如果想表示- 5,我们从中减去,
5、即 256 - 5 = 251。用这种复杂的方法表示一个负数有着数学依据的,数学上- 5 加上 5等于。当我们将两个位的数字5 和251相加时,结果超过,溢出处理为!128到256高位始终是,这个可以作为数字符号的标记 对于字(位),位有65536个状态,头个状态(从0到32767)用来表示正数,下面的个状态(从32767到65535) 表示负数Emu8086带有数制转换工具,也可以计算各种数值表达式。选择菜单 Math 项: Number Convertor (数制转换)可以实现任意数制之间的转换。在文本框中填写源数值,将自动转换到任意的数制。 可以作 8 位 或者 16 位转换。Expre
6、ssion Evaluator(表达式计算)可以用来计算不同数制的计算以及从一个进制到另一个进制的转换。输入表达式,按下回车,结果就会以你选定的进制表示。最长可以进行位的计算。当在Signed打钩选中时(除了八进制和双字),最前面的一位将被认作是符号位。这样以来,0FFFFFFFFh将被认为是十进制的。例如,你计算0FFFFh * 10h + 0FFFFh ( 8086 CPU所能访问的最大内存地址)。如果你选中Signed 和 Word选项,结果是-17(因为表达式被认为是(-1) * 16 + (-1) )。如果想按照无符号数计算,请不要选择Signed表达式为65535 * 16 + 6
7、5535计算结果将是1114095 同样你可以使用Number Convertor将非十进制换算为有符号的十进制,然后根据十进制计算。支持如下运算: not (inverts all bits).* multiply./ divide.% modulus.+ sum.- subtract (and unary -). shift right.& bitwise AND. bitwise XOR.| bitwise OR.二进制必须有“”作结尾,例如00011011b 十六进制必须有h作结尾,另外,当地一位是字母时,最前面必须加上,例如:0ABCDh八进制必须有o作结尾,例如:77o通用寄存器8
8、086CPU有8个通用寄存器,每一个寄存器都有自己的名称: AX 累加寄存器 accumulator register(分为 AH / AL). BX 基址寄存器 base address register (分为 BH / BL). CX 计数寄存器 count register(分为 CH / CL ). DX 数据寄存器 data register (分为 DH / DL). SI 源变址寄存器 source index register. DI 目的变址寄存器 destination index register. BP 基址指针寄存器 base pointer. SP 堆栈寄存器 s
9、tack pointer. 编程中,由程序员决定通用寄存器的具体用途。寄存器的主要目 的是保存数值(变量)。上面提到的寄存器是16位的,意思是:0011000000111001b (二进制),或者12345(十进制形式)。4个通用寄存器(AX, BX, CX, DX) 在使用时分为两个8位寄存器,例如 假设AX= 0011000000111001b,AH=00110000b AL=00111001b。当你修改其中任意8位值,整个16位寄存器的值同样改变。同样对于其他的3个寄存器,“H”表示高8位,“L”表示低8位。寄存器在CPU内部,访问中它们速度远远超过内存。因为,访问内存需要经过系统总线,
10、所以时间要长一些。而访问寄存器中的数据几乎不需要时间。于是,编程中,应当尽量在寄存器中保存数据。虽然寄存器很小,并且这些寄存器都有具体用途,但他们依然是存放计算中临时数据的好地方。段寄存器 CS 代码段寄存器,用来存放当前正在运行的指令 DS 数据段寄存器,用来存放当前运行程序所用的数据 ES 附加段寄存器,由程序员决定用途 SS 堆栈段寄存器,指出堆栈所在区域 尽管容许在段寄存器中存放任何数据,但是这决不是 一个好主意。段寄存器有着非常特别的目的指出可以访问内存块的地址。段寄存器与通用寄存器协同工作就可以访问任意的内存区域。例如,如果我们打算访问物理地址是12345h(十六进制)的内存单元,
11、我们应设置DS = 1230h SI = 0045h 这样以来,我们便能访问超过一个寄存器(16位)所能表示的内存地址的范围。CPU计算物理地址的方法是将段寄存器乘以10H在加上一个特定的通用寄存器。(1230h * 10h + 45h = 12345h):这种,由两个寄存器生成的地址被称为有效地址 (effective address)默认下,BX, SI 及 DI 与 DS协同工作,BP SP 与 SS 寄存器协同工作。其余的通用寄存器不能形成有效地址!同样,尽管BX可以形成有效地址,但是BH BL不能!控制寄存IP 指令指针寄存器 instruction pointer 、Flags R
12、egister 状态标志寄存器 IP 始终同CS 协同工作,指出当前执行的指令。 Flags Register 完成一次数学运算后,由CPU自动修改,通过它可以得到当前结果类型,也可以作为跳转语句条件。通常你无法直接访问它们。寻址方式 我们可以通过下面的四个寄存器来寻址 BX, SI, DI, BP.通过计算符号中的值,我们可以访问到不同内存单元的值。具体组合请看下表:BX + SIBX + DIBP + SIBP + DISIDId16 (variable offset only)BXBX + SI + d8BX + DI + d8BP + SI + d8BP + DI + d8SI + d
13、8DI + d8BP + d8BX + d8BX + SI + d16BX + DI + d16BP + SI + d16BP + DI + d16SI + d16DI + d16BP + d16BX + d16d8 - 表示位偏移量 d16 - 表示位偏移量偏移量可以是一个立即数或者是一个变量的偏移,或者二者兼备。这取决于编译器如何计算单独的立即数。偏移量可以在符号里面或者外面,这不影响编译器生成相同的机器码。偏移量是一个有符号数,可以是正数或者负数。一般说来,8位或者16位,对于编译后的结果是有影响的。例如,假定 DS = 100, BX = 30, SI = 70。如下寻址方式 BX +
14、 SI + 25 计算物理地址为100 * 16 + 30 + 70 + 25 = 1725默认下,DS 寄存器应用在除了BP寄存器之外的所有物理地址计算中,寄存器是和SS寄存器一起工作的。用过下面的表,你可以和轻松记住谁和谁是关联在一起使用的。上表中,你可以从每一列中选择一个或者忽略任意一个列。比如,可以看到,BX 和 BP始终不会选到一起。SI 和 DI不会选到一起。这是一个计算地址模式BX+5 段寄存器(CS, DS, SS, ES) 中数值被称作 段偏移 。目的寄存器(BX, SI, DI, BP) 中数值被称作偏移量 比如,ds中数值为1234h,si中数值为7890h,可以记作 1
15、234:7890物理地址为 1234h * 10h + 7890h = 19BD0h在编译过程中使用如下声明数据类型 BYTE PTR - 表示字节 ; WORD PTR - 表示字(2个字节)例如:BYTE PTR BX ;按字节访问 ; WORD PTR BX ;按字访问Emu8086 容许使用如下更简洁的前缀b. - 等价于上面的 BYTE PTR ; w. - 等价于上面的 WORD PTR有时,编译器可以自动计算出数据类型,但是如果一个参与运算的数是立即数,这种方法就不可靠了。MOV 指令 将第二个操作数(源)拷贝到第一个操作数(目的)指定位值 ,源操作数可以是立即数,通用寄存器或者
16、内存单元,目的寄存器可以是通用寄存器或者内存单元 ,源和目的必须是同样大小,要么都是字节要么都是字 操作类型如下:MOV REG, memoryMOV memory, REGMOV REG, REGMOV memory, immediateMOV REG, immediate REG: AX, BX, CX, DX, AH, AL, BL, BH, CH, CL, DH, DL, DI, SI, BP, SP.memory: BX, BX+SI+7,变量, 等等immediate: 5, -24, 3Fh, 10001101b, 等等.mov指令只支持如下段寄存器:MOV SREG, memo
17、ryMOV memory, SREGMOV REG, SREGMOV SREG, REGSREG: DS, ES, SS, 注意 CS 只能作操作源REG: AX, BX, CX, DX, AH, AL, BL, BH, CH, CL, DH, DL, DI, SI, BP, SP.memory: BX, BX+SI+7, variable, 等等MOV指令不能用来设置CS和IP寄存器的值。 下面是一个使用 MOV 指令的例子:#MAKE_COM# ; 表示,这个是一个com程序ORG 100h ;COM 程序必须的MOV AX, 0B800h ; 将ax设置为 B800h.MOV DS, A
18、X ; 将 AX 值拷贝到 DS.MOV CL, A ; 将ASCII 码 A的值传送到cl,这个值是 41h.MOV CH, 01011111b ; 将ch设置为二进制的01011111bMOV BX, 15Eh ; 将 BX 设置成 15Eh.MOV BX, CX ; 将 CX 放到 bx 指出的内存单元 B800:015ERET ; 返回操作系统你可以将上面的程序贴入Emu8086代码编辑器,接下来按下complie and emulate(或者按F5) 模拟窗口将显示这个程序已经调入,点击single step观察寄存器数值变化,你可以猜到;表示注释,编译器忽略在;后面的一切,程序结束
19、后,你可以看到如下窗口事实上,上面程序是将字符直接写入显示内存。通过上面的例子,你可以发现 MOV指令是非常有用的。变量变量是一个内存地址。对于编程者来说,使用诸如名称为“var1”这样的 变量保存数据远远比使用5a73:235b这样的地址容易的多。特别是当你使用10个以上的变量的时侯。编译器支持这两种变量 BYTE 和 WORD.(字节和字)声明变量的方法:name DB value 名称 DB 值name DW value 名称 DW 值DB - stays for Define Byte.DW - stays for Define Word.name 可以是任何字母与数字构成,但是必须由
20、字母开头。可以通过不命名来声明一个 没有名称的的变量(这个变量只有地址,没有名称)value - 可以是任何数值支持三种进制(十六进制,二进制和十进制),你可以使用?符号表示初始值没有确定。 你可能从第二章了解到, MOV 指令是将数值从源拷贝到目的。 让我们再看一个 MOV 指令的例子#MAKE_COM#ORG 100hMOV AL, var1MOV BX, var2RET ; stops the program.VAR1 DB 7var2 DW 1234h将上面的代码拷贝到emu8086源程序编辑器中,按下F5键编译 并在模拟器中执行。你会看到如下画面从画面可以看出,反编译后的代码同源程序
21、很相似,不同的是变量被具体的内存地址取代。当编译器生成机器代码它会自动将变量名称用该变量的便宜量代替。默认情况下,DS 寄存器存放段偏移(当执行com文件的时侯,DS 寄存器的值同 CS 寄存器(代码段)的值一样)。内存第一列是偏移(offset),第二列是一个十六进制值(hexadecimal value),第三列是十进制(decimal value),最后一列是 ASCII 字符。编译器是非大小写敏感的,所以 “VAR1” 同 “var1” 都是同一个变量。VAR1变量的偏移是0108h,物理地址是0b56:0108var2 变量的偏移是0109h,物理地址是 0b56:0109这个变量是
22、字,它占用2字节。这里假定低字节存放在低地址,所以34h位于12h前面。你可以看到,在RET指令后面还有一些指令,这样是因为反编译工具无法判断数据从什么地方开始。同样,你可以写出直接使用DB的程序.#MAKE_COM#ORG 100hDB 0A0hDB 08hDB 01hDB 8BhDB 1EhDB 09hDB 01hDB 0C3hDB 7DB 34hDB 12h将上面的代码拷贝到emu8086原代码编辑器,按下F5键编译,并在模拟器中运行,你可以看到同样的反汇编结果,得到同样的功能。根据上面,你可以猜测,编译器将源程序转化为一些字节的集合,这个集合被称作机器代码(machine code),
23、处理器懂得他们,并且执行它们。ORG 100是一个编译指令(它告诉编译器如何处理源代码)当你使用变量的时侯,这条指令特别重要。它通知编译器可执行程序将被调入偏移量是100h(256字节)的位置,有了它,编译器就可以计算出所有变量的正确地址,然后用这些地址(偏移量)来代替变量名称。上面的这些指令不会真正的编译为任何机器代码。为何可执行程序总是被装入偏移量100h?操作系统在CS寄存器(代码段)存储着程序信息,比如命令行方式下的参数等等。尽管上面只是一个COM文件的例子,EXE文件调入在偏移量0000的位置,他使用特定的段保存变量。我们在下面会学习到关于EXE文件的知识。数组数组可以看作是变量链。
24、一个字符串是一个字节数组的例子,其中每一个字符都当作一个ASCII码的值(0.255)下面是一些定义数组的例子 a DB 48h, 65h, 6Ch, 6Ch, 6Fh, 00hb DB Hello, 0 b是一个数组,当编译器发现引用了字符串值后,会自动将这些字符转化为对应的字节。下面图表表示的就是声明数组后在内存中的分布:你可以使用方括号做下标直接访问到数组中的值,例如:MOV AL, a3 同样,你还可以使用任意一个内存索引寄存器BX, SI, DI, BP,例如:MOV SI, 3MOV AL, aSI如果你想声明比较复杂的数组,你可以使用DUP指令 形式如下number DUP (
25、value(s) ) number - 重复的数量(任意常数)value - 将要复制的表达式例如:c DB 5 DUP(9) 就相当于如下定义:c DB 9, 9, 9, 9, 9 另外一个例子:d DB 5 DUP(1, 2) 等同于d DB 1, 2, 1, 2, 1, 2, 1, 2, 1, 2 当然,如果需要存放超过255或者小于128的数值,你还可以使用DW来代替 DB。但是DW不能用于声明字符串。DUP命令展开后不能超过1020个字符(上一个例子中展开之后是13个字符),如果需要声明请将它们分成两行(这样,内存中得到的仍然是一个大数组)。取得变量地址 LEA指令(Load Eff
26、ective Address 读取有效地址)或者OFFSET指令。OFFSET 和 LEA二者都能够获得变量的偏移量。LEA在使用中更有效,这是因为它能返回索引变量的地址。取得变量地址在很多情况下是非常有用的,例如你打算向一个过程传递参数。注意:在编译过程中使用如下声明数据类型 BYTE PTR - 表示字节 ;WORD PTR - 表示字(2个字节)例如:BYTE PTR BX ;按字节访问 ; WORD PTR BX ;按字访问Emu8086 容许使用如下更简洁的前缀b. - 等价于上面的 BYTE PTR ;w. - 等价于上面的 WORD PTR有时,编译器可以自动计算出数据类型,但是
27、如果一个参与运算的数是立即数,这种方法就不可靠了。第一个例子:ORG 100hMOV AL, VAR1 ; 将变量var1的数值放入al以便检查LEA BX, VAR1 ; 将var1的地址存入 BX.MOV BYTE PTR BX, 44h ; 修改变量var1的内容MOV AL, VAR1 ; 将变量VAR1的数值放入AL以便检查RETVAR1 DB 22hEND下面是另外一个例子,用OFFSET指令代替LEA:ORG 100hMOV AL, VAR1 ; 将变量VAR1的值放入AL以便检查.MOV BX, OFFSET VAR1 ; 将变量VAR1的地址放入 BX.MOV BYTE PT
28、R BX, 44h ; 修改变量VAR1内容MOV AL, VAR1 ;将变量VAR1的值放入 AL以便检查.RETVAR1 DB 22hEND上面例子的功能相同。这些语句:LEA BX, VAR1MOV BX, OFFSET VAR1 都将生成同样的机器代码: MOV BX, num,num 是16位变量偏移 请注意,只有这些寄存器可以放入方括号中(作为内存指针)BX, SI, DI, BP(请参考本教程前述章节)常量常量同变量很相似,但是它一直存在。定义一个变量之后,它的值 不会改变。使用EQU定义常量:name equ 例如:k EQU 5MOV AX, k 上面的例子等同于如下代码:M
29、OV AX, 5 在程序执行过程中你可以选择模拟器View菜单下的Variables你可以点一个变量然后设置Elements属性为数组大小来查看数组。汇编语言对于数据类型并不严格,这样以来所有的变量都可以被看 作是数组。变量可以显示为下列进制HEX - 十六进制 hexadecimal (基底 16).BIN - 二进制 (基底 2).OCT - 八进制 (基底 8).SIGNED - 有符号十进制 (基底 10).UNSIGNED - 无符号十进制 (基底 10).CHAR - ASCII 码 (一共有256个符号,其中一些符号是不可见的). 程序运行的时侯,你可以通过双击它来编辑变量值,或者选中之后点Edit按钮。 十六进制数值以h结尾,二进制以b 结尾,八进制以o 结尾,十进制没有结尾。字符串用这样的方式表示:hello world,0(结尾以0表示)数组按照如下输入:1, 2, 3, 4, 5(数组可以是一组字节或者字,这取决于你想以字节还是字的方式编辑)表达式会自动计算,例如,输入如下表达式5 + 2会自动计算为7。等等.中断 中断是一系列功能调用。这些功能调用使得编程更加容易。比如,
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1