Emu8086使用指南.docx

资源描述

Emu8086使用指南.docx

《Emu8086使用指南.docx》由会员分享，可在线阅读，更多相关《Emu8086使用指南.docx（37页珍藏版）》请在冰豆网上搜索。

Emu8086使用指南.docx

Emu8086使用指南

如何运行？

１．在开始菜单选在它的图标,或者直接运行Emu8086．EXE

２．在＂FILE＂菜单中选择＂SAMPLE＂

３．点击＂CompileandEmulate＂按纽（或者按快捷键F５）

４．点击＂SingleStep＂按纽（或者按快捷键F８），可以查看代码如何运行．

十进制系统

目前使用最多的是十进制．十进制系统有１０个数字０，１,２，３，４，５,６，７，８,９利用这些数字能表示任何数值，例如７５４这些数字是由每一位数字乘以“基数”的幂累加而成的（上一个例子中基数是10因为十进制中有十个数字）。

位置对于每一个数字是很重要的。

例如，你将上一个例子中的“7”放到结尾:

547

数值就成为：

特别提醒：

任何数字的0次幂都是1，0的0次幂也是1

二进制

计算机没有人类聪明（至少现在是这样）,制造一个只有开关或者称为0,1两种状态的电子机器很容易。

计算机使用二进制系统,只有两个数字0，1基地为2每一位二进制数称作一位（BIT），4BIT组成一个半字节（NIBBLE），8BIT组成一个字节（BYTE），两个字节组成一个字（WORD），两个字组成一个双字（DOUBLEWORD）（很少使用）：

习惯上在一串二进制后面加上“b”，这样，我们可以知道101b是二进制表示十进制的5。

二进制10100101b表示十进制的165,计算方法如下：

十六进制系统

十六进制系统使用16个数字0,1，2，3，4,5,6,7,8，9,A，B,C,D，E，F基底是16。

十六进制非常紧凑，便于阅读。

将二进制转换为十六进制很容易,半字节（4bits）对应一位十六进制如下表

Decimal

（base10）

Binary

（base2）

Hexadecimal

（base16）

0000

0001

0010

0011

0100

0101

0110

0111

1000

1001

1010

1011

1100

1101

1110

1111

习惯上我们在一个十六进制数的后面加上"H”，以便和其他进制区别，这样我们就知道5Fh是一个十六进制数表示十进制的 95。

习惯上,我们也在以字母开头（从Ａ到Ｆ）的十六进制数前面加上”0"　例如：

0E120h.十六进制1234h 等于　4660：

十进制到另外进制的换算

在换算中,将十进制数不断除以目标进制的基底，每一次都要记录下商和余数，直到商０。

余数用来表示结果。

下面是一个十进制３９（基底是１０）到十六进制（基底是１６）的换算：

结果为　27H

上例中所有的余数都小于１０,不必使用字母。

再举一个更复杂的例子：

十进制43868换算为十六进制：

结果是0AB5Ch,使用上面提到的表将大于９的数字替换成字母。

运用同样的原理，我们可以换算为二进制（用２作除数），或者是先换算成十六进制,再用上面的表　换算成二进制：

于是，得到二进制:

1010101101011100b

有符号数

对于十六进制数　0FFh　无法确定它是正数还是负数，因为它可以表示十进制的"255”或者　”—1”。

８位可以表示２５６个状态，于是，我们可以假定前１２８个表示正数（从0到127），接下来的１２８个数（从128到256）表示负数.如果想表示"—5"，我们从２５６中减去５,即　256—5=251.用这种复杂的方法表示一个负数有着数学依据的,数学上”—5”加上”5"等于０.当我们将两个８位的数字　5和　251相加时,结果超过２５５,溢出处理为０!

128到256高位始终是１，这个可以作为数字符号的标记对于字（１６位），１６位有65536个状态，头３２７６８个状态（从0到32767）用来表示正数,下面的３２７６８个状态（从32767到65535）表示负数　

Emu8086　带有数制转换工具，也可以计算各种数值表达式.选择菜单Math项:

NumberConvertor（数制转换）可以实现任意数制之间的转换。

在文本框中填写源

数值,将自动转换到任意的数制。

可以作8位或者16位转换。

ExpressionEvaluator（表达式计算）可以用来计算不同数制的计算以及从一个进制到另一个进制的转换。

输入表达式，按下回车,结果就会以你选定的进制表示。

最长可以进行３２位的计算。

当在Signed打钩选中时（除了八进制和双字），最前面的一位将被认作是符号位.这样以来，0FFFFFFFFh　将被认为是十进制的　－１。

例如,你计算　0FFFFh＊10h+0FFFFh（8086CPU所能访问的最大内存地址）。

如果你选中Signed和Word　选项,结果是　-17　（因为表达式被认为是　（-1）*16+（—1））。

如果想按照无符号数计算,请不要选择　Signed　表达式为　65535*16+65535　计算结果将是1114095同样你可以使用NumberConvertor将非十进制换算为有符号的十进制,然后根据十进制计算。

支持如下运算:

～not　（invertsallbits）.

＊multiply。

/divide。

%modulus.

+sum.

-subtract（andunary—）。

<〈shiftleft.

〉>shiftright.

＆bitwiseAND。

^bitwiseXOR。

|bitwiseOR.

二进制必须有“ｂ”作结尾，例如00011011b十六进制必须有"h"作结尾，另外，当地一位是字母时，最前面必须加上０，例如：

0ABCDh八进制必须有”o”作结尾,例如：

77o

什么是汇编语言？

汇编语言是底层编程语言。

为了学习这门语言，你需要对于计算机结构有所了解。

计算机系统模型如下：

系统总线systembus（图中黄色部分）是将计算机各个部分连接到一起的部件.CPU是计算机的心脏，大部分的运算都是在CPU中完成的。

RAM是读取并且存放将要执行的程序的地方.

CPU内部

通用寄存器

8086CPU有8个通用寄存器，每一个寄存器都有自己的名称：

∙AX累加寄存器accumulatorregister（分为AH/AL）。

∙BX基址寄存器baseaddressregister（分为BH/BL）.

∙CX计数寄存器countregister（分为CH/CL）。

∙DX数据寄存器dataregister（分为DH/DL）.

∙SI源变址寄存器sourceindexregister。

∙DI目的变址寄存器destinationindexregister。

∙BP基址指针寄存器basepointer。

∙SP堆栈寄存器stackpointer。

编程中，由程序员决定通用寄存器的具体用途.寄存器的主要目的是保存数值（变量）。

上面提到的寄存器是16位的,意思是：

0011000000111001b（二进制），或者12345（十进制形式）。

4个通用寄存器（AX，BX，CX，DX）在使用时分为两个8位寄存器，例如假设AX=0011000000111001b，AH=00110000bAL=00111001b。

当你修改其中任意8位值，整个16位寄存器的值同样改变。

同样对于其他的3个寄存器,“H"表示高8位,“L”表示低8位。

寄存器在CPU内部,访问中它们速度远远超过内存.因为，访问内存需要经过系统总线，所以时间要长一些。

而访问寄存器中的数据几乎不需要时间。

于是,编程中，应当尽量在寄存器中保存数据。

虽然寄存器很小，并且这些寄存器都有具体用途,但他们依然是存放计算中临时数据的好地方.

段寄存器

∙CS代码段寄存器，用来存放当前正在运行的指令

∙DS数据段寄存器，用来存放当前运行程序所用的数据

∙ES附加段寄存器，由程序员决定用途

∙SS堆栈段寄存器，指出堆栈所在区域

尽管容许在段寄存器中存放任何数据,但是这决不是一个好主意。

段寄存器有着非常特别的目的－－指出可以访问内存块的地址。

段寄存器与通用寄存器协同工作就可以访问任意的内存区域。

例如，如果我们打算访问物理地址是12345h（十六进制）的内存单元,我们应设置DS=1230hSI=0045h这样以来，我们便能访问超过一个寄存器（16位）所能表示的内存地址的范围.CPU计算物理地址的方法是将段寄存器乘以10H在加上一个特定的通用寄存器。

（1230h*10h+45h=12345h）:

这种,由两个寄存器生成的地址被称为有效地址（effectiveaddress）

默认下，BX,SI及DI与DS协同工作，BPSP与SS寄存器协同工作.其余的通用寄存器不能形成有效地址！

同样，尽管BX可以形成有效地址,但是BHBL不能！

控制寄存IP指令指针寄存器instructionpointer、FlagsRegister状态标志寄存器

IP始终同CS协同工作，指出当前执行的指令。

FlagsRegister完成一次数学运算后，由CPU自动修改，通过它可以得到当前结果类型，也可以作为跳转语句条件。

通常你无法直接访问它们.

寻址方式

我们可以通过下面的四个寄存器来寻址BX，SI,DI，BP.　

通过计算［］符号中的值，我们可以访问到不同内存单元的值。

具体组合请看下表：

[BX+SI］

［BX+DI]

［BP+SI]

[BP+DI］

[SI]

［DI]

d16（variableoffsetonly）

[BX]

［BX+SI］+d8

［BX+DI］+d8

［BP+SI］+d8

［BP+DI］+d8

[SI]+d8

［DI]+d8

[BP]+d8

[BX］+d8

[BX+SI］+d16

[BX+DI]+d16

[BP+SI]+d16

[BP+DI]+d16

[SI］+d16

[DI]+d16

［BP］+d16

［BX］+d16

d8—表示８位偏移量d16-表示１６位偏移量

偏移量可以是一个立即数或者是一个变量的偏移，或者二者兼备.这取决于编译器如何计算单独的立即数。

偏移量可以在［］符号里面或者外面，这不影响编译器生成相同的机器码。

偏移量是一个有符号数，可以是正数或者负数。

一般说来,8位或者16位,对于编译后的结果是有影响的。

例如，假定DS=100,BX=30,SI=70。

如下寻址方式[BX+SI]+25计算物理地址为100*16+30+70+25=1725

默认下,DS寄存器应用在除了BP寄存器之外的所有物理地址计算中，寄存器是和SS寄存器一起工作的。

用过下面的表，你可以和轻松记住谁和谁是关联在一起使用的.

上表中,你可以从每一列中选择一个或者忽略任意一个列。

比如，可以看到，BX和BP始终不会选到一起。

SI和DI不会选到一起.这是一个计算地址模式［BX+5］段寄存器（CS,DS，SS,ES）中数值被称作"段偏移”.目的寄存器（BX，SI,DI，BP）中数值被称作”偏移量”

比如,ds中数值为1234h,si中数值为7890h，可以记作1234：

7890　物理地址为1234h＊10h+7890h=19BD0h在编译过程中使用如下声明数据类型

BYTEPTR—表示字节；WORDPTR—表示字（2个字节）

例如:

BYTEPTR[BX］;按字节访问;WORDPTR［BX］；按字访问

Emu8086容许使用如下更简洁的前缀

b。

—等价于上面的BYTEPTR;w。

-等价于上面的WORDPTR

有时，编译器可以自动计算出数据类型，但是如果一个参与运算的数是立即数，这种方法就不可靠了.

MOV指令

将第二个操作数（源）拷贝到第一个操作数（目的）指定位值,源操作数可以是立即数，通用寄存器或者内存单元，目的寄存器可以是通用寄存器或者内存单元,源和目的必须是同样大小，要么都是字节要么都是字

操作类型如下：

MOVREG,memory

MOVmemory，REG

MOVREG，REG

MOVmemory，immediate

MOVREG，immediate

REG:

AX，BX，CX,DX，AH，AL，BL，BH,CH，CL，DH，DL,DI,SI,BP，SP。

memory：

［BX],［BX+SI+7］，变量,等等

immediate：

5，-24，3Fh,10001101b,等等.

mov　指令只支持如下段寄存器:

MOVSREG，memory

MOVmemory，SREG

MOVREG，SREG

MOVSREG,REG

SREG:

DS，ES，SS,注意CS只能作操作源

REG:

AX,BX，CX，DX，AH,AL，BL，BH，CH,CL，DH，DL，DI，SI，BP,SP。

memory：

[BX］，[BX+SI+7］，variable，等等

MOV指令不能用来设置CS和IP寄存器的值。

下面是一个使用MOV指令的例子:

＃MAKE_COM＃　　；表示，这个是一个com程序

ORG100h 　　　　;COM程序必须的

MOVAX，0B800h 　　；将ax设置为B800h.

MOVDS,AX 　　　；将AX值拷贝到DS。

MOVCL，’A’ 　　　　；将ASCII码'A’的值传送到cl,这个值是41h。

MOVCH，01011111b　　；将ch设置为二进制的01011111b

MOVBX,15Eh 　　　；将BX设置成15Eh。

MOV［BX］，CX 　　；将CX放到bx指出的内存单元B800：

015E

RET 　　　　　　；返回操作系统

你可以将上面的程序贴入Emu8086代码编辑器，接下来按下［complieandemulate］　（或者按F5）模拟窗口将显示这个程序已经调入，点击［singlestep］观察寄存器数值变化,你可以猜到　”;”　表示注释,编译器忽略在"；”后面的一切，程序结束后,你可以看到如下窗口

事实上,上面程序是将字符直接写入显示内存.

通过上面的例子，你可以发现MOV　指令是非常有用的。

变量

变量是一个内存地址。

对于编程者来说,使用诸如名称为“var1"这样的变量保存数据远远比使用5a73：

235b这样的地址容易的多.特别是当你使用10个以上的变量的时侯。

编译器支持这两种变量BYTE和WORD。

（字节和字）

声明变量的方法：

nameDBvalue名称DB值

nameDWvalue名称DW值

DB-staysforDefineByte。

DW—staysforDefineWord。

name－可以是任何字母与数字构成,但是必须由字母开头.可以通过不命名来声明一个没有名称的的变量（这个变量只有地址,没有名称）

value—可以是任何数值支持三种进制（十六进制，二进制和十进制），你可以使用"？

”符号表示初始值没有确定。

你可能从第二章了解到,MOV指令是将数值从源拷贝到目的。

让我们再看一个MOV指令的例子

#MAKE_COM#

ORG100h

MOVAL，var1

MOVBX,var2

RET；stopstheprogram。

VAR1DB7

var2DW1234h

将上面的代码拷贝到emu8086源程序编辑器中，按下F5键编译并在模拟器中执行.你会看到如下画面

从画面可以看出，反编译后的代码同源程序很相似，不同的是变量被具体的内存地址取代.当编译器生成机器代码它会自动将变量名称用该变量的便宜量代替。

默认情况下，DS寄存器存放段偏移（当执行com文件的时侯，DS寄存器的值同CS寄存器（代码段）的值一样）.内存第一列是偏移（offset）,第二列是一个十六进制值（hexadecimalvalue），第三列是十进制（decimalvalue），最后一列是ASCII字符。

编译器是非大小写敏感的，所以“VAR1"同“var1”都是同一个变量.

VAR1变量的偏移是0108h，物理地址是0b56:

0108

var2变量的偏移是0109h，物理地址是0b56：

0109

这个变量是字，它占用2字节.这里假定低字节存放在低地址，所以34h位于12h前面.

你可以看到，在RET指令后面还有一些指令,这样是因为反编译工具无法判断数据从什么地方开始.同样，你可以写出直接使用DB的程序。

＃MAKE_COM＃

ORG100h

DB0A0h

DB08h

DB01h

DB8Bh

DB1Eh

DB09h

DB01h

DB0C3h

DB7

DB34h

DB12h

将上面的代码拷贝到emu8086原代码编辑器，按下F5键编译，并在模拟器中运行，你可以看到同样的反汇编结果,得到同样的功能.根据上面,你可以猜测，编译器将源程序转化为一些字节的集合，这个集合被称作机器代码（machinecode），处理器懂得他们,并且执行它们。

ORG100是一个编译指令（它告诉编译器如何处理源代码）当你使用变量的时侯,这条指令特别重要。

它通知编译器可执行程序将被调入偏移量是100h（256字节）的位置，有了它，编译器就可以计算出所有变量的正确地址，然后用这些地址（偏移量）来代替变量名称。

上面的这些指令不会真正的编译为任何机器代码。

为何可执行程序总是被装入偏移量100h?

操作系统在CS寄存器（代码段）存储着程序信息，比如命令行方式下的参数等等。

尽管上面只是一个COM文件的例子，EXE文件调入在偏移量0000的位置,他使用特定的段保存变量。

我们在下面会学习到关于EXE文件的知识.　

数组

数组可以看作是变量链。

一个字符串是一个字节数组的例子，其中每一个字符都当作一个ASCII码的值（0。

..。

255）下面是一些定义数组的例子

aDB48h，65h,6Ch,6Ch，6Fh，00h

bDB’Hello’，0

b是一个数组，当编译器发现引用了字符串值后，会自动将这些字符转化为对应的字节。

下面图表表示的就是声明数组后在内存中的分布：

你可以使用方括号做下标直接访问到数组中的值，例如:

MOVAL,a［3]同样，你还可以使用任意一个内存索引寄存器BX，SI，DI，BP，例如：

MOVSI，3

MOVAL,a［SI］

如果你想声明比较复杂的数组,你可以使用DUP指令形式如下numberDUP（value（s））

number—重复的数量（任意常数）

value—将要复制的表达式

例如:

cDB5DUP（9）就相当于如下定义：

cDB9，9，9，9,9另外一个例子：

dDB5DUP（1，2）等同于dDB1,2,1,2,1,2，1，2，1，2当然,如果需要存放超过255或者小于－128的数值，你还可以使用DW来代替DB。

但是DW不能用于声明字符串。

DUP命令展开后不能超过1020个字符（上一个例子中展开之后是13个字符）,如果需要声明请将它们分成两行（这样，内存中得到的仍然是一个大数组）。

取得变量地址LEA指令（LoadEffectiveAddress读取有效地址）或者OFFSET指令。

OFFSET和LEA二者都能够获得变量的偏移量.LEA在使用中更有效，这是因为它能返回索引变量的地址.取得变量地址在很多情况下是非常有用的，例如你打算向一个过程传递参数。

注意：

在编译过程中使用如下声明数据类型BYTEPTR—表示字节；WORDPTR-表示字（2个字节）

例如：

BYTEPTR［BX］;按字节访问；WORDPTR[BX］;按字访问

Emu8086容许使用如下更简洁的前缀

b。

-等价于上面的BYTEPTR;w。

—等价于上面的WORDPTR

有时,编译器可以自动计算出数据类型,但是如果一个参与运算的数是立即数，这种方法就不可靠了。

第一个例子:

ORG100h

MOVAL，VAR1；将变量var1的数值放入al以便检查

LEABX，VAR1；将var1的地址存入BX。

MOVBYTEPTR［BX],44h;修改变量var1的内容

MOVAL，VAR1；将变量VAR1的数值放入AL以便检查

RET

VAR1DB22h

END

下面是另外一个例子，用OFFSET指令代替LEA:

ORG100h

MOVAL，VAR1；将变量VAR1的值放入AL以便检查.

MOVBX，OFFSETVAR1；将变量VAR1的地址放入BX.

MOVBYTEPTR［BX］，44h；修改变量VAR1内容

MOVAL，VAR1；将变量VAR1的值放入AL以便检查.

RET

VAR1DB22h

END

上面例子的功能相同。

这些语句：

LEABX,VAR1

MOVBX，OFFSETVAR1

都将生成同样的机器代码：

MOVBX,num，num是16位变量偏移

请注意,只有这些寄存器可以放入方括号中（作为内存指针）BX,SI，DI，BP（请参考本教程前述章节）

常量

常量同变量很相似，但是它一直存在。

定义一个变量之后,它的值不会改变。

使用EQU定义常量:

nameequ<任意表达式>例如：

kEQU5

MOVAX,k

上面的例子等同于如下代码：

MOVAX,5

在程序执行过程中你可以选择模拟器”View”菜单下的”Variables"

你可以点一个变量然后设置Elements属性为数组大小来查看数组。

汇编语言对于数据类型并不严格，这样以来所有的变量都可以被看作是数组。

变量可以显示为下列进制

HEX—十六进制hexadecimal（基底16）.

BIN-二进制（基底2）。

OCT—八进制（基底8）。

SIGNED-有符号十进制（基底10）.

UNSIGNED-无符号十进制（基底10）。

CHAR—

展开阅读全文