>>shiftright.
&bitwiseAND.
^bitwiseXOR.
|bitwiseOR.
二进制必需有“b”作结尾,例如00011011b十六进制必需有"h"作结尾,另外,本地一名是字母时,最前面必需加上0,例如:
0ABCDh八进制必需有"o"作结尾,例如:
77o
什么是汇编语言?
汇编语言是底层编程语言。
为了学习这门语言,你需要关于运算机结构有所了解。
运算机系统模型如下:
系统总线systembus(图中黄色部份)是将运算机各个部份连接到一路的部件。
CPU是运算机的心脏,大部份的运算都是在CPU中完成的。
RAM是读取而且寄存将要执行的程序的地址。
CPU内部
通用寄放器8086CPU有8个通用寄放器,每一个寄放器都有自己的名称:
AX累加寄放器accumulatorregister(分为AH/AL).
BX基址寄放器baseaddressregister(分为BH/BL).
CX计数寄放器countregister(分为CH/CL).
DX数据寄放器dataregister(分为DH/DL).
SI源变址寄放器sourceindexregister.
DI目的变址寄放器destinationindexregister.
BP基址指针寄放器basepointer.
SP堆栈寄放器stackpointer.
编程中,由程序员决定通用寄放器的具体用途。
寄放器的要紧目的是保留数值(变量)。
上面提到的寄放器是16位的,意思是:
001b(二进制),或12345(十进制形式)。
4个通用寄放器(AX,BX,CX,DX)在利历时分为两个8位寄放器,例如假设AX=001b,AH=00110000bAL=00111001b。
当你修改其中任意8位值,整个16位寄放器的值一样改变。
一样关于其他的3个寄放器,“H”表示高8位,“L”表示低8位。
寄放器在CPU内部,访问中它们速度远远超过内存。
因为,访问内存需要通过系统总线,因现在刻要长一些。
而访问寄放器中的数据几乎不需要时刻。
于是,编程中,应当尽可能在寄放器中保留数据。
尽管寄放器很小,而且这些寄放器都有具体用途,但他们仍然是寄存计算中临时数据的好地址。
段寄放器
CS代码段寄放器,用来寄存当前正在运行的指令
DS数据段寄放器,用来寄存当前运行程序所用的数据
ES附加段寄放器,由程序员决定用途
SS堆栈段寄放器,指出堆栈所在区域
尽管允许在段寄放器中寄存任何数据,可是这决不是一个好主意。
段寄放器有着超级专门的目的--指出能够访问内存块的地址。
段寄放器与通用寄放器协同工作就能够够访问任意的内存区域。
例如,若是咱们打算访问物理地址是12345h(十六进制)的内存单元,咱们应设置DS=1230hSI=0045h如此以来,咱们便能访问超过一个寄放器(16位)所能表示的内存地址的范围。
CPU计算物理地址的方式是将段寄放器乘以10H在加上一个特定的通用寄放器。
(1230h*10h+45h=12345h):
这种,由两个寄放器生成的地址被称为有效地址(effectiveaddress)
默许下,BX,SI及DI与DS协同工作,BPSP与SS寄放器协同工作。
其余的通用寄放器不能形成有效地址!
一样,尽管BX能够形成有效地址,可是BHBL不能!
操纵寄放IP指令指针寄放器instructionpointer、FlagsRegister状态标志寄放器
IP始终同CS协同工作,指出当前执行的指令。
FlagsRegister完成一次数学运算后,由CPU自动修改,通过它能够取得当前结果类型,也能够作为跳转语句条件。
通常你无法直接访问它们。
寻址方式
咱们能够通过下面的四个寄放器来寻址BX,SI,DI,BP.
通过计算[]符号中的值,咱们能够访问到不同内存单元的值。
具体组合请看下表:
[BX+SI][BX+DI][BP+SI][BP+DI]
[SI][DI]d16(variableoffsetonly)[BX]
[BX+SI]+d8[BX+DI]+d8[BP+SI]+d8[BP+DI]+d8
[SI]+d8[DI]+d8[BP]+d8[BX]+d8
[BX+SI]+d16[BX+DI]+d16[BP+SI]+d16[BP+DI]+d16
[SI]+d16[DI]+d16[BP]+d16[BX]+d16
d8-表示8位偏移量d16-表示16位偏移量偏移量可以是一个立即数或者是一个变量的偏移,或者二者兼备。
这取决于编译器如何计算单独的立即数。
偏移量可以在[]符号里面或者外面,这不影响编译器生成相同的机器码。
偏移量是一个有符号数,可以是正数或者负数。
一般说来,8位或者16位,对于编译后的结果是有影响的。
例如,假定DS=100,BX=30,SI=70。
如下寻址方式[BX+SI]+25计算物理地址为100*16+30+70+25=1725默认下,DS寄存器应用在除了BP寄存器之外的所有物理地址计算中,寄存器是和SS寄存器一起工作的。
用过下面的表,你可以和轻松记住谁和谁是关联在一起使用的。
上表中,你能够从每一列当选择一个或忽略任意一个列。
比如,能够看到,BX和BP始终可不能选到一路。
SI和DI可不能选到一路。
这是一个计算地址模式[BX+5]段寄放器(CS,DS,SS,ES)中数值被称作"段偏移"。
目的寄放器(BX,SI,DI,BP)中数值被称作"偏移量"
比如,ds中数值为1234h,si中数值为7890h,能够记作1234:
7890 物理地址为1234h*10h+7890h=19BD0h在编译进程中利用如下声明数据类型
BYTEPTR-表示字节;WORDPTR-表示字(2个字节)例如:
BYTEPTR[BX];按字节访问;WORDPTR[BX];按字访问Emu8086允许利用如下更简练的前缀b.-等价于上面的BYTEPTR;w.-等价于上面的WORDPTR有时,编译器可以自动计算出数据类型,但是如果一个参与运算的数是立即数,这种方法就不可靠了。
MOV指令
将第二个操作数(源)拷贝到第一个操作数(目的)指定位值,源操作数能够是当即数,通用寄放器或内存单元,目的寄放器能够是通用寄放器或内存单元,源和目的必需是一样大小,要么都是字节要么都是字
操作类型如下:
MOVREG,memoryMOVmemory,REGMOVREG,REGMOVmemory,immediateMOVREG,immediate
REG:
AX,BX,CX,DX,AH,AL,BL,BH,CH,CL,DH,DL,DI,SI,BP,SP.memory:
[BX],[BX+SI+7],变量,等等immediate:
5,-24,3Fh,b,等等.
mov 指令只支持如下段寄存器:
MOVSREG,memoryMOVmemory,SREGMOVREG,SREGMOVSREG,REG
SREG:
DS,ES,SS,注意CS只能作操作源REG:
AX,BX,CX,DX,AH,AL,BL,BH,CH,CL,DH,DL,DI,SI,BP,SP.memory:
[BX],[BX+SI+7],variable,等等
MOV指令不能用来设置CS和IP寄放器的值。
下面是一个使用MOV指令的例子:
#MAKE_COM# ; 表示,这个是一个com程序ORG100h ;COM程序必须的MOVAX,0B800h ;将ax设置为B800h.MOVDS,AX ;将AX值拷贝到DS.MOVCL,'A' ;将ASCII码'A'的值传送到cl,这个值是41h.MOVCH,01011111b ;将ch设置为二进制的01011111bMOVBX,15Eh ; 将BX设置成15Eh.MOV[BX],CX ;将CX放到bx指出的内存单元B800:
015ERET ;返回操作系统
你能够将上面的程序贴入Emu8086代码编辑器,接下来按下[complieandemulate] (或按F5)模拟窗口将显示那个程序已经调入,点击[singlestep]观看寄放器数值转变,你能够猜到 ";" 表示注释,编译器忽略在";"后面的一切,程序终止后,你能够看到如下窗口
事实上,上面程序是将字符直接写入显示内存。
通过上面的例子,你能够发觉MOV 指令是超级有效的。
变量
变量是一个内存地址。
关于编程者来讲,利用诸如名称为“var1”如此的变量保留数据远远比利用5a73:
235b如此的地址容易的多。
专门是当你利用10个以上的变量的时侯。
编译器支持这两种变量BYTE和WORD.(字节和字)
声明变量的方法:
nameDBvalue名称DB值nameDWvalue名称DW值DB-staysforDefineByte.DW-staysforDefineWord.name-可以是任何字母与数字构成,但是必须由字母开头。
可以通过不命名来声明一个没有名称的的变量(这个变量只有地址,没有名称)
value-可以是任何数值支持三种进制(十六进制,二进制和十进制),你可以使用"?
"符号表示初始值没有确定。
你可能从第二章了解到,MOV指令是将数值从源拷贝到目的。
让咱们再看一个MOV指令的例子
#MAKE_COM#
ORG100h
MOVAL,var1
MOVBX,var2
RET;stopstheprogram.
VAR1DB7
var2DW1234h
将上面的代码拷贝到emu8086源程序编辑器中,按下F5键编译并在模拟器中执行。
你会看到如下画面
从画面能够看出,反编译后的代码同源程序很相似,不同的是变量被具体的内存地址取代。
当编译器生成机械代码它会自动将变量名称用该变量的廉价量代替。
默许情形下,DS寄放器寄存段偏移(当执行com文件的时侯,DS寄放器的值同CS寄放器(代码段)的值一样)。
内存第一列是偏移(offset),第二列是一个十六进制值(hexadecimalvalue),第三列是十进制(decimalvalue),最后一列是ASCII字符。
编译器是非大小写灵敏的,因此“VAR1”同“var1”都是同一个变量。
VAR1变量的偏移是0108h,物理地址是0b56:
0108var2变量的偏移是0109h,物理地址是0b56:
0109
那个变量是字,它占用2字节。
那个地址假定低字节寄存在低地址,因此34h位于12h前面。
你可以看到,在RET指令后面还有一些指令,这样是因为反编译工具无法判断数据从什么地方开始。
同样,你可以写出直接使用DB的程序.
#MAKE_COM#
ORG100h
DB0A0h
DB08h
DB01h
DB8Bh
DB1Eh
DB09h
DB01h
DB0C3h
DB7
DB34h
DB12h
将上面的代码拷贝到emu8086原代码编辑器,按下F5键编译,并在模拟器中运行,你能够看到一样的反汇编结果,取得一样的功能。
依照上面,你能够猜想,编译器将源程序转化为一些字节的集合,那个集合被称作机械代码(machinecode),处置器知道他们,而且执行它们。
ORG100是一个编译指令(它告知编译器如何处置源代码)当你利用变量的时侯,这条指令专门重要。
它通知编译器可执行程序将被调入偏移量是100h(256字节)的位置,有了它,编译器就能够够计算出所有变量的正确地址,然后用这些地址(偏移量)来代替变量名称。
上面的这些指令可不能真正的编译为任何机械代码。
为何可执行程序老是被装入偏移量100h?
操作系统在CS寄放器(代码段)存储着程序信息,比如命令行方式下的参数等等。
尽管上面只是一个COM文件的例子,EXE文件调入在偏移量0000的位置,他利用特定的段保留变量。
咱们在下面会学习到关于EXE文件的知识。
数组数组能够看做是变量链。
一个字符串是一个字节数组的例子,其中每一个字符都看成一个ASCII码的值(0....255)下面是一些概念数组的例子
aDB48h,65h,6Ch,6Ch,6Fh,00h
bDB'Hello',0b是一个数组,当编译器发觉引用了字符串值后,会自动将这些字符转化为对应的字节。
下面图表表示的确实是声明数组后在内存中的散布:
你能够利用方括号做下标直接访问到数组中的值,例如:
MOVAL,a[3]同样,你还可以使用任意一个内存索引寄存器BX,SI,DI,BP,例如:
MOVSI,3MOVAL,a[SI]若是你想声明比较复杂的数组,你能够利用DUP指令形式如下numberDUP(value(s))number-重复的数量(任意常数)
value-将要复制的表达式例如:
cDB5DUP(9)就相当于如下概念:
cDB9,9,9,9,9另外一个例子:
dDB5DUP(1,2)等同于dDB1,2,1,2,1,2,1,2,1,2固然,若是需要寄存超过255或小于-128的数值,你还能够利用DW来代替DB。
可是DW不能用于声明字符串。
DUP命令展开后不能超过1020个字符(上一个例子中展开以后是13个字符),若是需要声明请将它们分成两行(如此,内存中取得的仍然是一个大数组)。
取得变量地址LEA指令(LoadEffectiveAddress读取有效地址)或OFFSET指令。
OFFSET和LEA二者都能够取得变量的偏移量。
LEA在利用中更有效,这是因为它能返回索引变量的地址。
取得变量地址在很多情形下是超级有效的,例如你打算向一个进程传递参数。
注意:
在编译进程中利用如下声明数据类型BYTEPTR-表示字节;WORDPTR-表示字(2个字节)例如:
BYTEPTR[BX];按字节访问;WORDPTR[BX];按字访问Emu8086允许利用如下更简练的前缀
b.-等价于上面的BYTEPTR;w.-等价于上面的WORDPTR有时,编译器能够自动计算出数据类型,可是若是一个参与运算的数是当即数,这种方式就不靠得住了。
第一个例子:
ORG100h
MOVAL,VAR1;将变量var1的数值放入al以便检查
LEABX,VAR1;将var1的地址存入BX.
MOVBYTEPTR[BX],44h;修改变量var1的内容
MOVAL,VAR1;将变量VAR1的数值放入AL以便检查
RET
VAR1DB22h
END
下面是另外一个例子,用OFFSET指令代替LEA:
ORG100h
MOVAL,VAR1;将变量VAR1的值放入AL以便检查.
MOVBX,OFFSETVAR1;将变量VAR1的地址放入BX.
MOVBYTEPTR[BX],44h;修改变量VAR1内容
MOVAL,VAR1;将变量VAR1的值放入AL以便检查.
RET
VAR1DB22h
END
上面例子的功能相同。
这些语句:
LEABX,VAR1MOVBX,OFFSETVAR1都将生成同样的机器代码:
MOVBX,num,num是16位变量偏移
请注意,只有这些寄放器能够放入方括号中(作为内存指针)BX,SI,DI,BP(请参考本教程前述章节)常量常量同变量很相似,可是它一直存在。
概念一个变量以后,它的值可不能改变。
利用EQU概念常量:
nameequ<任意表达式>例如:
kEQU5MOVAX,k
上面的例子等同于如下代码:
MOVAX,5
在程序执行进程中你能够选择模拟器"View"菜单下的"Variables"
你能够点一个变量然后设置Elements属性为数组大小来查看数组。
汇编语言关于数据类型并非严格,如此以来所有的变量都能够被看作是数组。
变量能够显示为以下进制
HEX-十六进制hexadecimal(基底16).
BIN-二进制(基底2).
OCT-八进制(基底8).
SIGNED-有符号十进制(基底10).
UNSIGNED-无符号十进制(基底10).
CHAR-ASCII码(一共有256个符号,其中一些符号是不可见的).
程序运行的时侯,你能够通过双击它来编辑变量值,或选中以后点Edit按钮。
十六进制数值以"h"结尾,二进制以"b"结尾,八进制以"o"结尾,十进制没有结尾。
字符串用如此的方式表示:
'helloworld',0(结尾以0表示)
数组依照如下输入:
1,2,3,4,5
(数组能够是一组字节或字,这取决于你想以字节仍是字的方式编辑)表达式会自动计算,例如,输入如下表达式5+2会自动计算为7。
等等....
中断中断是一系列功能挪用。
这些功能挪用使得编程加倍容易。
比如,你想在打印机上输出一个字符,你只需要简单的挪用中断