汇编语言个人学习笔记——第九章 转移指令的原理
引言:
8086CPU的转移指令分为以下几类:
无条件转移指令(如:jmp)
条件转移指令
循环指令(如:loop)
过程
中断
9.1操作符offset
操作符offset在汇编语言中是由编译器处理的符号,它的功能是取得标号的偏移地址。
比如下面的程序:
assume cs:codesg
codesg segment
start :mov ax,offset start ;相当于mov ax,0
s:mov ax,offset s ;相当于mov ax,3
codesg ends
end start
问题9.1
有如下程序段,添写2条指令,使该程序在运行中将s处的一条指令复制到s0处。
assume cs:codesg
codesg segment
s:mov ax,bx ;(nop的机器码占一个字节)
mov si,offset s
mov di,offset s0
_____________
_____________
s0:nop ;(nop的机器码占一个字节)
nop
codesg ends
end s
问题9.1分析
(1)s和s0处的指令所在的内存单元的地址是多少?
cs:offset s和cs:offset s0。
(2)将s处的指令复制到s0处,就是将cs:offset s处的数据复制到cs:offset s0处;
(3)段地址已知在cs中,偏移地址offset s和offset s0已经送入si和di中;
(4)要复制的数据有多长?
mov ax,bx指令的长度为两个字节,即一个字。
完整程序如下:
assume cs:codesg
codesg segment
s:mov ax,bx
mov si,offset s
mov di,offset s0
mov ax,cs:[si]
mov cs:[di],ax
s0:nop
nop
codesg ends
end s
9.2jmp指令
jmp为无条件转移,可以只修改IP,也可以同时修改CS和IP;
jmp指令要给出两种信息:
转移的目的地址
转移的距离(段间转移、段内短转移,段内近转移)
9.3依据位移进行转移的jmp指令
jmp short 标号(转到标号处执行指令)
这种格式的jmp指令实现的是段内短转移,它对IP的修改范围为-128~127,也就是说,它向前转移时可以最多越过128个字节,向后转移可以最多越过127个字节。
比如:程序9.1
assume cs:codesg
codesg segment
start:mov ax,0
jmp short s
add ax,1
s:inc ax
codesg ends
end start
上面程序执行后,ax中的值为1,因为执行了jmp short s后,越过了add ax,1,IP指向了标号s处的inc ax。也就是说,程序只进行了一次ax加1操作。
汇编指令jmp short s对应了机器指令应该是什么样的?
先看一下别的汇编指令和其对应的机器指令
可以看到,在一般的汇编指令中,汇编指令中的idata(立即数),不论它是表示一个数据还是内存单元的偏移地址,都会在对应的机器指令中出现,因为CPU执行的是机器指令,它必须要处理这些数据或地址。
对照汇编源程序:
这里我为了让程序能正常结束加了mov ax,4c00h和int 21h。
我们可以看到,Debug将jmp short s中的s表示为inc ax指令的偏移地址8,并将jmp short s表示为jmp 0008,表示转移到cs:0008处。
但我们观察对应的机器码,却意外地发现了一些问题:
jmp 0008(Debug中的表示)或jmp short s(汇编语言中的表示)所对应的机器码为EB 03,注意,这个机器码中竟不包含转移的目的地址。
这意味着,CPU在执行EB 03的时候,并不知道转移目的地址。
那么,CPU根据什么进行转移呢?
我们修改下源程序:
现在转移指令变为jmp 000A,对应机器码变为EB 05,其中,add ax,ax占2个字节,add ax,1占3个字节,2+3刚好等于5,而之前没有add ax,ax的时候只有3个字节,转移指令是jmp 0008,对应的机器码为:EB 03。
这说明在机器指令中并不包含转移的目的地址,也就是说,CPU不需要这个目的地址就可以实现对IP的修改。
那么具体是如何修改的呢?
jmp short s指令的读取和执行过程:
(1)(CS)=0BBDH、(IP)=0006,CS:IP指向EB 03(jmp short s的机器码);
(2)读取指令码EB 03进入指令缓冲器;
(3)(IP)=(IP)+所读取指令的长度=(IP)+2=0008,CS:IPzhi'指向add ax,1;
(4)CPU执行指令缓冲器中的指令EB 03;
(5)指令EB 03执行后,(IP)=000BH,CS:IP指向inc ax。
在“jmp short 标号"指令所对应的机器码中,并不包含转移的目的地址,而包含的是转移的位移。这个位移是根据汇编指令中的”标号“计算出来的,具体计算方法如下:
实际上,指令”jmp short 标号的功能为(IP)=(IP)+8位位移。
(1)8位位移=“标号”处的地址-jmp指令后的第一个字节的地址;
(2)short指明此处的位移为8位位移;
(3)8位位移的范围为-128~127,用补码表示(补码规则以后再记)
(4)8位位移由编译程序在编译时算出。
还有一种和指令“jmp short 标号”功能相近的指令格式:
jmp near ptr 标号
它实现的是段内近转移。
指令“jmp near ptr 标号”的功能为:
(IP)=(IP)+16位位移。
“jmp near ptr 标号”指令说明:
(1)16位位移=”标号“处的地址-jmp指令后的第一个字节的地址;
(2)near ptr指明此处的位移为16位位移,进行的是段内近转移;
(3)16位位移的范围为-32769~32767,用补码表示;
(4)16位位移由编译程序在编译时算出。
9.4转移的目的地址在指令中的jmp指令
前面讲的jmp指令,其对应的机器码中并没有转移的目的地址,而是相对于当前IP的转移位移。
指令”jmp far ptr 标号“
实现的是段间转移,又称为远转移。
(CS)=标号所在段的段地址;
(IP)=biao标号所在段中的偏移地址。
far ptr指明了指令用标号的段地址和偏移地址修改CS和IP。
看下面程序:
assume cs:codesg
codesg segment
start :mov ax,0
mov bx,0
jmp far ptr s
db 256 dup (0)
s:add ax,1
inc ax
code ends
end start
我们在Debug中将程序9.3翻译成为机器码,看到的结果如图:
如图所示:
源程序中的db 256 dup (0),被Debug解释为相应的若干条汇编指令。我们还要注意jmp far ptr s所对应的机器码:EA 0B 01 BD 0B,其中包含转移的目的地址。
对于”jmp X 标号“格式的指令的深入分析以后再单独说。
9.5转移地址在寄存器中的jmp指令
指令格式:jmp 16位寄存器
功能:IP=(16位寄存器)
这种指令在前面也说过,不再详述。
9.6转移地址在内存中的jmp指令
转移地址在内存中的jmp指令有两种格式:
(1)jmp word ptr 内存单元地址(段内转移)
功能:从内存单元地址处开始存放着一个字,是转移的目的偏移地址。
内存单元地址可用寻址方式的任一格式给出。
示例:
mov ax,0123H mov ax,0123H
mov ds:[0],ax mov [bx],ax
jmp word ptr ds:[0] jmp word ptr [bx]
执行后,(IP)=0123H,相当于jmp ax
(2)jmp dword ptr 内存单元地址(段间转移)
功能:从内存单元地址处开始存放着两个字,高地址处的字是转移的目的段地址,低地址处是转移的目的偏移地址。
(CS)=(内存单元地址+2)
(IP)=(内存单元地址)
内存单元地址可用寻址方式的任一格式给出。
示例:
mov ax,0123H mov ax,0123H
mov ds:[0],ax mov [bx],ax
mov word ptr ds:[2],0 mov word ptr [bx+2],0
jmp dword ptr ds:[0] jmp dword ptr [bx]
执行后, 执行后,
(CS)=0 (CS)=0
(IP)=0123H (IP)=0123H
CS:IP指向0000:0123 CS:IP指向0000:0123。
9.7jcxz指令
jcxz指令为有条件转移指令,所有的有条件转移指令都是短指令,在对应的机器码中包含转移的位移,而不是目的地址。对IP的修改范围都为-128~127。
指令格式:jcxz 标号
(如果(cx)=0,则转移到标号处执行)
jcxz 标号 指令操作:
当(CX)=0时,(IP)=(IP)+8位位移
8位位移=”标号“处的地址-jcxz指令后的第一个字节的地址;
8位位移的范围为-128~127用补码表示;
8位位移由编译程序在编译时算出。
当(CX)≠0时,什么也不做(程序向下执行)。
我们从jcxz的功能中可以看出,指令“jcxz 标号”的功能相当于:
if((cx)==0)
jmp short 标号;
9.8loop指令
loop指令为循环指令,所有的循环指令都是短转移,在对应的机器码中包含转移的位移,而不是目的地址。
对IP的修改范围都为-128~127。
指令格式:loop 标号
(cx)=(cx)-1,如果(cx)≠0,转移到标号处执行。
loop 标号 指令操作:
(1)(cx)=(cx)-1;
(2)如果(cx)≠0,(IP)=(IP)+8位位移。
8位位移的范围为-128~127,用补码表示;
8位位移由编译程序在编译时算出。
当(cx)=0,什么也不做(程序向下执行)。
用C语言来描述就是
(cx)--;
if((cx)≠0)
jmp short 标号
9.9根据位移进行转移的意义
前面我们讲到:
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令,它们对IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的。在它们对应的机器码中不包含转移的目的地址,而包含的是到目的地址的位移距离。
这样设计,方便了程序段在内存中的浮动装配。
例如:
这段程序装在内存的不同位置都可正确执行,因为loop s在执行时只涉及到s的位移(-4,前移4个字节,补码表示为FCH)而不是s的地址。
如果loop s的机器码中包含的是s的地址,则就对程序段在内存中的偏移地址有了严格的限制;
因为机器码中包含的是s的地址,如果s处的指令不在目的地址处,程序的执行就会出错。
而loop s的机器码中包含的是转移的位移,就不存在这个问题了;
因为,无论s处的指令的实际地址是多少,loop指令的转移位移是不变的。
注意,根据位移进行转移的指令,它们的zhua转移范围受到转移位移的限制,如果在源程序在源程序中出现了转移范围超界的问题,在编译的时候,编译器将报错。
测试一下:
注意:
我们在学习第2章时说到的形如
“jmp 2000:0100"的转移指令,是在Debug中使用的汇编指令,汇编编译器并不认识。
如果在源程序中使用,编译时也会报错。