回 帖 发 新 帖 刷新版面

主题:汇编语言的准备知识(2)

汇编语言的准备知识--给初次接触汇编者(2)

汇编指令的操作数可以是内存中的数据, 如何让程序从内存中正确取得所需要的数据就是对内存的寻址.

INTEL 的CPU 可以工作在两种寻址模式:实模式和保护模式. 前者已经过时,就不讲了, WINDOWS 现在是32位保护模式的系统, PE 文件就基本是运行在一个32位线性地址空间, 所以这里就只介绍32位线性空间的寻址方式.

其实线性地址的概念是很直观的, 就想象一系列字节排成一长队,第一个字节编号为0, 第二个编号位1, .... 一直到4294967295(十六进制FFFFFFFF,这是32位二进制数所能表达的最大值了). 这已经有4GB的容量! 足够容纳一个程序所有的代码和数据. 当然, 这并不表示你的机器有那么多内存. 物理内存的管理和分配是很复杂的内容, 初学者不必在意, 总之, 从程序本身的角度看, 就好象是在那么大的内存中.

在INTEL系统中, 内存地址总是由"段选择符:有效地址"的方式给出.段选择符(SELECTOR)存放在某一个段寄存器中, 有效地址则可由不同的方式给出. 段选择符通过检索段描述符确定段的起始地址, 长度(又称段限制), 粒度, 存取权限, 访问性质等. 先不用深究这些, 只要知道段选择符可以确定段的性质就行了. 一旦由选择符确定了段, 有效地址相对于段的基地址开始算. 比如由选择符1A7选择的数据段, 其基地址是400000, 把1A7 装入DS中, 就确定使用该数据段. DS:0 就指向线性地址400000. DS:1F5278 就指向线性地址5E5278. 我们在一般情况下, 看不到也不需要看到段的起始地址, 只需要关心在该段中的有效地址就行了. 在32位系统中, 有效地址也是由32位数字表示, 就是说, 只要有一个段就足以涵盖4GB线性地址空间, 为什么还要有不同的段选择符呢? 正如前面所说的, 这是为了对数据进行不同性质的访问. 非法的访问将产生异常中断, 而这正是保护模式的核心内容, 是构造优先级和多任务系统的基础. 这里有涉及到很多深层的东西, 初学者先可不必理会.

有效地址的计算方式是: 基址+间址*比例因子+偏移量. 这些量都是指段内的相对于段起始地址的量度, 和段的起始地址没有关系. 比如, 基址=100000, 间址=400, 比例因子=4, 偏移量=20000, 则有效地址为:

100000+400*4+20000=100000+1000+20000=121000. 对应的线性地址是400000+121000=521000. (注意, 都是十六进制数).

基址可以放在任何32位通用寄存器中, 间址也可以放在除ESP外的任何一个通用寄存器中. 比例因子可以是1, 2, 4 或8. 偏移量是立即数. 如: [EBP+EDX*8+200]就是一个有效的有效地址表达式. 当然, 多数情况下用不着这么复杂, 间址,比例因子和偏移量不一定要出现.

内存的基本单位是字节(BYTE). 每个字节是8个二进制位, 所以每个字节能表示的最大的数是11111111, 即十进制的255. 一般来说, 用十六进制比较方便, 因为每4个二进制位刚好等于1个十六进制位, 11111111b = 0xFF. 内存中的字节是连续存放的, 两个字节构成一个字(WORD), 两个字构成一个双字(DWORD). 在INTEL架构中, 采用small endian格式, 即在内存中,高位字节在低位字节后面. 举例说明:十六进制数803E7D0C, 每两位是一个字节, 在内存中的形式是: 0C 7D 3E 80. 在32位寄存器中则是正常形式,如在EAX就是803E7D0C. 当我们的形式地址指向这个数的时候,实际上是指向第一个字节,即0C. 我们可以指定访问长度是字节, 字或者双字. 假设DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX]指向第一个字节0C:

mov AL, byte ptr DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX] ;把字节0C存入AL
mov AX, word ptr DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX] ;把字7D0C存入AX
mov EAX, dword ptr DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX] ;把双字803E7D0C存入EAX

在段的属性中,有一个就是缺省访问宽度.如果缺省访问宽度为双字(在32位系统中经常如此),那么要进行字节或字的访问,就必须用byte/word ptr显式地指明.

缺省段选择:如果指令中只有作为段内偏移的有效地址,而没有指明在哪一个段里的时候,有如下规则:

如果用ebp和esp作为基址或间址,则认为是在SS确定的段中;
其他情况,都认为是在DS确定的段中。

如果想打破这个规则,就必须使用段超越前缀。举例如下:

mov eax, dword ptr [edx] ;缺省使用DS,把DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX]指向的双字送入eax
mov ebx, dword ptr ES[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX] ;使用ES:段超越前缀,把ES[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]EDX]指向的双字送入ebx

堆栈:

堆栈是一种数据结构,严格地应该叫做“栈”。“堆”是另一种类似但不同的结构。SS 和 ESP 是INTEL对栈这种数据结构的硬件支持。push/pop指令是专门针对栈结构的特定操作。SS指定一个段为栈段,ESP则指出当前的栈顶。push xxx 指令作如下操作:

把ESP的值减去4;
把xxx存入SS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]ESP]指向的内存单元。

这样,esp的值减小了4,并且SS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]ESP]指向新压入的xxx. 所以栈是“倒着长”的,从高地址向低地址方向扩展。pop yyy 指令做相反的操作,把SS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]ESP]指向的双字送到yyy指定的寄存器或内存单元,然后把esp的值加上4。这时,认为该值已被弹出,不再在栈上了,因为它虽然还暂时存在在原来的栈顶位置,但下一个push操作就会把它覆盖。因此,在栈段中地址低于esp的内存单元中的数据均被认为是未定义的。

最后,有一个要注意的事实是,汇编语言是面向机器的,指令和机器码基本上是一一对应的,所以它们的实现取决于硬件.有些看似合理的指令实际上是不存在的,比如:

mov DS[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]edx], ds[IMG]http://www.netxeyes.org/image/bbs3000/angel_smile.gif[/IMG]ecx] ;内存单元之间不能直接传送
mov DS, 1A7 ;段寄存器不能直接由立即数赋值
mov EIP, 3D4E7 ;不能对指令指针直接操作.

回复列表 (共80个回复)

11 楼

我觉得汇编非常难学,现在刚学,非常慢,
C语言相对就要容易看懂得多,我不知道16位的CPU的汇编知识以后是否适合于64位的呢?
汇编是否还有用呢?

12 楼

介绍本好书:罗去彬的《32位汇编语言程序设计》,还有就是去下载MASM8。0,随带的帮助也算全面,只是全是英文。

13 楼

我刚开始学汇编语言的,有很多的地方学的模糊,以后还请大家指教!楼主说的很不错啊。我相信以后回有更好的内容!

14 楼

不错哦
哈哈
我也学到了一点知识

15 楼

楼主:
请问:DS:0 就指向线性地址400000. DS:1F5278 就指向线性地址5E5278.
好象在什么情况下ds要左移四位(二进制)在加上ip地址得到有效地址.
谢谢>

16 楼

我也来顶一 下啊

17 楼

[em18]汇编语言怎么学呀?谁能帮帮我呀?

18 楼

[em10][em10][em10]可以说明白一点吗?

19 楼

我们学的8086/8088好象和你讲的有点不同

20 楼

我觉得还是先学8086 和8088 的好,这些是16 位的, 是基础,好理解。到了486以上在原理上就差不多了,只是在寻址方式(有保护模式,386 也有)和寄存器上(32位)有些差别啦
不过我觉得汇编不仅用在PC上,它还广泛用于各种智能嵌入式系统上,而它们更多的是用16位或者更低的CPU ,对于计算机(PC)用得更多的是高级语言和各种应用软件,这些离硬件很远的软件把一些硬件技术给屏蔽了,所以我觉得对于PC汇编用得很少只不过学汇编对于了解PC 的工作原理是很有必要的。而对于工程上还是16或者更低的更实用,比如单片机,它在生产和生活中不处不在,它们也是用汇编编程来实现自动化,用的则是8位或者16 位为多。

我来回复

您尚未登录,请登录后再回复。点此登录或注册