明辉站/技术开发/内容

高级语言反汇编程序的函数调用过程

技术开发2023-07-16 阅读
[摘要]Jim Chan摘要:本文说明高级语言编译成汇编语言后,高级语言中函数调用的汇编程序过程。正文:高级语言编译成汇编程序以后,在高级语言中的函数调用的汇编程序过程如下:1.将函数参数入栈,第一个参数在栈顶,最后一个参数在栈底。2.执行CALL指令,调用该函数,进入该函数代码空间。a.执行CALL指令...
Jim Chan

摘要:本文说明高级语言编译成汇编语言后,高级语言中函数调用的汇编程序过程。

正文:高级语言编译成汇编程序以后,在高级语言中的函数调用的汇编程序过程如下:

1.将函数参数入栈,第一个参数在栈顶,最后一个参数在栈底。

2.执行CALL指令,调用该函数,进入该函数代码空间。
a.执行CALL指令,将CALL指令下一行代码的地址入栈。
b.进入函数代码空间后,将基址指针EBP入栈,然后让基址指针EBP指向当前堆栈栈顶,并使用它访问存在堆栈中的函数输入参数及堆栈中的其他数据。
c.堆栈指针ESP减少一个值,如44H,向上移动一个距离,留出一个空间给该函数作为临时存储区。
{
   // 以上准备工作做好后,函数正式被执行,如下所示。
   d.将其他指针或寄存器中的值入栈,以便在函数中使用这些寄存器。
   e.执行代码。
   f.执行return()返回执行结果,将要返回的值存入EAX中。
   g.步骤2.d中的指针出栈。
}
h.将EBP的值传给堆栈指针ESP,使ESP复原为2.c之前的值。此时进入函数时EBP的值在栈顶。
i.基址指针EBP出栈,复原为2.b之前的EBP的值。
j.执行RET指令,“调用函数”的地址出栈,本函数返回到CALL指令的下一行。

3.函数返回到CALL指令下一行,将堆栈指针加一个数值,以使堆栈指针恢复到以上步骤1执行之前的值。该数值是上面第一步入栈参数的总长度。

注意:
1.堆栈指针ESP指向栈顶的新入栈数据的最低位。
2.MOV指令中偏移指针指向被“MOV”的数据的最低位。如下面指令是将ebp+8到ebp+11四个字节的内容传到eax寄存器中。
00402048   mov         eax,dword ptr [ebp+8]

一个例子如下:

高级语言代码中的函数调用如下:

117:      bR = t1(p);

汇编代码如下:

00401FB8   mov         ecx,dword ptr [ebp-8]   ;将参数放入ecx寄存器
00401FBB   push        ecx                     ;参数入栈
00401FBC   call        @ILT+10(t1) (0040100f)  ;函数调用,下一行地址00401FC1入栈
00401FC1   add         esp,4                   ;函数返回,堆栈指针加4,复原为00401FB8时的值
00401FC4   mov         dword ptr [ebp-10h],eax ;从eax中取出高级语言中的函数返回值,放入bR变量中

其中t1函数如下:

125:  BOOL t1(void* p)
126:  {
00402030   push        ebp                    ;ebp入栈
00402031   mov         ebp,esp                ;ebp指向此时堆栈的栈顶
00402033   sub         esp,44h                ;esp减少一个值,空出一段存储区
00402036   push        ebx                    ;将三个寄存器的值入栈,以便在函数中使用它
00402037   push        esi                    ;
00402038   push        edi                    ;
00402039   lea         edi,[ebp-44h]          ;
0040203C   mov         ecx,11h                ;
00402041   mov         eax,0CCCCCCCCh         ;
00402046   rep stos    dword ptr [edi]        ;
127:      int* q = (int*)p;                   ;
00402048   mov         eax,dword ptr [ebp+8]  ;ebp+8指向函数输入参数的最低位地址;
;如果是ebp+4则指向函数返回地址00401FC1的最低位,值为C1
0040204B   mov         dword ptr [ebp-4],eax  ;
128:      return 0;                           ;
0040204E   xor         eax,eax                ;返回值放入eax寄存器中
129:  }
00402050   pop         edi                    ;三个寄存器出栈
00402051   pop         esi                    ;
00402052   pop         ebx                    ;
00402053   mov         esp,ebp                ;esp复原
00402055   pop         ebp                    ;ebp出栈,它的值也复原了
00402056   ret                                ;返回到此时栈顶存储的代码地址:00401FC1
;故而如果不幸被修改了返回地址,程序就会出现意外

以上汇编代码由VC++6.0编译得到。

堆栈在EBP入栈后的情况:

       低位          高位
        ↓            ↓
内存地址      堆栈
        ┆            ┆
0012F600├──────┤← edi = 0012F600
        │            │
0012F604├─┄┄┄┄─┤
        │            │
        │            │
        ┆ 44h的空间  ┆
        ┆            ┆
        │            │
        │            │
0012F640├─┄┄┄┄─┤
        │            │
0012F644├──────┤← ebp被赋值后指向该单元,此时ebp=0012F644
        │AC F6 12 00 │ebp赋值为esp之前的值
0012F648├──────┤
        │C1 1F 40 00 │返回地址
0012F64C├──────┤← ebp + 8
        │A0 F6 12 00 │函数实参p的值
0012F650├──────┤
        │            │
        ├──────┤
        ┆            ┆

注:存储器存储空间堆栈按从高到低的排列,左边标注的地址是其右下方存储单元的最低位地址。如0012F644指向0012F6AC的AC字节,AC在栈顶。图中存储器中的内容按从低到高位书写,“AC F6 12 00”= 0x0012F6AC

……

相关阅读