草庐IT

c - 理解一个简单的 C 程序生成的汇编代码

coder 2023-06-16 原文

我试图通过使用 gdb 的反汇编器检查一个简单的 C 程序来理解它的汇编级代码。

以下是C代码:

#include <stdio.h>

void function(int a, int b, int c) {
   char buffer1[5];
   char buffer2[10];
}

void main() {
  function(1,2,3);
}

以下是 main 的反汇编代码和 function
gdb) disass main
Dump of assembler code for function main:
0x08048428 <main+0>:    push   %ebp
0x08048429 <main+1>:    mov    %esp,%ebp
0x0804842b <main+3>:    and    $0xfffffff0,%esp
0x0804842e <main+6>:    sub    $0x10,%esp
0x08048431 <main+9>:    movl   $0x3,0x8(%esp)
0x08048439 <main+17>:   movl   $0x2,0x4(%esp)
0x08048441 <main+25>:   movl   $0x1,(%esp)
0x08048448 <main+32>:   call   0x8048404 <function>
0x0804844d <main+37>:   leave  
0x0804844e <main+38>:   ret
End of assembler dump.

(gdb) disass function
Dump of assembler code for function function:
0x08048404 <function+0>:    push   %ebp
0x08048405 <function+1>:    mov    %esp,%ebp
0x08048407 <function+3>:    sub    $0x28,%esp
0x0804840a <function+6>:    mov    %gs:0x14,%eax
0x08048410 <function+12>:   mov    %eax,-0xc(%ebp)
0x08048413 <function+15>:   xor    %eax,%eax
0x08048415 <function+17>:   mov    -0xc(%ebp),%eax
0x08048418 <function+20>:   xor    %gs:0x14,%eax
0x0804841f <function+27>:   je     0x8048426 <function+34>
0x08048421 <function+29>:   call   0x8048340 <__stack_chk_fail@plt>
0x08048426 <function+34>:   leave  
0x08048427 <function+35>:   ret    
End of assembler dump.

我正在寻找以下问题的答案:
  • 地址是如何工作的,我的意思是 (main+0) , (main+1), (main+3)
  • 主要是为什么 $0xffffffff0,%esp 被使用
  • 在函数中,为什么使用 %gs:0x14,%eax , %eax,-0xc(%ebp) 。
  • 如果有人可以解释,一步一步地发生,那将不胜感激。
  • 最佳答案

    “奇怪”地址的原因,例如main+0 , main+1 , main+3 , main+6依此类推,因为每条指令占用的字节数是可变的。例如:

    main+0: push %ebp
    

    是一个单字节指令,所以下一条指令在 main+1 .另一方面,
    main+3: and $0xfffffff0,%esp
    

    是一个三字节指令,所以下一条指令在 main+6 .

    而且,既然你在评论中问为什么 movl似乎需要可变数量的字节,对此的解释如下。

    指令长度不仅取决于操作码(例如 movl ),还取决于操作数的寻址模式(操作码操作的对象)。我没有专门检查你的代码,但我怀疑
    movl $0x1,(%esp)
    

    指令可能更短,因为不涉及偏移量 - 它只使用 esp作为地址。而像:
    movl $0x2,0x4(%esp)
    

    需要一切movl $0x1,(%esp)确实如此,加上偏移量 0x4 的额外字节.

    事实上,这是一个调试 session ,显示了我的意思:
    Microsoft Windows XP [Version 5.1.2600]
    (C) Copyright 1985-2001 Microsoft Corp.
    
    c:\pax> debug
    -a
    0B52:0100 mov word ptr [di],7
    0B52:0104 mov word ptr [di+2],8
    0B52:0109 mov word ptr [di+0],7
    0B52:010E
    -u100,10d
    0B52:0100 C7050700      MOV     WORD PTR [DI],0007
    0B52:0104 C745020800    MOV     WORD PTR [DI+02],0008
    0B52:0109 C745000700    MOV     WORD PTR [DI+00],0007
    -q
    c:\pax> _
    

    可以看到,带有偏移量的第二条指令实际上与没有偏移量的第一条指令不同。它长了一个字节(5 个字节而不是 4 个字节,用于保存偏移量)并且实际上具有不同的编码 c745而不是 c705 .

    你还可以看到你可以用两种不同的方式对第一条和第三条指令进行编码,但它们基本上做同样的事情。
    and $0xfffffff0,%esp指令是一种强制方式esp处于特定边界。这用于确保变量的正确对齐。如果现代处理器上的许多内存访问遵循对齐规则(例如,4 字节值必须与 4 字节边界对齐),它们将更加高效。如果您不遵守这些规则,一些现代处理器甚至会引发故障。

    在这条指令之后,你可以保证 esp小于或等于其先前的值并与 16 字节边界对齐。
    gs:前缀只是意味着使用 gs段寄存器访问内存而不是默认值。

    指令mov %eax,-0xc(%ebp)表示取ebp的内容注册,减去 12 ( 0xc ),然后输入 eax 的值到那个内存位置。

    重新解释代码。您的 function功能基本上是一大无操作。生成的程序集仅限于堆栈帧设置和拆卸,以及一些使用上述 %gs:14 的堆栈帧损坏检查。内存位置。

    它将该位置的值(可能类似于 0xdeadbeef )加载到堆栈帧中,完成其工作,然后检查堆栈以确保它没有被损坏。

    在这种情况下,它的工作什么都不是。所以你看到的只是函数管理的东西。

    堆栈设置发生在 function+0 之间和 function+12 .之后的一切都是在 eax 中设置返回码并拆除堆栈帧,包括损坏检查。

    同样,main包括堆栈帧设置,推送参数 function , 拨打 function ,拆除堆栈框架并退出。

    注释已插入到以下代码中:
    0x08048428 <main+0>:    push   %ebp                 ; save previous value.
    0x08048429 <main+1>:    mov    %esp,%ebp            ; create new stack frame.
    0x0804842b <main+3>:    and    $0xfffffff0,%esp     ; align to boundary.
    0x0804842e <main+6>:    sub    $0x10,%esp           ; make space on stack.
    
    0x08048431 <main+9>:    movl   $0x3,0x8(%esp)       ; push values for function.
    0x08048439 <main+17>:   movl   $0x2,0x4(%esp)
    0x08048441 <main+25>:   movl   $0x1,(%esp)
    0x08048448 <main+32>:   call   0x8048404 <function> ; and call it.
    
    0x0804844d <main+37>:   leave                       ; tear down frame.
    0x0804844e <main+38>:   ret                         ; and exit.
    
    0x08048404 <func+0>:    push   %ebp                 ; save previous value.
    0x08048405 <func+1>:    mov    %esp,%ebp            ; create new stack frame.
    0x08048407 <func+3>:    sub    $0x28,%esp           ; make space on stack.
    0x0804840a <func+6>:    mov    %gs:0x14,%eax        ; get sentinel value.
    0x08048410 <func+12>:   mov    %eax,-0xc(%ebp)      ; put on stack.
    
    0x08048413 <func+15>:   xor    %eax,%eax            ; set return code 0.
    
    0x08048415 <func+17>:   mov    -0xc(%ebp),%eax      ; get sentinel from stack.
    0x08048418 <func+20>:   xor    %gs:0x14,%eax        ; compare with actual.
    0x0804841f <func+27>:   je     <func+34>            ; jump if okay.
    0x08048421 <func+29>:   call   <_stk_chk_fl>        ; otherwise corrupted stack.
    0x08048426 <func+34>:   leave                       ; tear down frame.
    0x08048427 <func+35>:   ret                         ; and exit.
    

    我想的原因%gs:0x14从上面可能很明显,但为了以防万一,我会在这里详细说明。

    它使用这个值(一个哨兵)来放入当前的堆栈帧,这样,如果函数中的某些东西做一些愚蠢的事情,比如将 1024 字节写入在堆栈上创建的 20 字节数组,或者,在您的情况下:
    char buffer1[5];
    strcpy (buffer1, "Hello there, my name is Pax.");
    

    然后哨兵将被覆盖,函数末尾的检查将检测到这一点,调用失败函数让你知道,然后可能会中止以避免任何其他问题。

    如果放置 0xdeadbeef到堆栈上,这被更改为其他内容,然后是 xor0xdeadbeef将产生一个非零值,该值在带有 je 的代码中检测到。操作说明。

    相关位在这里解释:
              mov    %gs:0x14,%eax     ; get sentinel value.
              mov    %eax,-0xc(%ebp)   ; put on stack.
    
              ;; Weave your function
              ;;   magic here.
    
              mov    -0xc(%ebp),%eax   ; get sentinel back from stack.
              xor    %gs:0x14,%eax     ; compare with original value.
              je     stack_ok          ; zero/equal means no corruption.
              call   stack_bad         ; otherwise corrupted stack.
    stack_ok: leave                    ; tear down frame.
    

    关于c - 理解一个简单的 C 程序生成的汇编代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3654898/

    有关c - 理解一个简单的 C 程序生成的汇编代码的更多相关文章

    1. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

      我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

    2. ruby - 在 Ruby 程序执行时阻止 Windows 7 PC 进入休眠状态 - 2

      我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0

    3. ruby - 如何在 buildr 项目中使用 Ruby 代码? - 2

      如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby​​

    4. ruby - 如何指定 Rack 处理程序 - 2

      Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

    5. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

      使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

    6. ruby-on-rails - Rails 源代码 : initialize hash in a weird way? - 2

      在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has

    7. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

      我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

    8. ruby-on-rails - 渲染另一个 Controller 的 View - 2

      我想要做的是有2个不同的Controller,client和test_client。客户端Controller已经构建,我想创建一个test_clientController,我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集,然后呈现客户端Controller的索引View,以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>

    9. ruby - 在 Ruby 中编写命令行实用程序 - 2

      我想用ruby​​编写一个小的命令行实用程序并将其作为gem分发。我知道安装后,Guard、Sass和Thor等某些gem可以从命令行自行运行。为了让gem像二进制文件一样可用,我需要在我的gemspec中指定什么。 最佳答案 Gem::Specification.newdo|s|...s.executable='name_of_executable'...endhttp://docs.rubygems.org/read/chapter/20 关于ruby-在Ruby中编写命令行实用程序

    10. ruby-on-rails - Rails 应用程序之间的通信 - 2

      我构建了两个需要相互通信和发送文件的Rails应用程序。例如,一个Rails应用程序会发送请求以查看其他应用程序数据库中的表。然后另一个应用程序将呈现该表的json并将其发回。我还希望一个应用程序将存储在其公共(public)目录中的文本文件发送到另一个应用程序的公共(public)目录。我从来没有做过这样的事情,所以我什至不知道从哪里开始。任何帮助,将不胜感激。谢谢! 最佳答案 无论Rails是什么,几乎所有Web应用程序都有您的要求,大多数现代Web应用程序都需要相互通信。但是有一个小小的理解需要你坚持下去,网站不应直接访问彼此

    随机推荐