linux - 一个 C hello world 的汇编输出的每一行是什么意思？

coder 2023-04-29 原文

我在这个上运行了 gcc -S :

int main()
{
printf ("Hello world!");
}

我得到了这个汇编代码:

        .file   "test.c"
        .section        .rodata
.LC0:
        .string "Hello world!"
        .text
.globl main
        .type   main, @function
main:
        leal    4(%esp), %ecx
        andl    $-16, %esp
        pushl   -4(%ecx)
        pushl   %ebp
        movl    %esp, %ebp
        pushl   %ecx
        subl    $20, %esp
        movl    $.LC0, (%esp)
        call    printf
        addl    $20, %esp
        popl    %ecx
        popl    %ebp
        leal    -4(%ecx), %esp
        ret
        .size   main, .-main
        .ident  "GCC: (GNU) 4.3.0 20080428 (Red Hat 4.3.0-8)"
        .section        .note.GNU-stack,"",@progbits

我很想了解这个输出。有人可以分享一些理解此输出的指针，或者如果有人可以针对这些行/行组中的每一行标记注释，解释它的作用，那就太好了。

最佳答案

这是怎么回事:

        .file   "test.c"

原始源文件名(由调试器使用)。

        .section        .rodata
.LC0:
        .string "Hello world!"

“.rodata”部分包含一个以零结尾的字符串(“ro”表示“只读”:应用程序将能够读取数据，但任何写入数据的尝试都会触发异常)。

        .text

现在我们将内容写入“.text”部分，这是代码所在的位置。

.globl main
        .type   main, @function
main:

我们定义了一个名为“main”且全局可见的函数(其他目标文件将能够调用它)。

        leal    4(%esp), %ecx

我们存储在寄存器 %ecx值 4+%esp ( %esp 是堆栈指针)。

        andl    $-16, %esp

%esp稍作修改，使其成为 16 的倍数。对于某些数据类型(对应 C 的 double 和 long double 的浮点格式)，内存访问在地址为 16 的倍数时性能更好。这在这里并不是真正需要的，但是当在没有优化标志(-O2 ...)的情况下使用时，编译器往往会产生相当多的通用无用代码(即在某些情况下可能有用但在这里没有用的代码)。

        pushl   -4(%ecx)

这个有点奇怪:在这一点上，地址 -4(%ecx) 处的单词是在 andl 之前位于堆栈顶部的单词.代码检索那个词(顺便说一下，它应该是返回地址)并再次推送它。这种模拟从具有 16 字节对齐堆栈的函数调用将获得的内容。我的猜测是这个 push是参数复制序列的残余。由于函数已经调整了堆栈指针，它必须复制函数参数，这些参数可以通过堆栈指针的旧值访问。这里没有参数，除了函数返回地址。请注意，不会使用这个词(同样，这是没有优化的代码)。

        pushl   %ebp
        movl    %esp, %ebp

这是标准函数序言:我们保存 %ebp (因为我们要修改它)，然后设置%ebp指向堆栈帧。此后，%ebp将用于访问函数参数，使得 %esp又免费了。 (是的，没有参数，所以这对那个函数没用。)

        pushl   %ecx

我们保存 %ecx (我们将在函数退出时需要它，以将 %esp 恢复为它在 andl 之前的值)。

        subl    $20, %esp

我们在堆栈上保留了 32 个字节(记住堆栈是“向下”增长的)。该空间将用于存储 printf() 的参数。 (这是矫枉过正，因为只有一个参数，它将使用 4 个字节 [这是一个指针])。

        movl    $.LC0, (%esp)
        call    printf

我们将参数“推”到 printf() (即我们确保 %esp 指向包含参数的单词，这里是 $.LC0 ，它是rodata 部分中常量字符串的地址)。然后我们打电话printf() .

        addl    $20, %esp

当printf()返回，我们删除为参数分配的空间。此 addl取消什么 subl上面做了。

        popl    %ecx

我们找回 %ecx (推到上面)； printf()可能已经修改了它(调用约定描述了函数可以修改哪个寄存器而不在退出时恢复它们；%ecx 就是这样一个寄存器)。

        popl    %ebp

功能结语:这个恢复%ebp (对应于上面的 pushl %ebp)。

        leal    -4(%ecx), %esp

我们恢复 %esp到它的初始值。这个操作码的作用是存储在%esp值 %ecx-4 . %ecx在第一个函数操作码中设置。这将取消对 %esp 的任何更改，包括 andl .

ret

函数退出。

        .size   main, .-main

这设置了 main() 的大小功能:在汇编过程中的任何时候，“.”是“我们现在添加东西的地址”的别名。如果在此处添加另一条指令，它将到达“.”指定的地址。因此，这里的“.-main”是函数main()的代码的确切大小。 . .size指令指示汇编器将该信息写入目标文件。

        .ident  "GCC: (GNU) 4.3.0 20080428 (Red Hat 4.3.0-8)"

GCC 只是喜欢留下其行动的痕迹。该字符串最终作为目标文件中的一种注释。链接器将删除它。

        .section        .note.GNU-stack,"",@progbits

GCC 写的一个特殊部分，代码可以容纳不可执行的堆栈。这是正常情况。某些特殊用途(非标准 C)需要可执行堆栈。在现代处理器上，内核可以创建一个不可执行的堆栈(如果有人试图将堆栈上的某些数据作为代码执行，该堆栈会触发异常)；这被一些人视为“安全功能”，因为将代码放在堆栈上是利用缓冲区溢出的常见方法。有了这个部分，可执行文件将被标记为“与非可执行堆栈兼容”，内核很乐意提供它。

关于linux - 一个 C hello world 的汇编输出的每一行是什么意思？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5325326/

有关linux - 一个 C hello world 的汇编输出的每一行是什么意思？的更多相关文章

ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby-on-rails - Rails - 子类化模型的设计模式是什么？ - 2
我有一个模型:classItem项目有一个属性“商店”基于存储的值，我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式？如果方法中没有大的if-else语句，这是如何干净利落地完成的？最佳答案通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 使用 Vim Rails，您可以创建一个新的迁移文件并一次性打开它吗？ - 2
使用带有Rails插件的vim，您可以创建一个迁移文件，然后一次性打开该文件吗？textmate也可以这样吗？最佳答案你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件，这正是您想要的。我不能代表textmate。关于ruby-使用VimRails，您可以创建一个新的迁移文件并一次性打开它吗？，我们在StackOverflow上找到一个类似的问题： https://sta
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby-on-rails - 渲染另一个 Controller 的 View - 2
我想要做的是有2个不同的Controller，client和test_client。客户端Controller已经构建，我想创建一个test_clientController，我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集，然后呈现客户端Controller的索引View，以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>
ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996？但是 4.2%2==0.2 - 2
为什么4.1%2返回0.0999999999999996？但是4.2%2==0.2。最佳答案参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意，这不是与Ruby相关的问题，而是与所有编程语言相关的问题，因为它来自计算机表示实数的方式。关于ruby-为什么4.1%2使用Ruby返
ruby - 检查 "command"的输出应该包含 NilClass 的意外崩溃 - 2
为了将Cucumber用于命令行脚本，我按照提供的说明安装了arubagem。它在我的Gemfile中，我可以验证是否安装了正确的版本并且我已经包含了require'aruba/cucumber'在'features/env.rb'中为了确保它能正常工作，我写了以下场景:@announceScenario:Testingcucumber/arubaGivenablankslateThentheoutputfrom"ls-la"shouldcontain"drw"假设事情应该失败。它确实失败了，但失败的原因是错误的:@announceScenario:Testingcucumber/ar
ruby - 通过 erb 模板输出 ruby 数组 - 2
我正在使用puppet为ruby程序提供一组常量。我需要提供一组主机名，我的程序将对其进行迭代。在我之前使用的bash脚本中，我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是，我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

linux - 一个 C hello world 的汇编输出的每一行是什么意思？

有关linux - 一个 C hello world 的汇编输出的每一行是什么意思？的更多相关文章

随机推荐