c++ - GCC 似乎错过了简单的优化

coder 2024-02-03 原文

我正在尝试引入一个具有三元运算符语义的通用函数:E1？ E2 : E3。我看到编译器能够根据三元运算符的 E1 条件消除 E2 或 E3 之一的计算。然而，GCC 在 ternary 函数调用的情况下错过了这种优化(即使 E2/E3 没有副作用)。

在下面的列表中，函数 ternary 的行为类似于三元运算符。然而，GCC 可能会发出对函数 f 的潜在大量调用，这似乎可以消除某些输入值(对于三元运算符来说正是这样做的)，因为 f 是用纯属性声明的 -请查看 GCC 生成的汇编代码的 godbolt 链接。

它是否可以在 GCC 中进行改进(优化空间)或 C++ 标准是否明确禁止此类优化？

// Very heavy function
int f() __attribute__ ((pure));

inline int ternary(bool cond, int n1, int n2) {
    return cond ? n1 : n2;
}

int foo1(int i) {
    return i == 0 ? f() : 0;
}

int foo2(int i) {
    return ternary(i == 0, f(), 0);
}

带有 -O3 -std=c++11 的程序集 list :

foo1(int):
  test edi, edi
  jne .L2
  jmp f()
.L2:
  xor eax, eax
  ret
foo2(int):
  push rbx
  mov ebx, edi
  call f()
  test ebx, ebx
  mov edx, 0
  pop rbx
  cmovne eax, edx
  ret

https://godbolt.org/z/HfpNzo

最佳答案

I see that compiler is able to eliminate calculation of one of E2 or E3 depending on E1 condition (as long as E2/E3 has no side effects) for the ternary operator.

编译器不会消除它；它只是从一开始就从未将其优化为 cmov 。 C++ 抽象机不评估三元运算符的未使用端。

int a, b;
void foo(int sel) {
    sel ? a++ : b++;
}

像这样编译(Godbolt):

foo(int):
    test    edi, edi
    je      .L2                # if(sel==0) goto
    add     DWORD PTR a[rip], 1   # ++a
    ret
.L2:
    add     DWORD PTR b[rip], 1   # ++b
    ret

如果两个输入都没有任何副作用，则三元运算符只能优化为 asm cmov。否则它们并不完全等同。

在 C++ 抽象机中(即 gcc 优化器的输入)，您的 foo2 总是调用 f()，而您的 foo1 没有。 foo1 以这种方式编译也就不足为奇了。

要让 foo2 以这种方式编译，它必须优化掉对 f() 的调用。 它总是被调用来为 ternary( )。

这里有一个 missed-optimization，你应该在 GCC 的 bugzilla 上报告(使用 missed-optimization 关键字作为标签)。 https://gcc.gnu.org/bugzilla/enter_bug.cgi?product=gcc

对 int f() __attribute__ ((pure)); 的调用应该能够被优化掉。它可以读取全局变量，但不能有任何副作用。 ( https://gcc.gnu.org/onlinedocs/gcc/Common-Function-Attributes.html )

正如@melpomene 在评论中发现的那样，int f() __attribute__ ((const)); 确实为您提供了您正在寻找的优化。 __attribute__((const)) 函数甚至不能读取全局变量，只能读取其参数。 (因此没有参数，它必须总是返回一个常量。)

HVD 指出 gcc 没有任何关于 f() 的成本信息。即使它可以优化掉对 ((pure)) f() 和 ((const)) f 的调用，也许不是因为它不知道它比条件分支更昂贵？可能使用配置文件引导优化进行编译会说服 gcc 做某事？

但鉴于它在 foo2 中以条件方式调用了 ((const)) f，gcc 可能只是不知道它可以优化对 的调用((pure)) 函数？也许它只能对它们进行 CSE(如果没有编写全局变量)，但不能完全脱离基本 block 进行优化？或者，也许当前的优化器无法利用。就像我说的，看起来像是一个错误选择。

关于c++ - GCC 似乎错过了简单的优化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52320679/

amp 43 code 39 运算符 c++gcc assembly optimization

有关c++ - GCC 似乎错过了简单的优化的更多相关文章

ruby-on-rails - 如何优雅地重启 thin + nginx？ - 2
我的瘦服务器配置了nginx，我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例，但找不到好的解决方案。有没有人能做到这一点？最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器，例如server{listen80;server
ruby-on-rails - 无法在centos上安装therubyracer(V8和GCC出错) - 2
我正在尝试在我的centos服务器上安装therubyracer，但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e
ruby - 简单获取法拉第超时 - 2
有没有办法在这个简单的get方法中添加超时选项？我正在使用法拉第3.3。Faraday.get(url)四处寻找，我只能先发起连接后应用超时选项，然后应用超时选项。或者有什么简单的方法？这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
ruby - 用 Ruby 编写一个简单的网络服务器 - 2
我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不，不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本，提供另一个脚本，它将在其标准输入上获取请求，并在其标准输出上返回完整的响应。到目前为止一切顺利，但事实证明这真的很脆弱，因为它在第二个请求上中断并出现错误:/usr/b
ruby-on-rails - 简单的 Ruby on Rails 问题——如何将评论附加到用户和文章？ - 2
我意识到这可能是一个非常基本的问题，但我现在已经花了几天时间回过头来解决这个问题，但出于某种原因，Google就是没有帮助我。(我认为部分问题在于我是一个初学者，我不知道该问什么......)我也看过O'Reilly的RubyCookbook和RailsAPI，但我仍然停留在这个问题上.我找到了一些关于多态关系的信息，但它似乎不是我需要的(尽管如果我错了请告诉我)。我正在尝试调整MichaelHartl'stutorial创建一个包含用户、文章和评论的博客应用程序(不使用脚手架)。我希望评论既属于用户又属于文章。我的主要问题是:我不知道如何将当前文章的ID放入评论Controller。
ruby - 使用 Ruby 通过 Outlook 发送消息的最简单方法是什么？ - 2
我的工作要求我为某些测试自动生成电子邮件。我一直在四处寻找，但未能找到可以快速实现的合理解决方案。它需要在outlook而不是其他邮件服务器中，因为我们有一些奇怪的身份验证规则，我们需要保存草稿而不是仅仅发送邮件的选项。显然win32ole可以做到这一点，但我找不到任何相当简单的例子。最佳答案假设存储了Outlook凭据并且您设置为自动登录到Outlook，WIN32OLE可以很好地完成此操作:require'win32ole'outlook=WIN32OLE.new('Outlook.Application')message=
ruby - 使用 `+=` 和 `send` 方法 - 2
如何将send与+=一起使用？a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案恐怕你不能。+=不是方法，而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:
postman——集合——执行集合——测试脚本——pm对象简单示例02 - 2
//1.验证返回状态码是否是200pm.test("Statuscodeis200",function(){pm.response.to.have.status(200);});//2.验证返回body内是否含有某个值pm.test("Bodymatchesstring",function(){pm.expect(pm.response.text()).to.include("string_you_want_to_search");});//3.验证某个返回值是否是100pm.test("Yourtestname",function(){varjsonData=pm.response.json
Qt Designer的简单使用 - 2
在前面两节的例子中，主界面窗口的尺寸和标签控件显示的矩形区域等，都是用C++代码编写的。窗口和控件的尺寸都是预估的，控件如果多起来，那就不好估计每个控件合适的位置和大小了。用C++代码编写图形界面的问题就是不直观，因此Qt项目开发了专门的可视化图形界面编辑器——QtDesigner（Qt设计师）。通过QtDesigner就可以很方便地创建图形界面文件*.ui，然后将ui文件应用到源代码里面，做到“所见即所得”，大大方便了图形界面的设计。本节就演示一下QtDesigner的简单使用，学习拖拽控件和设置控件属性，并将ui文件应用到Qt程序代码里。使用QtDesigner设计界面在开始菜单中找到「Q
ruby-on-rails - 在 heroku 的 .fonts 文件夹中包含自定义字体，似乎无法识别它们 - 2
Heroku支持人员告诉我，为了在我的Web应用程序中使用自定义字体(未安装在系统中，您可以在bash控制台中使用fc-list查看已安装的字体)我必须部署一个包含所有字体的.fonts文件夹里面的字体。问题是我不知道该怎么做。我的意思是，我不知道文件名是否必须遵循heroku的任何特殊模式，或者我必须在我的代码中做一些事情来考虑这种字体，或者如果我将它包含在文件夹中它是自动的......事实是，我尝试以不同的方式更改字体的文件名，但根本没有使用该字体。为了提供更多详细信息，我们使用字体的过程是将PDF转换为图像，更具体地说，使用rghostgem。并且最终图像根本不使用自定义字体。在

c++ - GCC 似乎错过了简单的优化

有关c++ - GCC 似乎错过了简单的优化的更多相关文章

随机推荐