我正在尝试引入一个具有三元运算符语义的通用函数:E1? E2 : E3。我看到编译器能够根据三元运算符的 E1 条件消除 E2 或 E3 之一的计算。然而,GCC 在 ternary 函数调用的情况下错过了这种优化(即使 E2/E3 没有副作用)。
在下面的列表中,函数 ternary 的行为类似于三元运算符。然而,GCC 可能会发出对函数 f 的潜在大量调用,这似乎可以消除某些输入值(对于三元运算符来说正是这样做的),因为 f 是用纯属性声明的 -请查看 GCC 生成的汇编代码的 godbolt 链接。
它是否可以在 GCC 中进行改进(优化空间)或 C++ 标准是否明确禁止此类优化?
// Very heavy function
int f() __attribute__ ((pure));
inline int ternary(bool cond, int n1, int n2) {
return cond ? n1 : n2;
}
int foo1(int i) {
return i == 0 ? f() : 0;
}
int foo2(int i) {
return ternary(i == 0, f(), 0);
}
带有 -O3 -std=c++11 的程序集 list :
foo1(int):
test edi, edi
jne .L2
jmp f()
.L2:
xor eax, eax
ret
foo2(int):
push rbx
mov ebx, edi
call f()
test ebx, ebx
mov edx, 0
pop rbx
cmovne eax, edx
ret
最佳答案
I see that compiler is able to eliminate calculation of one of E2 or E3 depending on E1 condition (as long as E2/E3 has no side effects) for the ternary operator.
编译器不会消除它;它只是从一开始就从未将其优化为 cmov 。 C++ 抽象机不评估三元运算符的未使用端。
int a, b;
void foo(int sel) {
sel ? a++ : b++;
}
像这样编译(Godbolt):
foo(int):
test edi, edi
je .L2 # if(sel==0) goto
add DWORD PTR a[rip], 1 # ++a
ret
.L2:
add DWORD PTR b[rip], 1 # ++b
ret
如果两个输入都没有任何副作用,则三元运算符只能优化为 asm cmov。否则它们并不完全等同。
在 C++ 抽象机中(即 gcc 优化器的输入),您的 foo2 总是调用 f(),而您的 foo1 没有。 foo1 以这种方式编译也就不足为奇了。
要让 foo2 以这种方式编译,它必须优化掉对 f() 的调用。 它总是被调用来为 ternary( )。
这里有一个 missed-optimization,你应该在 GCC 的 bugzilla 上报告(使用 missed-optimization 关键字作为标签)。 https://gcc.gnu.org/bugzilla/enter_bug.cgi?product=gcc
对 int f() __attribute__ ((pure)); 的调用 应该 能够被优化掉。它可以读取全局变量,但不能有任何副作用。 ( https://gcc.gnu.org/onlinedocs/gcc/Common-Function-Attributes.html )
正如@melpomene 在评论中发现的那样,int f() __attribute__ ((const)); 确实为您提供了您正在寻找的优化。 __attribute__((const)) 函数甚至不能读取全局变量,只能读取其参数。 (因此没有参数,它必须总是返回一个常量。)
HVD 指出 gcc 没有任何关于 f() 的成本信息。即使它可以优化掉对 ((pure)) f() 和 ((const)) f 的调用,也许不是因为它不知道它比条件分支更昂贵?可能使用配置文件引导优化进行编译会说服 gcc 做某事?
但鉴于它在 foo2 中以条件方式调用了 ((const)) f,gcc 可能只是不知道它可以优化对 的调用((pure)) 函数?也许它只能对它们进行 CSE(如果没有编写全局变量),但不能完全脱离基本 block 进行优化?或者,也许当前的优化器无法利用。就像我说的,看起来像是一个错误选择。
关于c++ - GCC 似乎错过了简单的优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52320679/
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
我正在尝试在我的centos服务器上安装therubyracer,但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e
有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b
我意识到这可能是一个非常基本的问题,但我现在已经花了几天时间回过头来解决这个问题,但出于某种原因,Google就是没有帮助我。(我认为部分问题在于我是一个初学者,我不知道该问什么......)我也看过O'Reilly的RubyCookbook和RailsAPI,但我仍然停留在这个问题上.我找到了一些关于多态关系的信息,但它似乎不是我需要的(尽管如果我错了请告诉我)。我正在尝试调整MichaelHartl'stutorial创建一个包含用户、文章和评论的博客应用程序(不使用脚手架)。我希望评论既属于用户又属于文章。我的主要问题是:我不知道如何将当前文章的ID放入评论Controller。
我的工作要求我为某些测试自动生成电子邮件。我一直在四处寻找,但未能找到可以快速实现的合理解决方案。它需要在outlook而不是其他邮件服务器中,因为我们有一些奇怪的身份验证规则,我们需要保存草稿而不是仅仅发送邮件的选项。显然win32ole可以做到这一点,但我找不到任何相当简单的例子。 最佳答案 假设存储了Outlook凭据并且您设置为自动登录到Outlook,WIN32OLE可以很好地完成此操作:require'win32ole'outlook=WIN32OLE.new('Outlook.Application')message=
如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:
//1.验证返回状态码是否是200pm.test("Statuscodeis200",function(){pm.response.to.have.status(200);});//2.验证返回body内是否含有某个值pm.test("Bodymatchesstring",function(){pm.expect(pm.response.text()).to.include("string_you_want_to_search");});//3.验证某个返回值是否是100pm.test("Yourtestname",function(){varjsonData=pm.response.json
在前面两节的例子中,主界面窗口的尺寸和标签控件显示的矩形区域等,都是用C++代码编写的。窗口和控件的尺寸都是预估的,控件如果多起来,那就不好估计每个控件合适的位置和大小了。用C++代码编写图形界面的问题就是不直观,因此Qt项目开发了专门的可视化图形界面编辑器——QtDesigner(Qt设计师)。通过QtDesigner就可以很方便地创建图形界面文件*.ui,然后将ui文件应用到源代码里面,做到“所见即所得”,大大方便了图形界面的设计。本节就演示一下QtDesigner的简单使用,学习拖拽控件和设置控件属性,并将ui文件应用到Qt程序代码里。使用QtDesigner设计界面在开始菜单中找到「Q
Heroku支持人员告诉我,为了在我的Web应用程序中使用自定义字体(未安装在系统中,您可以在bash控制台中使用fc-list查看已安装的字体)我必须部署一个包含所有字体的.fonts文件夹里面的字体。问题是我不知道该怎么做。我的意思是,我不知道文件名是否必须遵循heroku的任何特殊模式,或者我必须在我的代码中做一些事情来考虑这种字体,或者如果我将它包含在文件夹中它是自动的......事实是,我尝试以不同的方式更改字体的文件名,但根本没有使用该字体。为了提供更多详细信息,我们使用字体的过程是将PDF转换为图像,更具体地说,使用rghostgem。并且最终图像根本不使用自定义字体。在