草庐IT

c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?

coder 2024-02-05 原文

我在玩编译器资源管理器时发现这两个函数在 gcc 和 clang 中生成不同的程序集。我预计在内联后它们会产生相同的表达式树,从而产生相同的最佳装配。

constexpr bool is_nonzero_decimal_digit(char const c) noexcept
{
    return c == '1' || c == '2' || c == '3' || c == '4' || c == '5'
        || c == '6' || c == '7' || c == '8' || c == '9';
}

bool is_decimal_digit_v1(char const c) noexcept
{
    return c == '0' || is_nonzero_decimal_digit(c);
}

bool is_decimal_digit_v2(char const c) noexcept
{
    return c == '0' || c == '1' || c == '2' || c == '3' || c == '4' 
        || c == '5' || c == '6' || c == '7' || c == '8' || c == '9';
}

Clang 3.9.1 -std=c++1z -O3 结果

is_decimal_digit_v1(char):
    cmp     dil, 48
    sete    cl
    add     dil, -49
    cmp     dil, 9
    setb    al
    or      al, cl
    ret

is_decimal_digit_v2(char):
    add     dil, -48
    cmp     dil, 10
    setb    al
    ret

gcc 6.3 -std=c++1z -O3 结果

is_decimal_digit_v1(char):
    cmp     dil, 48
    je      .L3
    sub     edi, 49
    cmp     dil, 8
    setbe   al
    ret
.L3:
    mov     eax, 1
    ret

is_decimal_digit_v2(char):
    sub     edi, 48
    cmp     dil, 9
    setbe   al
    ret

那么,这是优化器的怪癖还是语言规则禁止优化的结果?

最佳答案

这是 gcc < 7.0="" 和="" clang="" 优化器的一个怪癖。正如="" cornstalks="" 在评论中指出的那样,gcc="" 7.0="" 能够生成最佳汇编。我还检查了="" vc++="">

is_decimal_digit_v2:
    sub    cl, 48
    cmp    cl, 9
    setbe  al
    ret    0
is_decimal_digit_v1:
    sub    cl, 48
    cmp    cl, 9
    setbe  al
    ret    0

作为 T.C.指出,内联是在一些优化通过之后执行的,在这个特定的代码中,它将一系列比较合并到一个更简单的范围检查中。在内联之前这样做很有用,可以使叶函数更小,这反过来又增加了它们被内联的机会。基本上,v1 函数被转换成这样:

bool is_decimal_digit_v3(char const c) noexcept
{
    if (c == 48) return true;
    // this is what was inlined
    char tmp = c - 49;
    return tmp >= 0 && tmp < 9;
}

而 v2 被转换为更简单的形式:

bool is_decimal_digit_v4(char const c) noexcept
{
  char tmp = c - 48;
  return tmp >= 0 && tmp < 10;
}

为 v3 生成的程序集与为 v1 生成的程序集类似

#clang 3.9.1
is_decimal_digit_v3(char):               # @is_decimal_digit_v3(char)
    cmp     dil, 48
    sete    cl
    add     dil, -49
    cmp     dil, 9
    setb    al
    or      al, cl
    ret
# gcc 6.3
is_decimal_digit_v3(char):
    cmp     dil, 48
    je      .L8
    sub     edi, 49
    cmp     dil, 8
    setbe   al
    ret
.L8:
    mov     eax, 1
    ret

我想,要将 v3 转换为 v4,需要一些 gcc 7.0 能够完成的重要分析。此版本为所有四个片段生成完全相同的程序集:

is_decimal_digit_v1(char):
    sub     edi, 48
    cmp     dil, 9
    setbe   al
    ret
is_decimal_digit_v2(char):
    sub     edi, 48
    cmp     dil, 9
    setbe   al
    ret
is_decimal_digit_v3(char):
    sub     edi, 48
    cmp     dil, 9
    setbe   al
    ret
is_decimal_digit_v4(char):
    sub     edi, 48
    cmp     dil, 9
    setbe   al
    ret

有趣的是,VC++2015 无法将 v3 转换为 v4 并生成此程序集:

is_decimal_digit_v3:
    cmp    cl, 48
    jne    SHORT $LN2@is_decimal
    mov    al, 1
    ret    0
$LN2@is_decimal:
    xor    eax, eax
    sub    cl, 49
    cmp    cl, 8
    setbe  al
    ret    0

如果非要我猜的话,我会说它为 v1 而不是为 v3 生成最佳代码的原因是因为它在减少与范围检查的比较之前进行了内联。

关于c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41576821/

有关c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?的更多相关文章

  1. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  2. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  3. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

    几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

  4. arrays - 这是 Ruby 中 Array.fill 方法的错误吗? - 2

    这个问题在这里已经有了答案:Arraysmisbehaving(1个回答)关闭6年前。是否应该这样,即我误解了,还是错误?a=Array.new(3,Array.new(3))a[1].fill('g')=>[["g","g","g"],["g","g","g"],["g","g","g"]]它不应该导致:=>[[nil,nil,nil],["g","g","g"],[nil,nil,nil]]

  5. ruby - 使用 `+=` 和 `send` 方法 - 2

    如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:

  6. Unity 热更新技术 | (三) Lua语言基本介绍及下载安装 - 2

    ?博客主页:https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创,首发于CSDN??学习专栏推荐:Unity系统学习专栏?游戏制作专栏推荐:游戏制作?Unity实战100例专栏推荐:Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正!?未来很长,值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------

  7. 7个大一C语言必学的程序 / C语言经典代码大全 - 2

    嗨~大家好,这里是可莉!今天给大家带来的是7个C语言的经典基础代码~那一起往下看下去把【程序一】打印100到200之间的素数#includeintmain(){ inti; for(i=100;i 【程序二】输出乘法口诀表#includeintmain(){inti;for(i=1;i 【程序三】判断1000年---2000年之间的闰年#includeintmain(){intyear;for(year=1000;year 【程序四】给定两个整形变量的值,将两个值的内容进行交换。这里提供两种方法来进行交换,第一种为创建临时变量来进行交换,第二种是不创建临时变量而直接进行交换。1.创建临时变量来

  8. ruby - 如何在 RVM 下将 Bundler 安装到 @global gemset,这是正确的方法吗 - 2

    我在OSX上(如果重要的话)。如果我使用RVM安装Ruby,它会默认将Bundler安装到@globalgemset假设我想要一个不同版本的bundler。我假设我需要做的就是执行geminstallbundler--version但是,这会将bundler安装到默认gemset并且RVM不会为其设置路径。因此,如果我键入bundler,它仍会启动一个与Ruby一起安装到@global中的bundler两个问题:如何将bundler安装到@globalgemset。将bundler安装到@globalgemset中的模式是否正确,或者我遗漏了什么 最佳答案

  9. ruby - 如何计算 Liquid 中的变量 +1 - 2

    我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止,这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。 最佳答案 因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量,我

  10. c - 这是什么宏? - 2

    在ruby.h中,有很多函数宏是这样定义的:staticinlineint#ifdefined(HAVE_PROTOTYPES)rb_type(VALUEobj)#elserb_type(obj)VALUEobj;#endif{if(FIXNUM_P(obj))returnT_FIXNUM;if(obj==Qnil)returnT_NIL;if(obj==Qfalse)returnT_FALSE;if(obj==Qtrue)returnT_TRUE;if(obj==Qundef)returnT_UNDEF;if(SYMBOL_P(obj))returnT_SYMBOL;returnBU

随机推荐