草庐IT

c++ - GCC优化isnan(x)是否可行|| isnan(y) 变成 isunordered(x, y)?

coder 2023-05-31 原文

这是我的代码:

int f(double x, double y)
{
  return std::isnan(x) || std::isnan(y);
}

如果您使用 C 而不是 C++,只需将 std:: 替换为 __builtin_(不要简单地删除 std:: , 原因如下:Why does GCC implement isnan() more efficiently for C++ <cmath> than C <math.h>? )。

这是程序集:

ucomisd %xmm0, %xmm0 ; set parity flag if x is NAN
setp    %dl          ; copy parity flag to %edx
ucomisd %xmm1, %xmm1 ; set parity flag if y is NAN
setp    %al          ; copy parity flag to %eax
orl     %edx, %eax   ; OR one byte of each result into a full-width register

现在让我们尝试一个替代的公式来做同样的事情:

int f(double x, double y)
{
  return std::isunordered(x, y);
}

这是替代方案的程序集:

xorl    %eax, %eax
ucomisd %xmm1, %xmm0
setp    %al

这太棒了——我们将生成的代码几乎减半!这是因为 ucomisd 设置奇偶校验标志,如果 either 它的操作数是 NAN,所以我们可以一次测试两个值,SIMD 样式。

你可以在野外看到类似原始版本的代码,例如:https://svn.r-project.org/R/trunk/src/nmath/qnorm.c

如果我们能让 GCC 足够聪明,可以在任何地方组合两个 isnan() 调用,那将是非常酷的。我的问题是:我们可以吗,怎么做?我对编译器的工作原理有一些了解,但我不知道在 GCC 的哪个位置可以执行这种优化。基本思想是,只要有一对 isnan()(或 __builtin_isnan)调用 OR'd 在一起,它应该发出单个 ucomisd同时使用两个操作数的指令。

编辑添加了一些由 Basile Starynkevitch 的回答提示的研究:

如果我使用 -fdump-tree-all 进行编译,我会找到两个看起来相关的文件。首先,*.gimple 包含以下内容(以及更多内容):

D.2229 = x unord x;
D.2230 = y unord y;
D.2231 = D.2229 | D.2230;

这里我们可以清楚地看到,GCC 知道它会将 (x, x) 传递给 isunordered()。如果我们想通过在这个级别进行转换来进行优化,那么规则大致是:“将 a unord a | b unord b 替换为 a unord b”。这是编译我的第二个 C 代码时得到的结果:

D.2229 = x unord y;

另一个有趣的文件是*.original:

return <retval> = (int) (x unord x || y unord y);

其实就是-fdump-tree-original生成的整个非注释文件。对于更好的源代码,它看起来像这样:

return <retval> = x unord y;

显然可以应用相同类型的转换(只是这里是 || 而不是 |)。

但不幸的是,如果我们将源代码修改为例如:

if (__builtin_isnan(x))
  return true;
if (__builtin_isnan(y))
  return true;
return false;

然后我们得到完全不同的 Gimple 和 Original 输出文件,尽管最终的组装和以前一样。所以也许在管道的后期尝试这种转变会更好? *.optimized 文件(以及其他文件)显示带有“if”的版本的代码与原始版本的代码相同,因此很有希望。

最佳答案

这种优化不仅是可能的,它现在在 gcc-6 中可用: https://gcc.gnu.org/viewcvs/gcc?view=revision&revision=222077

关于c++ - GCC优化isnan(x)是否可行|| isnan(y) 变成 isunordered(x, y)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26053934/

有关c++ - GCC优化isnan(x)是否可行|| isnan(y) 变成 isunordered(x, y)?的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  3. ruby-on-rails - 无法在centos上安装therubyracer(V8和GCC出错) - 2

    我正在尝试在我的centos服务器上安装therubyracer,但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e

  4. ruby - 检查数组是否在增加 - 2

    这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife

  5. ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2

    我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案

  6. ruby-on-rails - Ruby 检查日期时间是否为 iso8601 并保存 - 2

    我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby​​是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查

  7. ruby - 检查日期是否在过去 7 天内 - 2

    我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/

  8. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  9. ruby - 是否可以覆盖 gemfile 进行本地开发? - 2

    我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI

  10. ruby - 在 Windows 机器上使用 Ruby 进行开发是否会适得其反? - 2

    这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby​​-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub

随机推荐