我经常看到将整数转换为 double 整数再转换为 double 整数的代码(有时是有充分理由的,有时不是),我突然想到这似乎是我程序中的“隐藏”成本。我们假设转换方法是截断。
那么,它到底有多贵?我确信它会因硬件而异,所以让我们假设一个新的英特尔处理器(Haswell,如果你愿意,尽管我会接受任何东西)。我会感兴趣的一些指标(尽管一个好的答案不需要全部):
我还假设,考虑到我们每秒可以执行的计算量相对于数据量的差异,我们最能感受到转换速度慢的影响的方式是功耗而不是执行速度实际上可以每秒到达CPU。
最佳答案
这是我自己可以挖掘的,对于 x86-64 使用 SSE2 进行 FP 数学(而不是旧版 x87,其中更改 C++ 截断语义的舍入模式很昂贵):
当我take a look at the generated assembly从 clang 和 gcc 来看,它看起来像是将 int 转换为 double,它归结为一条指令:cvttsd2si。
从 double 到 int 是 cvtsi2sd。 (cvtsi2sdl cvtsi2sd 的 AT&T 语法,具有 32 位操作数大小。)
通过自动矢量化,我们得到 cvtdq2pd。
所以我想问题变成了:那些的成本是多少?
这些指令的每条指令的成本大约与一个 FP addsd 加上一个 movq xmm, r64 (fp <- integer)="" 或="">->movq r64, xmm(整数 <- fp),因为它们在主流(sandybridge/haswell/sklake)英特尔="" cpu="" 上解码为="" 2="">->
Intel® 64 and IA-32 Architectures Optimization Reference Manual表示 cvttsd2si 指令的成本是 5 延迟(参见附录 C-16)。 cvtsi2sd 的延迟取决于您的架构,从 Silvermont 的 1 到其他几种架构的 7-16 不等。
Agner Fog's instruction tables有更准确/合理的数字,例如 Silvermont 上 cvtsi2sd 的 5 周期延迟(每 2 个时钟吞吐量 1 个),或 Haswell 上的 4c 延迟,每个时钟吞吐量一个(如果您避免依赖目标寄存器与旧的上半部分合并,就像 gcc 通常与 pxor xmm0,xmm0 一样)。
SIMD packed-float to packed-int 很棒;单片机。但是转换为 double 需要随机播放来更改元素大小。 SIMD float/double<->int64_t 直到 AVX512 才存在,但可以在有限范围内手动完成。
英特尔的手册将延迟定义为:“执行内核完成执行构成指令的所有微操作所需的时钟周期数。”但更有用的定义是从输入就绪到输出就绪的时钟数。如果有足够的并行性让乱序执行完成其工作,吞吐量比延迟更重要:What considerations go into predicting latency for operations on modern superscalar processors and how can I calculate them by hand? .
->同样的英特尔手册说,一个整数 add 指令的延迟时间为 1,而整数 imul 的延迟时间为 3(附录 C-27)。 FP addsd 和 mulsd 在 Skylake 上以每时钟 2 个吞吐量运行,具有 4 个周期延迟。 SIMD 版本和 FMA 版本相同,具有 128 位或 256 位 vector 。
在 Haswell 上,addsd/addpd 每时钟吞吐量只有 1 个,但由于专用的 FP-add 单元,延迟为 3 个周期。
所以,答案归结为:
1) 它经过硬件优化,编译器利用硬件机制。
2) 就一个方向的周期数而言,它的成本仅比乘法多一点,而另一个方向的数量变化很大(取决于您的架构)。它的成本既不是免费的,也不是荒谬的,但考虑到编写代码的容易程度并以一种不明显的方式产生成本,它可能值得更多关注。
关于c++ - 在 int 和 double 之间转换有多贵?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28668348/
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]
这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[
我构建了两个需要相互通信和发送文件的Rails应用程序。例如,一个Rails应用程序会发送请求以查看其他应用程序数据库中的表。然后另一个应用程序将呈现该表的json并将其发回。我还希望一个应用程序将存储在其公共(public)目录中的文本文件发送到另一个应用程序的公共(public)目录。我从来没有做过这样的事情,所以我什至不知道从哪里开始。任何帮助,将不胜感激。谢谢! 最佳答案 无论Rails是什么,几乎所有Web应用程序都有您的要求,大多数现代Web应用程序都需要相互通信。但是有一个小小的理解需要你坚持下去,网站不应直接访问彼此
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
在Cooper的书BeginningRuby中,第166页有一个我无法重现的示例。classSongincludeComparableattr_accessor:lengthdef(other)@lengthother.lengthenddefinitialize(song_name,length)@song_name=song_name@length=lengthendenda=Song.new('Rockaroundtheclock',143)b=Song.new('BohemianRhapsody',544)c=Song.new('MinuteWaltz',60)a.betwee
我正在检查一个Rails项目。在ERubyHTML模板页面上,我看到了这样几行:我不明白为什么不这样写:在这种情况下,||=和ifnil?有什么区别? 最佳答案 在这种特殊情况下没有区别,但可能是出于习惯。每当我看到nil?被使用时,它几乎总是使用不当。在Ruby中,很少有东西在逻辑上是假的,只有文字false和nil是。这意味着像if(!x.nil?)这样的代码几乎总是更好地表示为if(x)除非期望x可能是文字false。我会将其切换为||=false,因为它具有相同的结果,但这在很大程度上取决于偏好。唯一的缺点是赋值会在每次运行
我正在使用Rails构建一个简单的聊天应用程序。当用户输入url时,我希望将其输出为html链接(即“url”)。我想知道在Ruby中是否有任何库或众所周知的方法可以做到这一点。如果没有,我有一些不错的正则表达式示例代码可以使用... 最佳答案 查看auto_linkRails提供的辅助方法。这会将所有URL和电子邮件地址变成可点击的链接(htmlanchor标记)。这是文档中的代码示例。auto_link("Gotohttp://www.rubyonrails.organdsayhellotodavid@loudthinking.
我收到格式为的回复#我需要将其转换为哈希值(针对活跃商家)。目前我正在遍历变量并执行此操作:response.instance_variables.eachdo|r|my_hash.merge!(r.to_s.delete("@").intern=>response.instance_eval(r.to_s.delete("@")))end这有效,它将生成{:first="charlie",:last=>"kelly"},但它似乎有点hacky和不稳定。有更好的方法吗?编辑:我刚刚意识到我可以使用instance_variable_get作为该等式的第二部分,但这仍然是主要问题。