草庐IT

c++ - 建议编译器有选择地内联函数调用

coder 2024-02-04 原文

假设我有以下代码:

struct Foo {
  void helper() { ... }
  void fast_path() { ...; helper(); ... }
  void slow_path1() { ...; helper(); ... }
  void slow_path2() { ...; helper(); ... }
};

fast_path() 方法对性能至关重要,因此应尽一切(合理的)努力使其尽可能快。 slow_path1()slow_path2() 方法不是性能关键。

根据我的理解,典型的编译器可能会查看此代码并决定不内联 helper() 如果它足够复杂,以减少总指令大小,如 helper( ) 在多个方法函数之间共享。如果慢速路径方法不存在,同一个编译器可能会内联 helper()

鉴于我们期望的性能特征,我们希望编译器将对 helper() 的调用内联到 fast_path() 中,但更喜欢编译器在 中的默认行为slow_path1()slow_path2()

一种解决方法是让慢路径函数定义和对 fast_path() 的调用存在于单独的编译单元中,这样编译器永远不会看到 helper()<>fast_path() 共享。但保持这种分离需要特别小心,不能通过编译器强制执行。此外,文件(Foo.h、FooINLINES.cpp,现在还有 Foo.cpp)的激增是不可取的,而且额外的编译单元使构建原本可能仅包含头文件的库变得复杂。

有没有更好的办法?

理想情况下,我想要一个新的 do_not_inline_function_calls_inside_me c++ 关键字,我可以像这样使用它:

  do_not_inline_function_calls_inside_me void slow_path1() { ... }
  do_not_inline_function_calls_inside_me void slow_path2() { ... }

或者,inline_function_calls_inside_me 关键字,如下所示:

  inline_function_calls_inside_me void fast_path() { ... }

请注意,这些假设的关键字装饰了 *_path*() 方法,而不是 helper() 方法。

您可能有此类性能需求的示例上下文是编程竞赛,其中每个参与者都编写一个应用程序来监听类型 A 和 B 的稀疏全局数据广播。当接收到类型 B 广播时,每个应用程序必须执行根据先前广播的A类消息的顺序进行计算,并将计算结果提交给中央服务器。每个 B 类广播的第一个正确响应者得分。计算问题的性质可能允许对 A 类更新执行预计算;快速完成这些没有任何优势。

最佳答案

一般来说,你不应该试图比编译器更聪明。现代编译器在决定如何内联函数方面做得非常出色,而人类在这方面的推理能力是出了名的差。

根据我的经验,你能做的最好的事情就是将所有相关函数作为 inline 函数放在同一个翻译单元中,这样编译器就可以看到它们的定义并且可以在它认为合适的时候内联它们。然而,是否将给定函数内联给编译器的最终决定权交给编译器,并非常谨慎地使用“强制内联”,除非您有证据表明它在给定情况下具有有益效果。

为了使编译器的工作更轻松,您可以向它提供有关您的程序的附加信息。在 GCC 和 Clang 中,您可以使用 function attributes为此。

struct Foo {
  void helper();
  void fast_path()  __attribute__ ((hot));
  void slow_path1() __attribute__ ((cold));
  void slow_path2() __attribute__ ((cold));
};

inline void Foo::helper()     { … }
inline void Foo::fast_path()  { … }
inline void Foo::slow_path1() { … }
inline void Foo::slow_path2() { … }

这将提示编译器更积极地优化 Foo::fast_path 以提高速度,并优化 Foo::slow_path1Foo::slow_path2缓存占用空间小。如果这些函数中的任何一个调用 Foo::helper,它可以根据具体情况决定是否内联它。 (有关注释的精确效果,请参阅链接手册中的文档。)

提示编译器的更好方法是为它提供实际的分析数据。使用 GCC,您可以使用 -fprofile-generate 选项编译您的程序。这将使用收集配置文件统计信息的代码来检测您的二进制文件。现在用一组有代表性的输入运行你的程序。这样做将创建一个包含收集到的配置文件数据的 *.gcda 文件。现在使用 -fprofile-use 选项重新编译。 GCC 将使用收集到的配置文件信息来确定代码中的哪些路径是热路径以及它们如何相互交互。这种技术被称为配置文件引导优化 (PGO)。

当然,如果您担心此类事情,请首先确保启用适当的优化级别 (-O2)。尤其是大量使用模板的 C+ 代码(即,几乎所有使用标准库或 Boost 的代码)在未经适当优化的情况下编译时会生成非常丑陋的机器代码。还要考虑是否要将 assertion 编译到您的代码中 (-DNDEBUG)。

关于c++ - 建议编译器有选择地内联函数调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34603041/

有关c++ - 建议编译器有选择地内联函数调用的更多相关文章

  1. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  2. ruby - 在没有 sass 引擎的情况下使用 sass 颜色函数 - 2

    我想在一个没有Sass引擎的类中使用Sass颜色函数。我已经在项目中使用了sassgem,所以我认为搭载会像以下一样简单:classRectangleincludeSass::Script::FunctionsdefcolorSass::Script::Color.new([0x82,0x39,0x06])enddefrender#hamlengineexecutedwithcontextofself#sothatwithintemlateicouldcall#%stop{offset:'0%',stop:{color:lighten(color)}}endend更新:参见上面的#re

  3. ruby-on-rails - 在 ruby​​ 中使用 gsub 函数替换单词 - 2

    我正在尝试用ruby​​中的gsub函数替换字符串中的某些单词,但有时效果很好,在某些情况下会出现此错误?这种格式有什么问题吗NoMethodError(undefinedmethod`gsub!'fornil:NilClass):模型.rbclassTest"replacethisID1",WAY=>"replacethisID2andID3",DELTA=>"replacethisID4"}end另一个模型.rbclassCheck 最佳答案 啊,我找到了!gsub!是一个非常奇怪的方法。首先,它替换了字符串,所以它实际上修改了

  4. ruby - 在 Ruby 中有条件地定义函数 - 2

    我有一些代码在几个不同的位置之一运行:作为具有调试输出的命令行工具,作为不接受任何输出的更大程序的一部分,以及在Rails环境中。有时我需要根据代码的位置对代码进行细微的更改,我意识到以下样式似乎可行:print"Testingnestedfunctionsdefined\n"CLI=trueifCLIdeftest_printprint"CommandLineVersion\n"endelsedeftest_printprint"ReleaseVersion\n"endendtest_print()这导致:TestingnestedfunctionsdefinedCommandLin

  5. ruby - 在 Ruby 中按名称传递函数 - 2

    如何在Ruby中按名称传递函数?(我使用Ruby才几个小时,所以我还在想办法。)nums=[1,2,3,4]#Thisworks,butismoreverbosethanI'dlikenums.eachdo|i|putsiend#InJS,Icouldjustdosomethinglike:#nums.forEach(console.log)#InF#,itwouldbesomethinglike:#List.iternums(printf"%A")#InRuby,IwishIcoulddosomethinglike:nums.eachputs在Ruby中能不能做到类似的简洁?我可以只

  6. ruby - 使用 `+=` 和 `send` 方法 - 2

    如何将send与+=一起使用?a=20;a.send"+=",10undefinedmethod`+='for20:Fixnuma=20;a+=10=>30 最佳答案 恐怕你不能。+=不是方法,而是语法糖。参见http://www.ruby-doc.org/docs/ProgrammingRuby/html/tut_expressions.html它说Incommonwithmanyotherlanguages,Rubyhasasyntacticshortcut:a=a+2maybewrittenasa+=2.你能做的最好的事情是:

  7. C51单片机——实现用独立按键控制LED亮灭(调用函数篇) - 2

    说在前面这部分我本来是合为一篇来写的,因为目的是一样的,都是通过独立按键来控制LED闪灭本质上是起到开关的作用,即调用函数和中断函数。但是写一篇太累了,我还是决定分为两篇写,这篇是调用函数篇。在本篇中你主要看到这些东西!!!1.调用函数的方法(主要讲语法和格式)2.独立按键如何控制LED亮灭3.程序中的一些细节(软件消抖等)1.调用函数的方法思路还是比较清晰地,就是通过按下按键来控制LED闪灭,即每按下一次,LED取反一次。重要的是,把按键与LED联系在一起。我打算用K1来作为开关,看了一下开发板原理图,K1连接的是单片机的P31口,当按下K1时,P31是与GND相连的,也就是说,当我按下去时

  8. HBase Region 简介和建议数量&大小 - 2

    Region是HBase数据管理的基本单位,region有一点像关系型数据的分区。region中存储这用户的真实数据,而为了管理这些数据,HBase使用了RegionSever来管理region。Region的结构hbaseregion的大小设置默认情况下,每个Table起初只有一个Region,随着数据的不断写入,Region会自动进行拆分。刚拆分时,两个子Region都位于当前的RegionServer,但处于负载均衡的考虑,HMaster有可能会将某个Region转移给其他的RegionServer。RegionSplit时机:当1个region中的某个Store下所有StoreFile

  9. ruby-on-rails - 将字符串转换为 ruby​​-on-rails 中的函数 - 2

    我需要一个通过输入字符串进行计算的方法,像这样function="(a/b)*100"a=25b=50function.something>>50有什么方法吗? 最佳答案 您可以使用instance_eval:function="(a/b)*100"a=25.0b=50instance_evalfunction#=>50.0请注意,使用eval本质上是不安全的,尤其是当您使用外部输入时,因为它可能包含注入(inject)的恶意代码。另请注意,a设置为25.0而不是25,因为如果它是整数a/b将导致0(整数)。

  10. ruby - 如何计算 Liquid 中的变量 +1 - 2

    我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止,这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。 最佳答案 因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量,我

随机推荐