草庐IT

c++ - C和C++中的编译器优化和临时分配

coder 2023-11-13 原文

请查看以下在C和C++中有效的代码:

extern int output;
extern int input;
extern int error_flag;

void func(void)
{
  if (0 != error_flag)
  {
    output = -1;
  }
  else
  {
    output = input;
  }
}
  • 是否允许编译器以与下面类似的方式编译上面的代码?
    extern int output;
    extern int input;
    extern int error_flag;
    
    void func(void)
    {
      output = -1;
      if (0 == error_flag)
      {
        output = input;
      }
    }
    

    换句话说,是否允许编译器生成(从第一个片段开始)始终向output临时分配-1的代码,然后根据input状态将output值分配给error_flag
  • 如果将output声明为volatile,将允许编译器执行此操作吗?
  • 如果将output声明为atomic_int(stdatomic.h),将允许编译器执行此操作吗?

  • David Schwartz发表评论后更新:

    如果编译器可以自由地向变量添加其他写操作,则似乎无法从C代码中判断是否存在数据竞争。如何确定呢?

    最佳答案

  • 是的,可以进行推测性分配。非 volatile 变量的修改不是程序可观察到的行为的一部分,因此允许伪写。 (有关“可观察的行为”的定义,请参见下文,它实际上并不包括您可能会观察到的所有行为。)
  • 否。如果outputvolatile,则不允许进行推测性或虚假的突变,因为该突变是可观察到的行为的一部分。 (向硬件寄存器写信息或从中读取信息可能不仅会存储值,还会带来其他后果。这是volatile的主要用例之一。)
  • (编辑)否,atomic output无法进行推测性分配。 atomic变量的加载和存储是同步操作,因此应该不可能加载未明确存储到该变量中的此类变量的值。

  • 可观察的行为

    尽管程序可以执行很多明显的操作(例如,由于段错误而突然终止),但是C和C++标准仅保证有限的结果集。可观察到的行为在C11草案的第5.1.2.3p6节和当前C++ 14草案的第1.9p8节[intro.execution]中定义,措辞非常相似:

    The least requirements on a conforming implementation are:

    — Access to volatile objects are evaluated strictly according to the rules of the abstract machine.

    — At program termination, all data written into files shall be identical to one of the possible results that execution of the program according to the abstract semantics would have produced.

    — The input and output dynamics of interactive devices shall take place in such a fashion that prompting output is actually delivered before a program waits for input. What constitutes an interactive device is implementation-defined.

    These collectively are referred to as the observable behavior of the program.



    以上摘自C++标准; C标准的不同之处在于,第二点不允许出现多种可能的结果,第三点明确引用了标准库要求的相关部分。除了细节之外,定义是相互协调的。就此问题而言,相关的一点是只能观察到 volatile 变量(直到将非 volatile 变量的值发送到输出设备或文件为止)。

    数据竞赛

    还应在C和C++标准的整体上下文中阅读此段落,如果程序产生不确定的行为,则它们会将实现从所有要求中解放出来。这就是为什么在上面的可观察到的行为的定义中不考虑段错误的原因:段错误是可能的未定义行为,但在一致性程序中不是可能的行为。因此,在只有一致的程序和一致的实现的世界中,没有段错误。

    这很重要,因为具有数据争用的程序不符合要求。数据争用具有不确定的行为,即使它看起来是无害的也是如此。并且由于程序员有责任避免未定义的行为,因此实现可以在不考虑数据竞争的情况下进行优化。

    在C和C++标准中对内存模型的说明是密集和技术性的,可能不适合作为概念的介绍。 (浏览Hans Boehm's site上的 Material 可能会变得困难一些。)从标准中提取报价是有风险的,因为细节很重要。但是,与当前的C++ 14标准§1.10[intro.multithread]相比,这是一个小小的飞跃:

    1. Two expression evaluations conflict if one of them modifies a memory location and the other one reads or modifies the same memory location.

    1. Two actions are potentially concurrent if

      — they are performed by different threads, or

      — they are unsequenced, and at least one is performed by a signal handler.

      The execution of a program contains a data race if it contains two potentially concurrent conflicting actions, at least one of which is not atomic, and neither happens before the other, except for the special case for signal handlers described below. Any such data race results in undefined behavior.



    这里的要点是,必须同步读取和写入同一变量;否则,这是一场数据争夺,其结果是不确定的行为。一些程序员可能会反对这种禁止的严格性,认为某些数据竞争是“良性的”。这是Hans Boehm's 2011 HotPar paper "How to miscompile programs with "benign" data races" (pdf)(作者的摘要:“没有良性的数据竞争”)的主题,他向我解释了所有这些。

    此处的同步包括对atomic类型的使用,因此并发读取和修改atomic变量不是数据竞争。 (读取的结果是不可预测的,但它必须是修改前的值或修改后的值。)这可防止编译器在没有进行任何显式同步的情况下对原子变量执行“逐项”修改。

    经过一番思考和更多研究,我的结论是,编译器也无法对原子变量执行推测性写入。因此,我修改了对问题3的回答,该问题本来是我回答“否”的。

    其他有用的引用资料:
  • Bartosz Milewski:Dealing with Benign Data Races the C++ Way

    Milewski处理对原子变量的推测性写操作的精确问题,并得出以下结论:

    Can’t the compiler still do the same dirty trick, and momentarily store 42 in the owner variable? No, it can’t! Since the variable is declared atomic the compiler can no longer assume that the write can’t be observed by other threads.

  • Thread Safety and Synchronization上的草药萨特

    与往常一样,提供易于访问且写得很好的解释。

    关于c++ - C和C++中的编译器优化和临时分配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34863148/

    有关c++ - C和C++中的编译器优化和临时分配的更多相关文章

    1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    2. ruby - 其他文件中的 Rake 任务 - 2

      我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

    3. ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2

      作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代

    4. ruby-on-rails - Rails 3 中的多个路由文件 - 2

      Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

    5. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

      我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

    6. ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2

      我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer

    7. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

      我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

    8. ruby-on-rails - Rails 应用程序中的 Rails : How are you using application_controller. rb 是新手吗? - 2

      刚入门rails,开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗?有哪些用例。您如何为Rails应用程序使用应用程序Controller?我不想在那里放太多代码,因为据我了解,每个请求都会调用此Controller。这是真的? 最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度,尽管在某些情况下ApplicationContr

    9. Ruby Koans about_array_assignment - 非平行与平行分配歧视 - 2

      通过ruby​​koans.com,我在about_array_assignment.rb中遇到了这两段代码你怎么知道第一个是非并行赋值,第二个是一个变量的并行赋值?在我看来,除了命名差异之外,代码几乎完全相同。4deftest_non_parallel_assignment5names=["John","Smith"]6assert_equal["John","Smith"],names7end45deftest_parallel_assignment_with_one_variable46first_name,=["John","Smith"]47assert_equal'John

    10. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

      我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

    随机推荐