草庐IT

c++ - 很少执行且几乎为空的 if 语句大大降低了 C++ 中的性能

coder 2023-05-02 原文

编者澄清:最初发布时,有两个问题:

  • 如果添加看似无关紧要的语句,测试性能将下降三倍
  • 完成测试所需的时间似乎随机变化

  • 第二个问题已经解决:只有在调试器下运行时才会出现随机性。

    这个问题的其余部分应该被理解为关于上面的第一个要点,并且在 VC++ 2010 Express 的 Release模式中运行的上下文中优化了“最大化速度”和“支持快速代码”。

    评论部分还有一些评论在谈论第二点,但现在可以忽略它们。

    我有一个模拟,如果我在运行实际模拟的 while 循环中添加一个简单的 if 语句,性能会下降大约三倍(并且我在 while 循环中运行了大量计算,太阳能的 n 体重力system 除了其他事情)即使 if 语句几乎从未执行过:
    if (time - cb_last_orbital_update > 5000000)
    {
        cb_last_orbital_update = time;
    }
    

    timecb_last_orbital_update都是 double 类型并定义在 main 函数的开头,这个 if 语句也是如此。通常我也想在那里运行一些计算,但是如果我删除它们也没有什么区别。上面的 if 语句对性能有相同的影响。

    变量 time是模拟时间,它在开始时以 0.001 步增加,因此在第一次执行 if 语句之前需要很长时间(我还包括打印一条消息以查看它是否正在执行,但事实并非如此,或者至少只有在它应该这样做的时候)。无论如何,即使在模拟的前几分钟,当它还没有被执行一次时,性能也会下降 3 倍。如果我注释掉这一行
    cb_last_orbital_update = time;
    

    然后它再次运行得更快,所以它不是检查
    time - cb_last_orbital_update > 5000000
    

    或者,这绝对是将当前模拟时间写入此变量的简单操作。

    另外,如果我将当前时间写入另一个变量而不是 cb_last_orbital_update ,性能不下降。因此,这可能是将新值分配给用于检查是否应执行“if”的变量的问题?不过,这些都是在黑暗中拍摄的。

    免责声明:我对编程很陌生,对所有这些文字感到抱歉。

    我正在使用 Visual C++ 2010 Express,停用 stdafx.h预编译头函数也没有任何区别。

    编辑:程序的基本结构。请注意,除了 while 循环的末尾( time += time_interval; )之外,没有其他地方是 time改变了。另外,cb_last_orbital_update仅出现 3 次:声明/初始化,加上导致问题的 if 语句中的两次。
    int main(void)
    {
        ...
        double time = 0;
        double time_interval = 0.001;
        double cb_last_orbital_update = 0;
    
        F_Rocket_Preset(time, time_interval, ...);
    
        while(conditions)
        {
        Rocket[active].Stage[Rocket[active].r_stage].F_Update_Stage_Performance(time, time_interval, ...);
        Rocket[active].F_Calculate_Aerodynamic_Variables(time);
        Rocket[active].F_Calculate_Gravitational_Forces(cb_mu, cb_pos_d, time);
        Rocket[active].F_Update_Rotation(time, time_interval, ...);
        Rocket[active].F_Update_Position_Velocity(time_interval, time, ...);
        Rocket[active].F_Calculate_Orbital_Elements(cb_mu);
        F_Update_Celestial_Bodies(time, time_interval, ...);
    
        if (time - cb_last_orbital_update > 5000000.0)
        {
            cb_last_orbital_update = time;
        }
    
        Rocket[active].F_Check_Apoapsis(time, time_interval);
        Rocket[active].F_Status_Check(time, ...);
        Rocket[active].F_Update_Mass (time_interval, time);
        Rocket[active].F_Staging_Check (time, time_interval);
    
        time += time_interval;
    
        if (time > 3.1536E8)
        {
            std::cout << "\n\nBreak main loop! Sim Time: " << time << std::endl;
            break;
        }
        }
    ...
    }
    

    编辑2:

    Here是汇编代码的区别。左边是带线的快速代码
    cb_last_orbital_update = time;
    

    outcommented,在右边慢代码与行。

    编辑 4:

    所以,我找到了一个到目前为止似乎工作正常的解决方法:
    int cb_orbit_update_counter = 1; // before while loop
    
    if(time - cb_orbit_update_counter * 5E6 > 0)
    {
        cb_orbit_update_counter++;
    }
    

    编辑 5:

    虽然该解决方法确实有效,但它只能与使用 __declspec(noinline) 结合使用。 .我只是再次从函数声明中删除了那些,看看是否会改变任何东西,确实如此。

    编辑 6:对不起,这让人困惑。我在删除 __declspec(noinline) 时找到了导致性能下降的罪魁祸首这个函数,在 if 中执行:
    __declspec(noinline) std::string F_Get_Body_Name(int r_body)
    {
    switch (r_body)
    {
    case 0:
        {
            return ("the Sun");
        }
    case 1:
        {
            return ("Mercury");
        }
    case 2:
        {
            return ("Venus");
        }
    case 3:
        {
            return ("Earth");
        }
    case 4:
        {
            return ("Mars");
        }
    case 5:
        {
            return ("Jupiter");
        }
    case 6:
        {
            return ("Saturn");
        }
    case 7:
        {
            return ("Uranus");
        }
    case 8:
        {
            return ("Neptune");
        }
    case 9:
        {
            return ("Pluto");
        }
    case 10:
        {
            return ("Ceres");
        }
    case 11:
        {
            return ("the Moon");
        }
    default:
        {
            return ("unnamed body");
        }
    }
    
    }
    
    if现在也不仅仅是增加计数器:
    if(time - cb_orbit_update_counter * 1E7 > 0)
    {
        F_Update_Orbital_Elements_Of_Celestial_Bodies(args);
        std::cout << F_Get_Body_Name(3) << " SMA: " << cb_sma[3] << "\tPos Earth: " << cb_pos_d[3][0] << " / " << cb_pos_d[3][1] << " / " << cb_pos_d[3][2] <<
        "\tAlt: " << sqrt(pow(cb_pos_d[3][0] - cb_pos_d[0][0],2) + pow(cb_pos_d[3][1] - cb_pos_d[0][1],2) + pow(cb_pos_d[3][2] - cb_pos_d[0][2],2)) << std::endl;
        std::cout << "Time: " << time << "\tcb_o_h[3]: " << cb_o_h[3] << std::endl;
        cb_orbit_update_counter++;
    }
    

    我删除 __declspec(noinline)来自函数 F_Get_Body_Name单独,代码变慢。同样,如果我删除此函数的执行或添加 __declspec(noinline)再次,代码运行得更快。所有其他功能仍有 __declspec(noinline) .

    编辑 7:
    所以我改变了开关功能
    const std::string cb_names[] = {"the Sun","Mercury","Venus","Earth","Mars","Jupiter","Saturn","Uranus","Neptune","Pluto","Ceres","the Moon","unnamed body"}; // global definition
    const int cb_number = 12; // global definition
    
    std::string F_Get_Body_Name(int r_body)
    {
    if (r_body >= 0 && r_body < cb_number)
    {
        return (cb_names[r_body]);
    }
    else
    {
        return (cb_names[cb_number]);
    }
    }
    

    并且还使代码的另一部分更纤薄。该程序现在运行速度很快,没有任何 __declspec(noinline) .正如ElderBug所建议的那样,CPU指令缓存有问题/代码变得太大了吗?

    最佳答案

    我会把钱花在英特尔的分支预测器上。 http://en.wikipedia.org/wiki/Branch_predictor

    处理器假设 (time - cb_last_orbital_update > 5000000) 大部分时间为假,并相应地加载执行管道。

    一旦条件(时间 - cb_last_orbital_update > 5000000)成立。错误预测的延迟正在打击你。您可能会丢失 10 到 20 个周期。

    if (time - cb_last_orbital_update > 5000000)
    {
        cb_last_orbital_update = time;
    }
    

    关于c++ - 很少执行且几乎为空的 if 语句大大降低了 C++ 中的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29079984/

    有关c++ - 很少执行且几乎为空的 if 语句大大降低了 C++ 中的性能的更多相关文章

    1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    2. ruby - 其他文件中的 Rake 任务 - 2

      我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

    3. ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2

      作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代

    4. ruby-on-rails - Rails 3 中的多个路由文件 - 2

      Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

    5. ruby-openid:执行发现时未设置@socket - 2

      我在使用omniauth/openid时遇到了一些麻烦。在尝试进行身份验证时,我在日志中发现了这一点:OpenID::FetchingError:Errorfetchinghttps://www.google.com/accounts/o8/.well-known/host-meta?hd=profiles.google.com%2Fmy_username:undefinedmethod`io'fornil:NilClass重要的是undefinedmethodio'fornil:NilClass来自openid/fetchers.rb,在下面的代码片段中:moduleNetclass

    6. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

      我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

    7. ruby-on-rails - 如果为空或不验证数值,则使属性默认为 0 - 2

      我希望我的UserPrice模型的属性在它们为空或不验证数值时默认为0。这些属性是tax_rate、shipping_cost和price。classCreateUserPrices8,:scale=>2t.decimal:tax_rate,:precision=>8,:scale=>2t.decimal:shipping_cost,:precision=>8,:scale=>2endendend起初,我将所有3列的:default=>0放在表格中,但我不想要这样,因为它已经填充了字段,我想使用占位符。这是我的UserPrice模型:classUserPrice回答before_val

    8. ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2

      我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer

    9. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

      我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

    10. ruby-on-rails - Rails 应用程序中的 Rails : How are you using application_controller. rb 是新手吗? - 2

      刚入门rails,开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗?有哪些用例。您如何为Rails应用程序使用应用程序Controller?我不想在那里放太多代码,因为据我了解,每个请求都会调用此Controller。这是真的? 最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度,尽管在某些情况下ApplicationContr

    随机推荐