所以我想看看在比较之前不将一个变量的值复制到另一个变量可以提高程序的性能多少(这将在示例中更好地解释),我注意到一些奇怪的事情。我有这两个代码段:
string a = "";
for (int i = 0; i < 1000000; i++) a += 'a';
for (int i = 0; i < 1000000; i++) {
if ('b' == a.at(i));//compare the two chars directly
}
和
string a = "";
for (int i = 0; i < 100000000; i++) a += 'a';
for (int i = 0; i < 100000000; i++) {
char c = a.at(i);//declare a new variable
if ('b' == c);//compare the char with the newly created variable,
//instead of comparing it to the other char directly
}
我认为第二段的执行时间会更长,因为与第一段相比多声明了一个变量。当我实际为这两个计时时,我发现第二个比第一个花费的时间少。我给它计时了几次,第二个似乎总是比执行时间少 0.13 秒左右。完整代码如下:
#include <string>
#include <iostream>
#include <ctime>
using namespace std;
int main() {
clock_t timer;
string a = "";
string b;
for (int i = 0; i < 100000000; i++)
a += "a";
timer = clock();
for (int i = 0; i < 100000000; i++) {
if ('b'==a.at(i)) b += "a";
}
cout << (clock()-timer)/(float)CLOCKS_PER_SEC << "sec" << endl;
timer = clock();
for (int i = 0; i < 100000000; i++) {
char c = a.at(i);
if ('b'==c) b += "a";
}
cout << (clock()-timer)/(float)CLOCKS_PER_SEC << "sec" << endl;
return 0;
}
为什么会这样?
编辑:我听从了 NathanOliver 的建议,并为每个循环添加了单独的字符串,所以现在代码如下所示:
#include <string>
#include <iostream>
#include <ctime>
using namespace std;
int main() {
clock_t timer;
string compare_string_1 = "";
string compare_string_2 = "";
string segment_1 = "";
string segment_2 = "";
for (int i = 0; i < 100000000; i++)
compare_string_1 += "a";
for (int i = 0; i < 100000000; i++)
compare_string_2 += "a";
timer = clock();
for (int i = 0; i < 100000000; i++) {
if ('b'==compare_string_1.at(i)) segment_1 += "a";
}
cout << (clock()-timer)/(float)CLOCKS_PER_SEC << "sec" << endl;
timer = clock();
for (int i = 0; i < 100000000; i++) {
char c = compare_string_2.at(i);
if ('b'==c) segment_2 += "a";
}
cout << (clock()-timer)/(float)CLOCKS_PER_SEC << "sec" << endl;
return 0;
}
最佳答案
使用 Visual C++ 2010,我得到了与上面评论中相同的计时结果 - 平均而言,第二个循环大约占用第一个循环运行时间的 80%。一两次,第一个循环有点快,但这可能是由于操作系统中的一些线程问题。检查反汇编结果如下:
第一个循环:
01231120 cmp dword ptr [ebp-38h],esi
01231123 jbe main+1CBh (123120Bh)
01231129 cmp dword ptr [ebp-34h],10h
0123112D mov eax,dword ptr [ebp-48h]
01231130 jae main+0F5h (1231135h)
01231132 lea eax,[ebp-48h]
01231135 cmp byte ptr [eax+esi],62h
01231139 jne main+108h (1231148h)
0123113B mov ebx,1
01231140 lea eax,[ebp-80h]
01231143 call std::basic_string<char,std::char_traits<char>,std::allocator<char> >::append (1231250h)
01231148 inc esi
01231149 cmp esi,5F5E100h
0123114F jl main+0E0h (1231120h)
第二个循环:
01231155 cmp dword ptr [ebp-1Ch],esi
01231158 jbe main+1CBh (123120Bh)
0123115E cmp dword ptr [ebp-18h],10h
01231162 mov eax,dword ptr [ebp-2Ch]
01231165 jae main+12Ah (123116Ah)
01231167 lea eax,[ebp-2Ch]
0123116A cmp byte ptr [eax+esi],62h
0123116E jne main+13Dh (123117Dh)
01231170 mov ebx,1
01231175 lea eax,[ebp-64h]
01231178 call std::basic_string<char,std::char_traits<char>,std::allocator<char> >::append (1231250h)
0123117D inc esi
0123117E cmp esi,5F5E100h
01231184 jl main+115h (1231155h)
由于生成的程序集看起来或多或少相同,我想到了操作系统或 CPU 中的节流机制,你猜怎么着? 在两个循环之间添加 Sleep(5000); 导致第二个循环(几乎)总是比第一个循环慢。运行 20 次后,第二个循环平均花费了第一个循环运行时间的 150%。
编辑: 将自旋计数增加五倍会得到相同的结果。我假设大约 0.5 秒的运行时间或多或少是可以可靠测量的。 :-)
在原始代码中,我认为,操作系统可能需要一些时间片来检测 CPU 负载,然后在调度期间开始给予线程更多优先级,CPU 也可能会在 while 之后提升,从而使第一个循环的部分“未提升” ”。当第二个循环开始执行时,操作系统/CPU 可能会为繁重的工作负载做好准备并执行得更快一些。 MMU 或操作系统内部内存页面处理也会发生同样的情况。 在循环之间添加 sleep 时,可能会发生相反的情况,导致操作系统将线程搁置一段时间,直到最终检测到新的工作负载,从而使第二个循环的执行速度稍慢。
你的结果是什么?是否有人手头有合适的分析器(如英特尔放大器)来测量循环内的 CPI 率和 CPU 速度步进?
关于c++ - 两个代码段之间执行时间的奇怪差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37680729/
我在使用omniauth/openid时遇到了一些麻烦。在尝试进行身份验证时,我在日志中发现了这一点:OpenID::FetchingError:Errorfetchinghttps://www.google.com/accounts/o8/.well-known/host-meta?hd=profiles.google.com%2Fmy_username:undefinedmethod`io'fornil:NilClass重要的是undefinedmethodio'fornil:NilClass来自openid/fetchers.rb,在下面的代码片段中:moduleNetclass
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby
在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has
exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby中使用两个参数异步运行exe吗?我已经尝试过ruby命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe,无需等待进程完成是否有任何rubygems会支持我的问题? 最佳答案 您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除
我构建了两个需要相互通信和发送文件的Rails应用程序。例如,一个Rails应用程序会发送请求以查看其他应用程序数据库中的表。然后另一个应用程序将呈现该表的json并将其发回。我还希望一个应用程序将存储在其公共(public)目录中的文本文件发送到另一个应用程序的公共(public)目录。我从来没有做过这样的事情,所以我什至不知道从哪里开始。任何帮助,将不胜感激。谢谢! 最佳答案 无论Rails是什么,几乎所有Web应用程序都有您的要求,大多数现代Web应用程序都需要相互通信。但是有一个小小的理解需要你坚持下去,网站不应直接访问彼此
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
我遵循了教程http://gettingstartedwithchef.com/,第1章。我的运行list是"run_list":["recipe[apt]","recipe[phpap]"]我的phpapRecipe默认Recipeinclude_recipe"apache2"include_recipe"build-essential"include_recipe"openssl"include_recipe"mysql::client"include_recipe"mysql::server"include_recipe"php"include_recipe"php::modul
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
在Cooper的书BeginningRuby中,第166页有一个我无法重现的示例。classSongincludeComparableattr_accessor:lengthdef(other)@lengthother.lengthenddefinitialize(song_name,length)@song_name=song_name@length=lengthendenda=Song.new('Rockaroundtheclock',143)b=Song.new('BohemianRhapsody',544)c=Song.new('MinuteWaltz',60)a.betwee