我一直都知道 C++ 的丰富抽象会带来一定的计算开销,但我的印象是,一旦应用了正确的编译器优化,这种开销几乎可以忽略不计。我很好奇这种开销到底有多大,所以我编写了一个简单的测试来确定这一点。该测试是一个模板化函数,它接受一个容器变量,为容器中的每个元素分配一个值,然后在一个单独的循环中对整个容器中的值求和。此过程重复预设的循环次数。
我发现,令我相当不安的是, vector 实现花费的时间几乎是标准数组实现的 3 倍。在对大量编译器优化进行排列但没有任何成功后,我决定硬着头皮直接观察汇编代码,看看是什么导致了时间损失。我包含了一些汇编指令,这些指令使我能够准确地查明数组索引操作发生的位置并详细检查了代码。令我完全困惑的是,我发现 vector 实现和数组实现之间的区别是完全微不足道的。汇编代码可见here .
这是我用来构建二进制文件的命令:
g++ -O3 vectorArrayOp.cpp -o vectorArrayOp
这是我用来构建程序集的命令:
g++ -O3 -DTAGASM vectorArrayOp.cpp -S -o vectorArrayOp.s
这是我通过运行二进制文件观察到的输出:
gmurphy@interloper:Reference$ ./vectorArrayOp
Duration 0.027678
Duration 0.090212
当您在 stdout 流中包含计算值时,结果没有改变,为清楚起见,我删除了它们。我的系统规范如下(我在我的 AMD 上也看到了相同的结果):
Linux 3.2.0-32-generic x86_64 GNU/Linux
Intel(R) Xeon(R) CPU X5550 @ 2.67GH
g++ (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3
代码如下,如果有人能提供一些见解,说明为什么在程序集如此相似的情况下时间如此不同,我将不胜感激。
#include <vector>
#include <iostream>
#include <sys/time.h>
#ifdef TAGASM
#define ASMTAG(X) asm(X)
#else
#define ASMTAG(X)
#endif
enum { DataSize=1024, NumTests=(1<<16) } ;
struct ReturnValue {ReturnValue(float _d, int _t):d(_d), t(_t){} float d; int t;} ;
template <typename Container, typename Type>
ReturnValue runTest(Container &c, Type value)
{
int tagValue(0);
timeval startTime;
gettimeofday(&startTime, NULL);
for(int i=0; i<NumTests; i++)
{
for(int j=0; j<DataSize; j++)
{
ASMTAG("preassign");
c [j] = value ;
ASMTAG("postassign");
}
for(int j=0; j<DataSize; j++)
{
ASMTAG("preadd");
tagValue += c [j] ;
ASMTAG("postadd");
}
}
timeval endTime;
gettimeofday(&endTime, NULL);
float duration((endTime.tv_sec-startTime.tv_sec)+
(endTime.tv_usec-startTime.tv_usec)/1000000.0);
//tagValue is returned in case the optimising compiler might try to remove the loops
return ReturnValue(duration, tagValue) ;
}
int main()
{
int *arrayData = new int [DataSize];
std::vector <int> vectorData(DataSize, 0) ;
ReturnValue ad = runTest(arrayData, 1);
ReturnValue vd = runTest(vectorData, 1);
std::cout<<"Duration "<<ad.d<<std::endl;
std::cout<<"Duration "<<vd.d<<std::endl;
delete [] arrayData;
return 0 ;
}
最佳答案
% g++-4.4 -O3 vectorArrayOp.cpp -o vectorArrayOp
% ./vectorArrayOp
Duration 0.008581
Duration 0.008775
% g++-4.5 -O3 vectorArrayOp.cpp -o vectorArrayOp
% ./vectorArrayOp
Duration 0.008634
Duration 0.008588
% g++-4.6 -O3 vectorArrayOp.cpp -o vectorArrayOp
% ./vectorArrayOp
Duration 0.01731
Duration 0.081696
% g++-4.7 -O3 vectorArrayOp.cpp -o vectorArrayOp
% ./vectorArrayOp
Duration 0.008618
Duration 0.008612
% clang++ -O3 vectorArrayOp.cpp -o vectorArrayOp
% ./vectorArrayOp
Duration 0.066484
Duration 0.066435
根据这些结果,这可能是 g++ 4.6 中特定于编译器的性能回归。
关于C++ vector 数组运算符计算成本高?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13238183/
我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
我的代码目前看起来像这样numbers=[1,2,3,4,5]defpop_threepop=[]3.times{pop有没有办法在一行中完成pop_three方法中的内容?我基本上想做类似numbers.slice(0,3)的事情,但要删除切片中的数组项。嗯...嗯,我想我刚刚意识到我可以试试slice! 最佳答案 是numbers.pop(3)或者numbers.shift(3)如果你想要另一边。 关于ruby-多次弹出/移动ruby数组,我们在StackOverflow上找到一
我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
我正在使用puppet为ruby程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,
请帮助我理解范围运算符...和..之间的区别,作为Ruby中使用的“触发器”。这是PragmaticProgrammersguidetoRuby中的一个示例:a=(11..20).collect{|i|(i%4==0)..(i%3==0)?i:nil}返回:[nil,12,nil,nil,nil,16,17,18,nil,20]还有:a=(11..20).collect{|i|(i%4==0)...(i%3==0)?i:nil}返回:[nil,12,13,14,15,16,17,18,nil,20] 最佳答案 触发器(又名f/f)是
我有一个这样的哈希数组:[{:foo=>2,:date=>Sat,01Sep2014},{:foo2=>2,:date=>Sat,02Sep2014},{:foo3=>3,:date=>Sat,01Sep2014},{:foo4=>4,:date=>Sat,03Sep2014},{:foo5=>5,:date=>Sat,02Sep2014}]如果:date相同,我想合并哈希值。我对上面数组的期望是:[{:foo=>2,:foo3=>3,:date=>Sat,01Sep2014},{:foo2=>2,:foo5=>5:date=>Sat,02Sep2014},{:foo4=>4,:dat
我正在尝试在Ruby中制作一个cli应用程序,它接受一个给定的数组,然后将其显示为一个列表,我可以使用箭头键浏览它。我觉得我已经在Ruby中看到一个库已经这样做了,但我记不起它的名字了。我正在尝试对soundcloud2000中的代码进行逆向工程做类似的事情,但他的代码与SoundcloudAPI的使用紧密耦合。我知道cursesgem,我正在考虑更抽象的东西。广告有没有人见过可以做到这一点的库或一些概念证明的Ruby代码可以做到这一点? 最佳答案 我不知道这是否是您正在寻找的,但也许您可以使用我的想法。由于我没有关于您要完成的工作