PERFORMANCE

c++ - 如何使用逗号性能改进格式化数字？

我正在使用以下方法用逗号格式化数字:templatestaticstd::stringFormatNumberWithCommas(Tvalue,intnumberOfDecimalPlaces=0){std::stringstreamss;ss.imbue(std::locale(""));ss.precision(numberOfDecimalPlaces);ss分析显示此方法相对于其他代码要花费大量时间。具体来说，探查器已经确定了这一行:ss.imbue(std::locale(""));在其中我认为是std::locale("")花费了很长时间。我怎样才能提高这个方法的性能？如

amp 改进 section code std c++performance optimization stringstream

c++ - 下降循环比上升循环更有效吗？

这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Isitfastertocountdownthanitistocountup?我正在阅读一本名为C++forYou++的C++书籍.(我有1998年版。)在关于蒙特卡洛方法的章节中有一段用于计算定积分的代码:for(n=nPoints;n>0;n--){//Aloopthatgoesdowntox=a+double(rand())*((b-a)/RAND_MAX);//0isslightlymoreefficient.y=......//if(y我的问题不是关于代码，而是关于评论:Aloopthatgoesd

amp 43 section blockquote count c++performance loops

c++ - 虚函数调用始终比普通函数调用更快。为什么？

我编写了以下程序来测试虚拟功能在我的机器上的开销:#include#include#defineNUM_ITER10000000000//5seconds=1000000000staticvolatileintglobal_a;voidspin(){inta=global_a;intb=a*a;intc=a+5;intd=a^b^c;global_a=b*d;}structA{virtualvoida()=0;};structB:A{virtualvoida(){spin();}};structC:A{virtualvoida(){spin();}};voidrun_A1(A*a){a

amp 43 code section lt c++performance virtual-functions

c++ - 使用函数调用初始化静态全局数据(在编译时)

我试图通过在编译时计算数字序列并将它们存储为静态vector来节省计算时间(但我现在可能会满足于在运行时开始时计算一次)。我正在尝试做的一个简单(非编译)示例是:#includeusingnamespacestd;staticvector>STATIC_THING(4,vector(4));voidGenerator(intx,inty,vector*output){//Heavycomputinggoesherefor(inti=0;i除了预先计算并将我的序列硬编码到数组中，还有其他方法可以让编译器对此进行提升吗？我觉得应该有一种方法至少可以在头文件的第一个#include中完成此操

amp 43 section int vector c++performance static

读取标准输入的 C++ 最快的 cin？

我在Linux上使用cachegrind分析了一个计算量大的C++程序。令人惊讶的是，事实证明我的程序的瓶颈不在于任何排序或计算方法......而是在于读取输入。这是cachegrind的屏幕截图，以防我错误地解释分析器结果(参见scanf()):我希望我说的是对的scanf()占用了我80.92%的运行时间。我使用cin>>int_variable_here读取输入，像这样:std::ios_base::sync_with_stdio(false);//SupposedlymakesI/Ofastercin>>NumberOfCities;cin>>NumberOfOldRoads;

amp 最快 code strong section c++performance

c++ - std::next_permutation Implementation Explanation 似乎有点低效？

我很好奇std:next_permutation是如何实现的，所以我提取了gnulibstdc++4.7版本并清理了标识符和格式以生成以下演示...#include#include#includeusingnamespacestd;templateboolnext_permutation(Itbegin,Itend){if(begin==end)returnfalse;Iti=begin;++i;if(i==end)returnfalse;i=end;--i;while(true){Itj=i;--i;if(*iintmain(){vectorv={1,2,3,4};do{for(in

低效 next_permutation section lt c++permutation performance stl-algorithm

c++ - 循环展开有利的条件以及返回率下降的点？

有人可以先解释一下展开循环(在C/C++中)在什么时候成为有用的优化吗？其次，联系第一个问题，什么时候不应该再展开了？是否应该始终将展开操作分成2的幂次方的批处理？还是跟你的CPU可以进行多少计算有关？比率是缓存行大小的倍数？等等例如，如果我有一个从0到99的for循环，哪个更好/我如何确定哪个(除了反复试验)-是否有科学方法:0到49和每个循环两个“操作”每个循环0到24和四个“操作”每个循环0到19和五个“操作”每个循环0到9和十个“操作” 最佳答案我不能让关于循环展开的问题在这么长时间内无人回答而不提及Duff'sDevic

有利 amp section mask 的 c++c performance optimization compiler-construction

c++ - Windows 和 OSX 之间 iostream 控制台输出的性能差异？

给定以下非常简单的for循环:intmain(void){for(inti=0;i使用Microsoftvisualstudio2012在干净的Windows8专业版上运行此代码每100k次打印大约需要15秒。在macosx上，使用同一台计算机，xcode仅需3秒即可输出1条铣线。我几乎100%确定它与性能无关，它只是与输出机制或其他相关的东西。有人可以证实这一点吗？只是想知道我的window和VisualStudio都很好。最佳答案这取决于外部因素。就像正在使用的终端应用程序。例如，在OSX和Linux上，您可以绕过终端并使用

amp iostream section 卡住 stackoverflow c++performance visual-studio-2012 console-application

c++ - 该程序在 main() 上的 'return;' 之后需要很长时间才能关闭

这是我正在处理的代码:#include#includeusingnamespacestd;staticunsignedlongcollatzLength(unsignedlongn){staticstd::mapcollatzMap;intmapResult=collatzMap[n];if(mapResult!=0)returnmapResult;if(n==1){return1;}else{collatzMap[n]=1+collatzLength(n%2==0?n/2:3*n+1);returncollatzMap[n];}}intmain(){intmaxIndex=1;uns

长时 amp section lt unsigned c++performance destructor

java - 调用链函数会产生开销吗？

调用函数链是否有开销？例如，在下面的for循环中:for(inti=0;i第一个比第二个效率低吗？var=object.method1().method2();for(inti=0;i我关心的是函数调用/返回是否有开销，而不是函数在内部做了什么。谢谢。最佳答案您的两个代码段在功能上并不等同。您的原始问题被标记为c++/Java，所以让我们继续吧。功能语言可能会以不同的方式对待它。一般来说，第二个版本更快，因为method1().method2()只需要调用一次。在C++和Java中，编译器很难确定调用method1().meth

java 调用 method section code c++performance method-chaining

187 188 189190191 192 193