草庐IT

PERFORMANCE

全部标签

c++ - 大型缓冲区与大型静态缓冲区,有优势吗?

考虑以下代码。在1000次连续执行中,DoSomething1()是否比DoSomething2()更快?我会假设如果我在哪里调用DoSomething1()1000次它会比调用DoSomething2()1000次更快。将我所有的大缓冲区设为静态有什么缺点吗?#defineMAX_BUFFER_LENGTH1024*5voidDoSomething1(){staticcharbuf[MAX_BUFFER_LENGTH];memset(buf,0,MAX_BUFFER_LENGTH);}voidDoSomething2(){charbuf[MAX_BUFFER_LENGTH];mems

c++ - 晚声明变量是不是更有效率?

延迟声明变量是否需要更多内存或计算效率?例子:intx;code.....xisabletobeusedinallthiscode.actuallyusedhere.end对比code.....intx;actuallyusedhere.end谢谢。 最佳答案 写下逻辑上最有意义的内容(通常更接近使用)。编译器可以并且将会发现这样的事情并生成对您的目标体系结构最有意义的代码。您的时间远比尝试猜测编译器和处理器缓存的交互更有值(value)。例如在x86上这个程序:#includeintmain(){for(intj=0;j相比于:#

c++ - 与默认 IF 相比,简写 IF 是否会提高效率?

如果我有一个包含任意长度整数的大型数据文件,需要按它的第二个字段进行排序:13451457-134567124583941384-193819483848089-1485001048018401039888//considerthisisaLARGEfile,thedatagoesonforquitesometime我呼吁qsort成为我的首选武器,在我的排序函数中,使用速记IF是否会显着提高数据排序所需的总时间?还是简写IF只是为了方便组织代码?num2=atoi(Str);num1=atoi(Str2);LoggNum=(num2>num1)?num2:num1;//faster?

c++ - 通过重新排序优化分支

我有这种C函数——它被调用了无数次:voidfoo(){if(/*condition*/){}elseif(/*another_condition*/){}elseif(/*another_condition_2*/){}/*Andsoon,Ihave4ofthem,butwecangeneralizeit*/else{}}我有一个很好的测试用例调用这个函数,导致某些if分支比其他分支被调用更多。我的目标是找到安排if语句以最小化分支的最佳方式。我能想到的唯一方法是为分支到的每个if条件写入一个文件,从而创建一个直方图。这似乎是一种乏味的方式。有没有更好的方法、更好的工具?我在AS3L

c++ - while 比 for 快吗?

在主题中,我在学校学到,循环for比循环while快,但有人告诉我while是更快。我必须优化程序,我想写while而不是for,但我担心它会更慢?例如我可以改变for循环:for(inti=0;i进入while循环:i=0;while(i 最佳答案 标准要求(§6.5.3/1):Theforstatementfor(for-init-statementconditionopt;expressionopt)statementisequivalentto{for-init-statementwhile(condition){state

c++ - 多线程我的程序的负加速

在配备英特尔奔腾双核处理器T2370(AcerExtensa)的笔记本电脑上,我运行了一个简单的多线程加速测试。我正在使用Linux。代码贴在下面。当我期待2-3倍的加速时,我很惊讶地看到了2倍的减速。我尝试了相同的gcc优化级别-O0...-O3,但每次我得到了相同的结果。我正在使用pthreads。我也只用两个线程(而不是代码中的3个线程)尝试了相同的方法,但性能相似。可能是什么原因?更快的版本花费了相当长的时间——大约20秒——所以这似乎不是启动开销的问题。注意:这段代码有很多错误(实际上它没有多大意义,因为串行和并行版本的输出会不同)。目的只是为了“获得”相同数量指令的加速比较

c++ - 如何优化指针间接层

我正在尝试在繁重的计算应用程序中优化这类事情:说我有一个doubled[500][500][500][500];至少从编译器的角度来看,以下是相当昂贵的doubled[x][y][j][k]我想告诉编译器它是连续的内存,以方便计算偏移量。在我的例子中,我有这样的东西:doublen=0;for(inti=0;i所以我试图通过将它放在一个单独的函数中来优化它voidfunc(double***constrestrictdMatrix){/*anddosomecalculationsherel*/}没有太大帮助:(有什么优化建议吗?编辑我无法重写代码使数组成为一维。我必须和这个多维的野兽一

c++ - C/C++ 编译器会优化这个 if 语句吗?

我有这样的代码,但我觉得它有点难读://code1if((expensiveOperation1()&&otherOperation()&&foo())||(expensiveOperation2()&&bar()&&baz()){//dosomething}我只是将其更改为以下内容,以使其更具可读性://code2constboolexpr1=expensiveOperation1()&&otherOperation()&&foo();constboolexpr2=expensiveOperation2()&&bar()&&baz();if(expr1||expr2){//oneof

c++ - 高效的switch语句

在下面两个版本的switchcase中,我想知道哪个版本是高效的。1:string*convertToString(inti){switch(i){case1:returnnewstring("one");case2:returnnewstring("two");case3:returnnewstring("three");..default:returnnewstring("error");}}2:string*convertToString(inti){string*intAsString;switch(i){case1:intAsString=newstring("one");b

c++ - 为什么两个连续的收集指令比等效的基本操作执行得更差?

我正在将一些代码从SSE升级到AVX2。总的来说,我可以看到收集指令非常有用并且有利于性能。然而,我遇到了这样一种情况,即收集指令的效率低于将收集操作分解为更简单的操作。在下面的代码中,我有一个int32vectorb,一个doublexivector和4个int32索引封装在一个128位寄存器bidx。我需要先从vectorb收集,而不是从vectorxi收集。即,在伪代码中,我需要做:__m128ii=b[idx];__m256dx=xi[i];在下面的函数中,我使用#ifdef以两种方式实现:通过收集指令,产生290Miter/sec的吞吐量,以及通过基本操作,产生325Mite