草庐IT

OPTIMIZATION

全部标签

C++ 将 lambda 函数保存为没有函数指针的成员变量以进行优化

我想用C++编写一个将lambda函数保存为成员变量的类。尽可能高效地做到这一点会很棒。例如,我阅读了这个线程Whycanlambdasbebetteroptimizedbythecompilerthanplainfunctions?因此我想避免使用函数指针。到目前为止,我最好的解决方案如下:templateclassLambdaClass{private:FlambdaFunc;public:LambdaClass(F&_lambdaFunc):lambdaFunc(_lambdaFunc){}};我会按如下方式使用这个类:autolambdaFunc=[](int_a)->int{

c++ - 编译器是否优化对常量变量的引用?

当谈到C和C++语言时,编译器是否优化了对常量变量的引用,以便程序自动知道所引用的值是什么,而不必查看常量变量的内存位置?说到数组,是否取决于数组中指向的索引值在编译时是否为常量?例如,看一下这段代码:intmain(void){1:chartesst[3]={'1','3','7'};2:charerm=tesst[1];}编译器是否在编译时将第2行“更改”为“charerm='3'”? 最佳答案 我个人希望发布的代码变成“无”,因为两个变量都没有实际使用,因此可以删除。但是,是的,现代编译器(gcc、clang、msvc等)应该

c++ - 如何快速检查(非平凡的)数字列表的等价性?

我有一个整数列表,例如1,2,2,3,4,1。我需要能够检查不同列表之间的等价性(==)。但是,我并不是指简单的数字比较。这些列表中的每一个实际上表示一个集合分区,其中列表中的位置表示元素的索引,数字表示组的索引。例如,在前者中,元素0和元素5在同一组中,元素1和元素2在同一组中,元素3和4都在各自的组中。分组的实际索引并不重要,重要的只是分组。我需要能够在这个意义上测试等价性,例如,前面的列表等价于5,3,3,2,9,5,,因为它们具有相同的分组.我一直这样做的方法是将数组简化为一种正常形式。我发现所有数字都与第一个数字具有相同的值,并将它们全部设置为0。然后我继续在列表中直到找到一

c++ - 有没有办法找出 C 函数的主要调用者?

假设我有一个在许多不同地方被称为LOT的函数。所以我想找出谁最常调用这个函数。例如,排名前5位的调用者或曾经调用此函数超过N次的人。我正在使用AS3Linux、gcc3.4。现在我只是放置一个断点,然后每300次就停在那里,从而暴力破解它...有人知道可以帮助我的工具吗?谢谢 最佳答案 使用-pg选项编译,运行程序一段时间,然后使用gprof。运行使用-pg选项编译的程序将生成带有执行配置文件的gmon.out文件。gprof可以读取这个文件并以可读的形式呈现它。 关于c++-有没有办法

c++ - 在 C++ 中缓慢写入数组

我只是想知道这是否是C++中的预期行为。下面的代码运行时间约为0.001毫秒:for(intl=0;l但是,如果将结果写入数组,执行时间会飙升至15毫秒:int*values=(int*)malloc(sizeof(int)*100000);for(intl=0;l我明白写入数组需要时间,但时间是否成比例?大家好 最佳答案 第一个示例可以仅使用CPU寄存器来实现。这些可以每秒访问数十亿次。第二个例子使用了太多的内存,它肯定会溢出L1和可能的L2缓存(取决于CPU型号)。那会更慢。尽管如此,15毫秒/100.000次写入还是每次写入1

c++ - 紧密循环中虚函数的成本

我的游戏对象具有虚函数Update()。有很多游戏对象(目前超过7000个)并且循环调用所有对象的更新(除其他外)。我的同事建议我们应该完全删除虚函数。可以想象,这将需要进行大量重构。我看过thisanswer但就我而言,分析意味着我必须更改大量代码。因此,在我考虑开始之前,我想我会在这里征求意见,以了解重构在这种情况下是否值得。请注意,我已经分析了循环的其他部分,并一直在尝试优化耗时最长的部分。我怀疑这种情况下的虚函数调用是我不应该担心的事情,但是在我分析之前我不能确定,并且在我更改代码(很多)之前我不能分析。另请注意,一些更新函数非常小,而另一些则更大更复杂。编辑:有多个答案可以提

c++ - 是否可以将编译时 "reference"赋给变量?

考虑以下代码:Matrix4x4perspective(constViewFrustum&frustum){floatl=frustum.l;floatr=frustum.r;floatb=frustum.b;floatt=frustum.t;floatn=frustum.n;floatf=frustum.f;return{{2*n/(r-l),0,(r+l)/(r-l),0},{0,2*n/(t-b),(t+b)/(t-b),0},{0,0,-((f+n)/(f-n)),-(2*n*f/(f-n))},{0,0,-1,0}};}为了提高构建矩阵的可读性,我必须从平截头体结构中复制值,

c++ - 有什么方法可以使此相对简单(嵌套在内存中)的C++代码更有效?

我意识到这是一个愚蠢的问题,因为缺少更好的术语。我只是在寻找有关提高此代码效率的任何外部想法,因为它使系统严重瘫痪(它必须执行很多此功能),并且我的想法很少。加载两个图像容器(全彩色img的imgRGB和黑白图像的imgBW)时,它的工作方式是存储在“无符号字符*pImage”中的图像的每个像素逐像素。imgRGB和imgBW都是用于根据需要访问单个像素的容器。//inputisintheformofanunsignedchar//unsignedchar*pImagefor(inty=0;y就像我说的那样,我只是在寻找更好的内存管理和/或复制方面的新输入和想法。有时我看自己的代码太多

c++ - 代码优化;切换与 if 的

我有一个问题,关于在一个经常被调用的函数中是使用“case”还是“ifs”。这是现在的以下内容,在“ifs”中;代码是不言自明的:intidentifyMsg(char*textbuff){if(!strcmp(textbuff,"text")){return1;}if(!strcmp(textbuff,"name")){return2;}if(!strcmp(textbuff,"list")){return3;}if(!strcmp(textbuff,"remv")){return4;}if(!strcmp(textbuff,"ipad")){return5;}if(!strcmp(

c++ - C++中进行良好性能优化的想法

好的,在过去三天里,我一直处于分析器结果的前面,该结果是通过自动化套件运行相当多的测试用例而产生的。这样做的目的是查看是否存在可以总体上提高性能的良好优化。在这种情况下,我将取得良好的成绩,具体如下:具有表现的潜力两者都是非常好的改进最后重要且可观察用户级别,例如>100%改善在表现不佳的地区。具有潜在的核心空间减少使用量减少50%以上在数据繁重的区域中。易于实现,且最少对代码的混淆和最小化副作用。即...的好处极大地实现优化超过成本。该应用程序是一个3d映射和建模程序包,在界面中具有大量图形,并在后端进行了几何处理。我已经在确保为大多数处理选择最佳算法方面做了很多工作,并且在此阶段,