草庐IT

OPTIMIZATION

全部标签

c++ - 为什么即使在非常简单的情况下,volatile vars 也没有得到优化?

如果我编译代码intmain(){inti;i=1;i=2;}在带有发布和优化的VS中,反汇编看起来像:intmain(){inti;i=1;i=2;}010D1000xoreax,eax010D1002ret但是如果我写“volatile”这个词:intmain(){01261000pushecxvolatileinti;i=1;01261001movdwordptr[esp],1i=2;01261008movdwordptr[esp],2}0126100Fxoreax,eax01261011popecx01261012ret有谁知道为什么VS留下这段代码?它有任何副作用吗?它是程序

c# - 如何有效地包装固定大小的循环缓冲区的索引

我有一个固定大小的循环缓冲区(作为数组实现):初始化时,缓冲区会填充指定的最大数量的元素,这允许使用单个位置索引来跟踪我们当前的位置圆圈。访问循环缓冲区中元素的有效方法是什么?这是我目前的解决方案:intGetElement(intindex){if(index>=buffer_size||index=buffer_size?(index+end_index)-buffer_size:end_index+index;}returnbuffer[index];}一些定义:end_index是紧跟在圆圈中最后一个元素之后的元素的索引(它也被认为与start_index相同,即圆圈的第一个元

c++ - 优化循环与代码复制

我的难题是如何最好地处理可以接受参数的长循环。考虑以下方法:voidHeavyLoop(byte*startingAddress,boolsecondaryModification){for(inti=0;i此方法将执行我想要的操作,但我在循环中使用了10000000个不必要的if。如果我像这样写同样的方法:voidHeavyLoop(byte*startingAddress,boolsecondaryModification){if(secondaryModification){for(inti=0;i我会得到相同的结果,尽管我的整个循环代码必须重复。如果我们讨论的是一个参数,这没什

c++ - 这些代码中哪些会运行得更快

我最近开始考虑优化,现在我知道有很多书籍和文章,但我有一个我感兴趣的特定场景。A.for(i=0;iB.limit2=limit+5;for(i=0;i我想知道的是,第二段代码是否会运行得更快,因为它只需要进行一次数学计算,或者计算是否会在循环的生命周期内存储。 最佳答案 假设类型很简单,如int等,如果任何体面的编译器没有将两个示例优化为发布版本中的相同代码,我会感到非常惊讶。例如,一个复杂的类型可能在重载的operator++中需要更多的马力。 关于c++-这些代码中哪些会运行得更快

c++ - 是否允许编译器优化堆内存分配?

考虑以下使用new的简单代码(我知道没有delete[],但它不属于这个问题):intmain(){int*mem=newint[100];return0;}是否允许编译器优化new调用?在我的研究中,g++(5.2.0)和VisualStudio2015不优化new调用,whileclang(3.0+)does.所有测试都是在启用完全优化的情况下进行的(-O3用于g++和clang,用于VisualStudio的Release模式)。new不是在幕后进行系统调用,使得编译器不可能(并且非法)对其进行优化吗?编辑:我现在已经从程序中排除了未定义的行为:#includeintmain()

c++ - 如何缩短巨大 bool 表达式的编译时间?

我需要对vector执行相当复杂的检查,而且我必须重复它成千上万次。为了提高效率,我将给定的公式翻译成C++源代码,并将其编译为高度优化的二进制文件,我在代码中调用它。公式始终是纯bool值:只有&&、||和!用过的。典型的源代码如下所示:#include#includeusingDataType=std::vector;staticconstcharT=1;staticconstcharF=0;conststd::size_tmaxidx=300;extern"C"boolcheck(constDataType&l);boolcheck(constDataType&l){assert

c++ - 按值显式复制构造函数或隐式参数

我最近读到(不幸的是忘了在哪里),写operator=的最佳方式是这样的:foo&operator=(fooother){swap(*this,other);return*this;}而不是这个:foo&operator=(constfoo&other){foocopy(other);swap(*this,copy);return*this;}想法是,如果使用右值调用operator=,则第一个版本可以优化拷贝的构造。因此,当使用右值调用时,第一个版本更快,而当使用左值调用时,这两个版本是等效的。我很好奇其他人对此有何看法?人们会因为缺乏明确性而避免使用第一个版本吗?我是否正确认为第一

c++ - 从可执行文件中找出编译优化标志

这里我有一个可执行文件,不知道它的构建环境,假设使用的是gcc/g++。有没有办法找出编译期间使用的优化标志(如O0、O2等)?欢迎使用所有方法,无论是通过分析二进制文件还是通过gdb进行调试测试(如果我们假设-g标志在编译期间可用)。 最佳答案 如果幸运的话,命令行会出现在可执行文件本身中,具体取决于所使用的操作系统和文件格式。如果它是Elf文件,请尝试使用来自GNUbinutils的objdump转储内容 关于c++-从可执行文件中找出编译优化标志,我们在StackOverflow上

c++ - 生成第 n 个 Motzkin 数的最快方法是什么?

我想生成所有MotzkinNumber并存储在一个数组中。公式如下:我目前的实现速度太慢了:voidgenerate_slow(){mm[0]=1;mm[1]=1;mm[2]=2;mm[3]=4;mm[4]=9;ullresult;for(inti=5;i此外,我一直在寻找递归矩阵的封闭形式,以便我可以应用指数平方。谁能建议一个更好的算法?谢谢。编辑我无法应用第二个公式,因为除法在对数字取模时不适用。n的最大值为10,000,超出了64位整数的范围,因此答案是对更大的数m取模,其中m=10^14+7。不允许使用更大的整数库。 最佳答案

c++ - 通过修改的exp最快的pow()替换。当已经计算出较低的幂时,通过平方

编辑:目标:通过重用公共(public)变量的功效计算中预先计算/缓存的功效,生成一种无处不在的方法来推导自定义功效函数,其性能优于内置pow(double,uint)。已经完成的工作:我已经派生了一个比内置函数快40%的函数,但这是一个蛮力的手工派生函数-我想要一种为任意uint幂自动生成这样的幂函数块的方法。知道要获得最佳的自定义pow(double,uint),您需要了解一些信息。对于这个问题,已知(澄清)是:幂将是一个整数。可以知道的最大功率(N_MAX)。可以(重新)使用的预先计算的功效是已知的在编译时(例如,在我的示例中r2,r4和r6)。可以假定平方r2始终被计算出来,无