草庐IT

OPTIMIZATION

全部标签

c++ - (gcc) 编译器是否优化了空体函数?

使用基于策略的设计,EncapsulatedAlgorithm:templateclassEncapsulatedAlgorithm:publicPolicy{doublex=0;public:usingPolicy::subCalculate;voidcalculate(){Policy::subCalculate(x);}protected:~EncapsulatedAlgorithm()=default;};可能有一个执行子计算的策略Policy。子计算对于算法来说不是必需的:在某些情况下可以使用它来加速算法收敛。因此,为了对其进行建模,假设存在三种策略。只是“记录”一些东西的:

c++ - 编译器是否优化了未使用的参数?

假设我有一个非常简单的内联函数:voidTrace(inti){#ifdef_DEBUGstd::cout现在我用另一个需要很长时间的函数生成的参数调用这个函数:Trace(SlowFunc());合理的编译器会在Release模式下优化对SlowFunc()的调用吗?MSVC具体会做吗? 最佳答案 只有在证明SlowFunc()没有副作用的情况下才允许优化-但在实践中,长时间运行的函数通常伴随着副作用(除非它是某种繁重的计算数学,但随后优化器可能会放弃它)。如果证明SlowFunc()没有副作用,则可以优化此调用。但我不会依赖它。

c++ - SIMD : Why is the SSE RGB to YUV color conversion about the same speed as the c++ implementation?

我刚刚尝试优化RGB到YUV420转换器。使用查找表可以提高速度,就像使用定点算法一样。然而,我期待使用SSE指令获得真正的yield。我的第一次尝试导致代码变慢,并且在链接所有操作之后,它的速度与原始代码大致相同。我的实现是否有问题,或者SSE说明是否不适合手头的任务?部分原始代码如下:#defineRRGB24YUVCI2_000.299#defineRRGB24YUVCI2_010.587#defineRRGB24YUVCI2_020.114#defineRRGB24YUVCI2_10-0.147#defineRRGB24YUVCI2_11-0.289#defineRRGB24Y

c++ - 如何避免在 catch block 中编写重复代码?

我正在为桌面应用程序项目使用QT4.8(C++),并编写如下异常处理:voidcallerMethod(){try{method1();}catch(Exception1&e){//displaycritcalerrormessage//abortapplication}catch(std::Exception&e){//printexceptionerrormessage}catch(...){//printunknownexceptionmessage}}voidmethod1(){try{//someinitializations//someoperations(hereexce

C++ 返回对象拷贝

我写了下面的代码:classMyObjectHolder{public:std::vectorgetMyObject()const{returnmyObject;}private:std::vectormyObject;};在我的程序的某些时候,我尝试使用getMyObject方法和用途仅const检索对象的方法:conststd::vectormyObject=myObjectHolder.getMyObject();myObject.size();inta=myObject.front();现在,编译器是否有可能优化此代码,以便没有std::vector的拷贝完成了吗?Isitso

c++ - 慢异或运算符

编辑:确实,我的计时代码中有一个奇怪的错误导致了这些结果。当我修复我的错误时,智能版本如预期的那样更快结束。我的计时代码如下所示:boolx=false;before=now();for(inti=0;i我已经完成了^=来阻止我的编译器优化for循环。但我认为^=以某种方式与两个xor函数进行了奇怪的交互。我更改了我的计时代码以简单地填写一个异或结果数组,然后在计时代码之外对该数组进行计算。那就是固定的东西。我应该删除这个问题吗?结束编辑我定义了两个C++函数如下:boolsmart_xor(boola,boolb){returna^b;}booldumb_xor(boola,bool

c++ - 优化编译器能否从 std::unique_ptr 中移除所有运行时成本?

阅读关于std::unique_ptr的http://en.cppreference.com/w/cpp/memory/unique_ptr,我天真的印象是,一个足够聪明的编译器可以用裸指针替换unique_ptr的正确使用,并在unique_ptr时放入一个delete被摧毁。事实真的如此吗?如果是这样,是否有任何主流优化编译器真的这样做了?如果不是,是否可以编写一些具有unique_ptr的部分/全部编译时安全优势的东西,可以优化为没有运行时成本(空间或时间)?注意那些(适本地)担心过早优化的人:这里的答案不会阻止我使用std::unique_ptr,我只是好奇它是一个非常棒的工具

c++ - 如何优化一个周期?

我有以下瓶颈功能。typedefunsignedcharbyte;voidCompareArrays(constbyte*p1Start,constbyte*p1End,constbyte*p2,byte*p3){constbyteb1=128-30;constbyteb2=128+30;for(constbyte*p1=p1Start;p1!=p1End;++p1,++p2,++p3){*p3=(*p1我想用SSE2内部函数替换C++代码。我试过_mm_cmpgt_epi8但它使用了签名比较。我需要无符号比较。有什么技巧(SSE、SSE2、SSSE3)可以解决我的问题吗?注意:在这种

c++ - 如何在C++中实现R的 "optimize"函数?

免责声明:我使用关键字搜索了答案:R、优化、C++、C、最优、最大值、最小值、局部最大值、优化、牛顿法、梯度下降等。并没有找到满意的答案。R的optimizemanpage给出了原始的Fortran代码,但没有给出它的C翻译。请让我知道我是否应该搜索其他关键字,或者您是否可以快速找到一个明确回答此问题的网站。问题:我是C++新手,想将我的一个R程序转换成C++。我在R中使用优化函数,想知道C++中是否有任何库/头文件/函数可以轻松地给我相同的结果。如果可能,请举例说明。这是R优化的一个简单示例,在(0,1)上最大化f(p)=p*(1-p),其中最大值位于p=0.5和f(0.5)=0.2

c++ - OpenMP shared vs. firstprivate performancewise

我在类方法中有一个#pragmaompparallelfor循环。每个线程只读访问很少的方法局部变量,很少调用私有(private)数据和方法的参数。所有这些都在shared子句中声明。我的问题:性能方面应该没有任何区别声明这些变量shared或firstprivate。对吧?如果我不小心让变量不共享相同的缓存行,是否也是如此?如果其中一个共享变量是一个指针,并且在线程内我通过它读取一个值,是否存在像普通循环中那样的别名问题?明天我将尝试分析我的代码。同时感谢您的建议! 最佳答案 嗯,它们不是一回事。使用shared,它们在所有线程