OPTIMIZATION

c++ - (gcc) 编译器是否优化了空体函数？

使用基于策略的设计，EncapsulatedAlgorithm:templateclassEncapsulatedAlgorithm:publicPolicy{doublex=0;public:usingPolicy::subCalculate;voidcalculate(){Policy::subCalculate(x);}protected:~EncapsulatedAlgorithm()=default;};可能有一个执行子计算的策略Policy。子计算对于算法来说不是必需的:在某些情况下可以使用它来加速算法收敛。因此，为了对其进行建模，假设存在三种策略。只是“记录”一些东西的:

amp 43 code EncapsulatedAlgorithm subCalculate c++gcc optimization

c++ - 编译器是否优化了未使用的参数？

假设我有一个非常简单的内联函数:voidTrace(inti){#ifdef_DEBUGstd::cout现在我用另一个需要很长时间的函数生成的参数调用这个函数:Trace(SlowFunc());合理的编译器会在Release模式下优化对SlowFunc()的调用吗？MSVC具体会做吗？最佳答案只有在证明SlowFunc()没有副作用的情况下才允许优化-但在实践中，长时间运行的函数通常伴随着副作用(除非它是某种繁重的计算数学，但随后优化器可能会放弃它)。如果证明SlowFunc()没有副作用，则可以优化此调用。但我不会依赖它。

amp 43 section 长时 code c++optimization

c++ - SIMD : Why is the SSE RGB to YUV color conversion about the same speed as the c++ implementation?

我刚刚尝试优化RGB到YUV420转换器。使用查找表可以提高速度，就像使用定点算法一样。然而，我期待使用SSE指令获得真正的yield。我的第一次尝试导致代码变慢，并且在链接所有操作之后，它的速度与原始代码大致相同。我的实现是否有问题，或者SSE说明是否不适合手头的任务？部分原始代码如下:#defineRRGB24YUVCI2_000.299#defineRRGB24YUVCI2_010.587#defineRRGB24YUVCI2_020.114#defineRRGB24YUVCI2_10-0.147#defineRRGB24YUVCI2_11-0.289#defineRRGB24Y

amp the YUVCI2 YUVCI RRGB c++optimization rgb yuv sse2

c++ - 如何避免在 catch block 中编写重复代码？

我正在为桌面应用程序项目使用QT4.8(C++)，并编写如下异常处理:voidcallerMethod(){try{method1();}catch(Exception1&e){//displaycritcalerrormessage//abortapplication}catch(std::Exception&e){//printexceptionerrormessage}catch(...){//printunknownexceptionmessage}}voidmethod1(){try{//someinitializations//someoperations(hereexce

amp 编写 code strong catch c++optimization exception-handling try-catch throw

C++ 返回对象拷贝

我写了下面的代码:classMyObjectHolder{public:std::vectorgetMyObject()const{returnmyObject;}private:std::vectormyObject;};在我的程序的某些时候，我尝试使用getMyObject方法和用途仅const检索对象的方法:conststd::vectormyObject=myObjectHolder.getMyObject();myObject.size();inta=myObject.front();现在，编译器是否有可能优化此代码，以便没有std::vector的拷贝完成了吗？Isitso

amp 43 code blockquote const c++optimization copy copy-constructor rvo

c++ - 慢异或运算符

编辑:确实，我的计时代码中有一个奇怪的错误导致了这些结果。当我修复我的错误时，智能版本如预期的那样更快结束。我的计时代码如下所示:boolx=false;before=now();for(inti=0;i我已经完成了^=来阻止我的编译器优化for循环。但我认为^=以某种方式与两个xor函数进行了奇怪的交互。我更改了我的计时代码以简单地填写一个异或结果数组，然后在计时代码之外对该数组进行计算。那就是固定的东西。我应该删除这个问题吗？结束编辑我定义了两个C++函数如下:boolsmart_xor(boola,boolb){returna^b;}booldumb_xor(boola,bool

运算符 amp code section xorbb c++optimization xor

c++ - 优化编译器能否从 std::unique_ptr 中移除所有运行时成本？

阅读关于std::unique_ptr的http://en.cppreference.com/w/cpp/memory/unique_ptr，我天真的印象是，一个足够聪明的编译器可以用裸指针替换unique_ptr的正确使用，并在unique_ptr时放入一个delete被摧毁。事实真的如此吗？如果是这样，是否有任何主流优化编译器真的这样做了？如果不是，是否可以编写一些具有unique_ptr的部分/全部编译时安全优势的东西，可以优化为没有运行时成本(空间或时间)？注意那些(适本地)担心过早优化的人:这里的答案不会阻止我使用std::unique_ptr，我只是好奇它是一个非常棒的工具

unique_ptr amp code unique c++optimization c++11 unique-ptr

c++ - 如何优化一个周期？

我有以下瓶颈功能。typedefunsignedcharbyte;voidCompareArrays(constbyte*p1Start,constbyte*p1End,constbyte*p2,byte*p3){constbyteb1=128-30;constbyteb2=128+30;for(constbyte*p1=p1Start;p1!=p1End;++p1,++p2,++p3){*p3=(*p1我想用SSE2内部函数替换C++代码。我试过_mm_cmpgt_epi8但它使用了签名比较。我需要无符号比较。有什么技巧(SSE、SSE2、SSSE3)可以解决我的问题吗？注意:在这种

amp 43 code section byte c++optimization assembly intrinsics sse2

c++ - 如何在C++中实现R的 "optimize"函数？

免责声明:我使用关键字搜索了答案:R、优化、C++、C、最优、最大值、最小值、局部最大值、优化、牛顿法、梯度下降等。并没有找到满意的答案。R的optimizemanpage给出了原始的Fortran代码，但没有给出它的C翻译。请让我知道我是否应该搜索其他关键字，或者您是否可以快速找到一个明确回答此问题的网站。问题:我是C++新手，想将我的一个R程序转换成C++。我在R中使用优化函数，想知道C++中是否有任何库/头文件/函数可以轻松地给我相同的结果。如果可能，请举例说明。这是R优化的一个简单示例，在(0,1)上最大化f(p)=p*(1-p)，其中最大值位于p=0.5和f(0.5)=0.2

amp 43 section C++strong c++algorithm r optimization

c++ - OpenMP shared vs. firstprivate performancewise

我在类方法中有一个#pragmaompparallelfor循环。每个线程只读访问很少的方法局部变量，很少调用私有(private)数据和方法的参数。所有这些都在shared子句中声明。我的问题:性能方面应该没有任何区别声明这些变量shared或firstprivate。对吧？如果我不小心让变量不共享相同的缓存行，是否也是如此？如果其中一个共享变量是一个指针，并且在线程内我通过它读取一个值，是否存在像普通循环中那样的别名问题？明天我将尝试分析我的代码。同时感谢您的建议! 最佳答案嗯，它们不是一回事。使用shared，它们在所有线程

performancewise firstprivate code section c++performance optimization openmp

67 68 697071 72 73