开销

c++ - 是否可以使用 static_cast 避免 vtable 开销？

这是我的问题。我有一个基类和一个派生类，它覆盖了基类中的一些方法。为简单起见，请考虑以下示例:structbase{virtualvoidfn(){/*basedefinitionhere*/}};structderived:base{voidfn(){/*deriveddefinitionhere*/}};在我的实际程序中，这些类作为参数传递给其他类并在其他方法中调用，但为了简单起见，让我们创建一个简单的函数，将基类或派生类作为参数。我可以简单地写voidcall_fn(base&obj){obj.fn();}并且由于虚函数的缘故，对适当函数的调用将在运行时解析。但是，我担心如果ca

C++线程开销

我正在研究C++中的线程，特别是使用它们来并行化映射操作。代码如下:#include#include#include#include#include#includedoublemultByTwo(doublex){returnx*2;}doubledoJunk(doublex){returncos(pow(sin(x*2),3));}templatevoidmap(T*data,intn,T(*ptr)(T)){for(inti=0;ivoidparallelMap(T*data,intn,T(*ptr)(T)){intNUMCORES=3;std::vectorthreads;for

amp 43 section lt double c++multithreading performance c++11

c++ - 确定性时的虚函数开销 (c++)

我知道虚函数本质上是包含在vtable中的函数指针，由于间接等原因，这会使多态调用变慢。但是我想知道调用是确定性的时编译器优化。我所说的确定性是指以下情况:该对象是一个值而不是一个引用，因此不可能存在多态性:structFoo{virtualvoidDoSomething(){....}};intmain(){Foomyfoo;myfoo.DoSemthing();return0;}引用的是一个没有child的类(class):structFoo{virtualvoidDoSomething();};structBar:publicFoo{virtualvoidDoSomething(

amp 43 DoSomething section code c++polymorphism

c++ - boost::bind 会导致开销吗？

我目前从事网络软件方面的工作。它有一个主类，server这显然代表一个服务器实例。Aserver实例可以发送请求，并通过回调通知用户响应。代码如下:classserver{public:typedefboost::functioncallback_func;voidsend_request(endpoint&ep,callback_funccb);};现在让我们说，作为一个用户，我想通过回调了解调用它的实例，我可以做以下事情:voidmycallback(constserver&sv,intduration){...}serversv;sv.send_request("localhos

amp boost code section c++bind overhead

c++ - 内存屏障/栅栏的开销

我目前正在编写C++代码并在我的代码中使用了很多内存屏障/栅栏。我知道，MB告诉编译器和硬件不要重新排序围绕它的写入/读取。但我不知道这个操作在运行时对处理器来说有多复杂。我的问题是:这种屏障的运行时开销是多少？我没有用谷歌找到任何有用的答案......开销可以忽略不计吗？或者导致大量使用MB导致严重的性能问题？最好的问候。最佳答案与算术和“正常”指令相比，我知道这些指令非常昂贵，但没有数字来支持该声明。我喜欢jalf的回答，描述了指令的效果，并想补充一点。通常存在几种不同类型的障碍，因此了解它们之间的差异可能会有所帮助。在清除

屏障栅栏 section 互斥 c++

c++ - C++ 中的射线网格交集或 AABB 树实现，开销很小？

你能推荐我...AABB树的经过验证的轻量级C/C++实现？或者，另一种有效的数据结构，加上轻量级的C/C++实现，来解决大量光线与大量三角形相交的问题？“大数”是指射线和三角形都有几十万。我知道AABB树是CGAL库的一部分，并且可能是像Bullet这样的游戏物理库的一部分。但是，我不希望在我的项目中有大量额外库的开销。理想情况下，我想使用一个小型的浮点型模板化头文件实现。我也会选择一堆CPP文件，只要它能轻松集成到我的项目中即可。对boost的依赖是可以的。是的，我用谷歌搜索过，但没有成功。我应该提一下，我的应用上下文是网格处理，而不是渲染。简而言之，我正在将引用网格的拓扑结构从3

amp 43 section strong 的 c++geometry intersection aabb

c++ - C/C++中的gettext国际化系统的性能开销

我只是阅读了http://www.gnu.org/software/gettext/manual/gettext.html的文档，而根本没有关于性能开销的讨论。在互联网上，我只发现了针对其他语言(PHP和Java)的性能讨论，而没有针对C/C++的性能讨论。因此，我的问题是:使用gettext的程序启动过程中的性能开销是什么(加载共享库？翻译如何加载到内存中？所有翻译是在启动还是按需加载的吗？)该程序正常运行期间的性能损失是多少？(即需要翻译时)程序增加的内存占用量是多少？如何组织内存？在程序空闲时将程序的某些部分交换到磁盘上是否有更高的危险/可能性？(如果翻译与程序的其余部分存储在内

amp 43 Hello World code c++c performance gettext overhead

c++ - 包含在许多翻译单元中时静态常量的开销？

在头文件中，可以在一行中声明和(预)定义全局常量。//constants.hnamespaceConstant{staticconstunsignedintframerate=60;staticconstchar*constwindowName="Test";staticconstunsignedchar*constcursorBitmap={lotsofdata};}我喜欢这种格式，因为它让我可以将我的常量保存在一个地方，并且避免需要在一个文件中声明常量并在另一个文件中定义它，有助于提高可读性。然而，当任何翻译单元包含constants.h时，它会在适当的位置扩展这些定义，每个单元。

中时 amp const code section c++static header constants

c++ - OpenMP 代码远比串行慢 - 内存或线程开销瓶颈？

我正在尝试并行化(OpenMP)一些科学C++代码，其中大部分(>95%)的CPU时间花在计算N阶的讨厌(且不可避免)O(N^2)交互上~200种不同的颗粒。该计算重复1e10个时间步长。我用OpenMP尝试了各种不同的配置，每一个都比串行代码慢一些(至少一个数量级)，并且随着额外的内核的添加，扩展性很差。下面是相关代码的草图，具有代表性的虚拟数据层次结构Tree->Branch->Leaf。每个Leaf对象存储自己的位置和当前和前三个时间步长的速度，等等。然后每个Branch存储一组Leaf对象，每个Tree存储一组Branch对象。这种数据结构非常适合复杂但CPU密集度较低的计算，

远比串行 code section c++multithreading performance parallel-processing openmp

c++ - unique_ptr 删除器开销

在正常的C++设计中，大多数对象都可以通过delete删除。声明，free函数，或库特定的等效于free.对于此类对象，unique_ptrDeleter实现可以是通过空基类优化消除的无状态对象。但是，某些库需要使用另一个对象(可能包含函数指针或其他上下文)从该库中删除对象。typedefstructlib_objectlib_object;structlib_api{lib_object(*createInstance)();void(*freeInstance)(lib_object*o);};可以将其包装在unique_ptr中通过存储lib_api作为自定义数据成员的指针Del

unique_ptr amp code section lib_object c++c++11 smart-pointers raii

5 6 789 10 11