PERFORMANCE_草庐IT

c++ - 将int转换为字符串的有效方法

我正在创建一个游戏，其中有一个主循环。在此循环的一个周期内，我必须将int值转换为string大约50-100次。到目前为止，我一直在使用这个功能:std::stringUtil::intToString(intval){std::ostringstreams;s但它似乎不是很有效，因为我遇到FPS从~120(不使用此功能)下降到~95(使用它时)。有没有其他方法可以将int转换为string比我的函数更有效？最佳答案 It's1-72range.Idon'thavetodealwithnegatives.预先创建一个包含73个s

amp 43 code section string c++performance int type-conversion

c++ - std::vector 中的每个元素访问都是缓存未命中吗？

众所周知，std::vector将其数据保存在堆上，因此vector本身的实例和第一个元素具有不同的地址。另一方面，std::array是原始数组的轻量级包装器，其地址等于第一个元素的地址。让我们假设集合的大小足以容纳int32的一个缓存行。在我有384kBL1缓存的机器上它是98304个数字。如果我迭代std::vector，我总是首先访问vector本身的地址，然后访问下一个元素的地址。并且可能这个地址不在同一个缓存行中。所以每次元素访问都是缓存未命中。但如果我迭代std::array地址在同一个缓存行中，那么它应该更快。我用VS2013进行了全面优化测试，std::array快了

amp vector code 的 c++arrays performance caching

c++ - 文件夹和命名空间会影响 C++ 和跨平台的性能吗？

有人问了一个关于whethernamespaceandfolderstructurewouldaffectperformanceofanassemblyinC#的问题.答案非常有用，但特定于C#和CLR。如果程序集是用C++和gcc编写的，命名空间和文件夹结构将如何影响程序集的性能？在其他操作系统(如Linux或MacOS)上情况如何？如果有任何重大的性能问题，我应该做什么或避免做什么以最大限度地提高性能？最佳答案您的目录层次结构和命名空间都不会影响您编译的代码。您的编译器将生成的代码将是相同的。这适用于所有编译器和所有操作

amp 跨平台 section questions 命名 c++performance optimization

c++ - If-else-if 与 map

假设我有这样一个if/else-if链:if(x.GetId()==1){}elseif(x.GetId()==2){}//...50moreelseifstatements我想知道的是，如果我保留一张map，它在性能方面会不会更好？(假设键是整数) 最佳答案 map(通常)是使用红黑树实现的，它提供O(logN)查找，因为树始终保持平衡。您的if语句线性列表将是O(N)最坏的情况。所以，是的，map的查找速度会快得多。许多人建议使用switch语句，这对您来说可能不会更快，具体取决于您的实际if语句。编译器有时可以通过使用O(1)

If-else-if amp section else return c++performance map

C++ 性能/内存优化指南

有人有C++内存优化指南的资源吗？最佳实践、调整等？举个例子:Classxxx{public:xxx();virtual~xxx();protected:private:};由于此类中没有protected和私有(private)的项目，因此摆脱protected和私有(private)的编译器或内存分配会有任何好处吗？更新:程序员是做什么的:Classxxx{public:xxx();virtual~xxx();public:morestuff();more();ifndef__BUILD_WIN__public:evenmore();envenmore2();endifprotec

amp 指南 section protected code c++performance optimization compiler-construction

c++ - 如果函数内联过于激进会怎样？

每次我读到C++中的inline关键字时，都会有很长的解释说明编译器会进行“速度与代码量”分析，然后决定是否在每种特定情况下内联函数调用。现在VisualC++9有一个__forceinlinekeyword这似乎使编译器内联对函数的调用，除非这种内联是绝对不可能的(就像调用是虚拟的)。假设我在不了解其中内容的情况下浏览了一些项目，然后自己决定三分之一的函数足够小并且适合内联，并用__forceinline标记它们，编译器确实内联它们，现在可执行文件已经变大了一百倍。这真的很重要吗？过度内联函数并使可执行文件大一百倍，我应该期待什么效果？最佳答案

内联激进 section code c++performance visual-c++compiler-construction inline

c++ - 为什么 C++ 虚拟调用并不比非虚拟调用慢多少？

据我了解，对于C++虚拟调用，它需要:从符号表中获取对象的类型从类型表中获取v表使用v表中的函数签名搜索函数调用函数。对于非虚拟(例如在C中)调用，只需要#4。我认为#3应该是最耗时的。考虑到C++中实时覆盖的性质，我看不出上述步骤的编译时间优化有多大潜力。因此，对于具有长函数签名的复杂类继承，C++虚拟调用应该比非虚拟调用慢得多。但所有说法都是相反的，为什么？最佳答案 GetthetypeoftheobjectfromthesymboltableGetthev-tablefromthetypetableSearchthefunc

amp 43 section li C++c++performance

c++ - 将 A[i][j] 更改为 A[j][i] 时，遍历矩阵的速度变慢

这个问题在这里已经有了答案:c++2darrayaccessspeedchangesbasedon[a][b]order?[duplicate](5个答案)关闭9年前。我有一个名为A的int矩阵，当我按列而不是行迭代它时，它的运行速度慢了大约50毫秒:for(inti=0;i有谁知道为什么会这样？我问过几个人，但他们都不知道为什么。我确信这与地址在计算机内存中的表示方式有关，但我仍然想找到更具体的答案。

amp 43 section code notice c++c arrays performance caching

提高性能的 C++ 内联方法

很久以前我就被告知要通过使用关键字inline并将函数体写入头文件中来制作经常内联调用的短函数/方法。这是为了优化代码，因此实际函数调用不会产生开销。今天看起来怎么样？现代编译器(在本例中为VisualStudio2010)是否会自动内联如此短的函数，还是仍然“有必要”自己这样做？最佳答案 inline一直是对编译器的提示，如今编译器在这方面大部分都自行做出决定(参见register).为了内联扩展函数，编译器必须已经看到该函数的定义。对于仅在一个翻译单元中定义和使用的函数，这没有问题:在使用之前将定义放在某个地方，编译器将决定是

内联 amp section code c++performance inline

c++ - 创建一个 Fast Sin() 函数来提高 fps ?快速 sin() 函数？

我正在实时渲染500x500点。我必须使用atan()和sin()函数计算点的位置。通过使用atan()和sin()，我得到了24fps(每秒帧数)。floatthetaC=atan(value);floath=(value)/(sin(thetaC)));如果我不使用sin()，我将获得52fps。如果我不使用atan()，我将30fps。所以，最大的问题是sin()。我怎样才能使用FastSin版本。我可以为此创建一个查找表吗？我没有任何特定值来创建LUT。在这种情况下我能做什么？PS:我也尝试过ASM的fastsin函数，但没有得到任何区别。谢谢。最

数来 amp code strong section c++c performance math trigonometry