慢_草庐IT

c# - float 比双倍慢吗？ 64位程序运行速度比32位程序快吗？

使用float类型是否比使用double类型慢？我听说现代Intel和AMDCPU使用double计算比使用float更快。标准数学函数(sqrt、pow、log、sin、cos等)？以单精度计算它们应该会快得多，因为它应该需要更少的浮点运算。例如，单精度sqrt可以使用比doublesqrt更简单的数学公式。另外，我听说标准数学函数在64位模式下更快(在64位操作系统上编译和运行时)。对此有什么明确的答案？最佳答案经典的x86架构使用浮点单元(FPU)来执行浮点计算。FPU在其内部寄存器中执行所有计算，每个寄存器都有80位精度

c#float code section double java c++c static-typing

c++ - 在多线程环境中使用 libcurl 会导致与 DNS 查找相关的性能非常慢

您将不得不原谅相当大的代码块，但我相信这几乎是对我的问题的最小再现。该问题并非孤立于example.com，而是存在于许多其他网站。如果我有4个线程主动发出网络请求，那么curl可以100%正常工作。如果我再添加一个线程，该线程的执行时间约为10倍。我觉得我一定遗漏了一些明显的东西，但它现在让我忘记了。UPDATE提供更多信息:这些测试在虚拟机中进行。与机器可用的内核数量无关，其中四个请求大约需要100毫秒，其余的需要大约5500毫秒。UPDATE2:实际上，我在一方面是错的，它并不总是4/n-4分布--当我已更改为4核心，有时我会得到不同的结果分布(在1个核心上运行，至少似乎相对一致

多线 amp code 200 curl c++multithreading virtual-machine libcurl futex

c++ - 在多线程环境中使用 libcurl 会导致与 DNS 查找相关的性能非常慢

您将不得不原谅相当大的代码块，但我相信这几乎是对我的问题的最小再现。该问题并非孤立于example.com，而是存在于许多其他网站。如果我有4个线程主动发出网络请求，那么curl可以100%正常工作。如果我再添加一个线程，该线程的执行时间约为10倍。我觉得我一定遗漏了一些明显的东西，但它现在让我忘记了。UPDATE提供更多信息:这些测试在虚拟机中进行。与机器可用的内核数量无关，其中四个请求大约需要100毫秒，其余的需要大约5500毫秒。UPDATE2:实际上，我在一方面是错的，它并不总是4/n-4分布--当我已更改为4核心，有时我会得到不同的结果分布(在1个核心上运行，至少似乎相对一致

多线 amp code 200 curl c++multithreading virtual-machine libcurl futex

c++ - 为什么我基于堆栈的代码实现比递归慢得多？

我有一棵树，其节点存储-1或非负整数，即顶点名称。每个顶点在树中最多出现一次。以下函数是我代码中的瓶颈:版本A:voidnode_vertex_members(node*A,vector*vertexList){if(A->contents!=-1){vertexList->push_back(A->contents);}else{for(inti=0;ichildren.size();i++){node_vertex_members(A->children[i],vertexList);}}}B版:voidnode_vertex_members(node*A,vector*verte

amp 43 node gt int c++performance optimization

c++ - 为什么我基于堆栈的代码实现比递归慢得多？

我有一棵树，其节点存储-1或非负整数，即顶点名称。每个顶点在树中最多出现一次。以下函数是我代码中的瓶颈:版本A:voidnode_vertex_members(node*A,vector*vertexList){if(A->contents!=-1){vertexList->push_back(A->contents);}else{for(inti=0;ichildren.size();i++){node_vertex_members(A->children[i],vertexList);}}}B版:voidnode_vertex_members(node*A,vector*verte

amp 43 node gt int c++performance optimization

c++ - Boost/STL 在高性能计算方面是否慢？

就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter寻求指导。关闭11年前。为anotherinternetforumquote致歉，但我觉得这很有趣，想问一下:C++isfasterifyouchuckthe"safety"featuresofprogramminglanguagesandavoidthingslikeSTL,andBoost.InrawbytestobytesC++isfaster,butthenagai

amp 方面 section the C++c++performance boost stl

c++ - Boost/STL 在高性能计算方面是否慢？

就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter寻求指导。关闭11年前。为anotherinternetforumquote致歉，但我觉得这很有趣，想问一下:C++isfasterifyouchuckthe"safety"featuresofprogramminglanguagesandavoidthingslikeSTL,andBoost.InrawbytestobytesC++isfaster,butthenagai

amp 方面 section the C++c++performance boost stl

c++ - 使用 g++ 5.3.1 编译的程序运行速度比使用 g++ 4.8.4 编译的相同程序慢 3 倍，相同的命令

最近，我开始使用Ubuntu16.04和g++5.3.1并检查我的程序运行速度慢了3倍。在此之前，我使用过Ubuntu14.04、g++4.8.4。我使用相同的命令构建它:CFLAGS=-std=c++11-Wall-O3.我的程序包含循环，充满了数学调用(sin、cos、exp)。你可以找到它here.我尝试使用不同的优化标志(O0、O1、O2、O3、Ofast)进行编译，但在所有情况下都会重现问题(Ofast两种变体运行速度更快，但第一个变体运行速度仍然慢3倍).在我的程序中，我使用libtinyxml-dev、libgslcblas。但是它们在两种情况下都有相同的版本，并且在性能

amp 43 code props double c++performance ubuntu gcc5

c++ - 使用 g++ 5.3.1 编译的程序运行速度比使用 g++ 4.8.4 编译的相同程序慢 3 倍，相同的命令

最近，我开始使用Ubuntu16.04和g++5.3.1并检查我的程序运行速度慢了3倍。在此之前，我使用过Ubuntu14.04、g++4.8.4。我使用相同的命令构建它:CFLAGS=-std=c++11-Wall-O3.我的程序包含循环，充满了数学调用(sin、cos、exp)。你可以找到它here.我尝试使用不同的优化标志(O0、O1、O2、O3、Ofast)进行编译，但在所有情况下都会重现问题(Ofast两种变体运行速度更快，但第一个变体运行速度仍然慢3倍).在我的程序中，我使用libtinyxml-dev、libgslcblas。但是它们在两种情况下都有相同的版本，并且在性能

amp 43 code props double c++performance ubuntu gcc5

c++ - 为什么 Strassen 矩阵乘法比标准矩阵乘法慢得多？

我用C++、Python和Java编写了矩阵乘法程序，并测试了它们对两个2000x2000矩阵相乘的速度(参见post)。标准ikj实现-在中-拍摄:C++:15秒(Source)Python:6分13秒(Source)现在我已经实现了Strassenalgorithmformatrixmultiplication-位于-在Python和C++中，就像在维基百科上一样。这些是我的时间:C++:45分钟(Source)Python:10小时后被杀死(Source)为什么Strassen矩阵乘法比标准矩阵乘法慢很多？想法:一些缓存效果实现:错误(生成的2000x2000矩阵是正确的)nul

法比 amp strong multiplication Strassen c++performance matrix