慢

c++ - 为什么我机器上的 hash_map 和 unordered_map 非常慢？

我用这段代码测试了它们(在VisualStudio2010sp1上):#include#include#include#include#includeintmain(){clock_ttime;intLOOP=(1my_map;std::unordered_mapmap_unordered_map;std::hash_mapmy_hash_map;time=clock();for(inti=0;i!=LOOP;++i){my_map[i]=i;}std::cout结果很奇怪:在调试中:map:0.289无序map:10.738HashMap:10.58按任意键继续。..在发布中:map

unordered_map amp map lt section c++hashmap unordered-map

c++ - VS2012 "Generating Code"大型硬编码数组速度慢

我们有一个工具可以在头文件中生成一个类，该文件是用硬编码数组生成的。自动生成的值由使用自动生成值的实际实现继承。自动生成的示例:classMyTestAutoGen{std::vectorm_my_parameter1;std::vectorm_my_parameter2;...public:MyTestAutoGen(){SetDefaultValueFor_my_parameter1();SetDefaultValueFor_my_parameter2();...}voidSetDefaultValueFor_my_parameter1(){inttmp[]={121,221,33

amp Generating parameter SetDefaultValueFor_my_parameter SetDefaultValueFor c++arrays performance visual-studio-2012

c++ - 多线程 GEMM 比单线程 GEMM 慢？

我写了一些NaiiveGEMM代码，我想知道为什么它比等效的单线程GEMM代码慢得多。使用200x200矩阵，单线程:7ms，多线程:108ms，CPU:3930k，线程池中有12个线程。templatestaticMatrixmultiply(constMatrix&lhs,constMatrix&rhs,ThreadPool&pool){Matrixresult={0};Tasktask(pool);for(autoi=0u;i 最佳答案我没有使用GEMM的经验，但你的问题似乎与各种多线程场景中出现的问题有关。使用多线程时，您

单线多线 section c++multithreading

c++ - DirectInput8 EnumDevices 有时慢得令人痛苦

有时(在大约50%的运行中)，EnumDevices需要5-10秒才能返回。通常它几乎是即时的。我找不到关于此类行为的任何其他报告。当事情变得如此缓慢时，可以通过观察stdout来分析:)这:std::coutEnumDevices(DI8DEVCLASS_GAMECTRL,MyCallback,NULL,DIEDFL_ATTACHEDONLY);std::cout似乎通过枚举设备卡在一个随机点-有时会在调用回调之前，有时会在调用回调之后，有时会在最后一次调用回调之后。这显然是一段简化的代码；我实际上使用的是OIS输入库(http://sourceforge.net/projects/

DirectInput8 DirectInput code section EnumDevices c++wait

c++ - 为什么将内存从 VRAM 复制到 RAM 比从 RAM 复制到 VRAM 慢？ (OpenGL)

我正在创建类似于CUDA的东西，但我看到将内存从RAM复制到VRAM非常快，就像从RAM复制到自身一样。但是从VRAM复制到RAM比从RAM复制到VRAM慢。顺便说一下，我正在使用glTexSubImage2D从RAM复制到VRAM，使用glGetTexImage从VRAM复制到RAM。为什么？有没有办法提高它的性能，比如将RAM复制到VRAM？最佳答案将数据从GPU传输到CPU总是非常缓慢的操作。AGPU->CPUreadbackintroducesa"syncpoint"wheretheCPUmustwaitfortheGP

VRAM amp section the c++opengl gpgpu

c++ - 大条目的慢 std::map

我们有48,16,703个这种格式的条目。1abc2def......4816702blah4816703blah_blah由于条目的数量很大，我担心std::map在插入期间会花费很多时间，因为它需要为每次插入做平衡。仅将这些条目插入map会花费大量时间。我在做map[first]=second;两个问题:1.我在这种情况下使用std::map是否正确？2.我按上面的方式插入是否正确。或者我应该使用map.insert()很抱歉没有做实验并写下绝对数字，但我们希望就我们做的事情是否正确达成普遍共识。此外，它们的键并不总是连续的..附言当然，稍后我们还需要访问该映射以获取与键对应的值。

amp 43 section code map c++performance hashmap

c++ - fclose() 函数慢

我尝试在Linux机器上使用c++fopen、fwrite、fflush和fclose函数创建大约4GB的文件，但我观察到fclose()函数需要很长时间才能关闭文件，大约需要40-50秒).我检查了不同的论坛以找到这种缓慢的原因，按照论坛中的建议更改了代码，使用setvbuf()函数使无缓冲的I/O像write()函数一样。但仍然无法解决问题。totalBytes=4294967296//4GBfilebuffersize=2000;while(size上述问题的任何解决方案都会非常有帮助。谢谢，拉梅什最佳答案操作系统正在推迟

amp fclose section code fflush c++

c++ - 使用 MS 编译器的 std::cout 非常慢

我正在打印多次计算迭代的进度，输出实际上是其中最慢的部分，但只有当我使用VisualC++编译器时，MinGW才能在同一系统上正常工作。考虑以下代码:#include#includeusingnamespacestd;#defineTO_SEC(Time)\chrono::duration_cast>(Time).count();constintREPEATS=100000;intmain(){autostart_time=chrono::steady_clock::now();for(inti=1;i现在使用MinGW(“g++source.cpp-std==c++11”)编译时得到

amp 43 code section C++c++performance visual-c++cout

c++ - 为什么 boost.geometry.index.rtree 比 superliminal.RTree 慢

我测试了boost.geometry.index.rtree(boost1.59www.boost.org)和superliminal.RTree(http://superliminal.com/sources/sources.htm#C_Code)。令我惊讶的是，superliminal.RTree比boost.geometry.index.rtree更快。环境设置将相同的空间索引数据添加到superliminal.RTree和boost.geometry.index.rtree对象。测试相同的空间索引查询100次并获得消耗的时间。GCC版本是“gccversion4.4.62011

superliminal amp lt boost code c++c r-tree boost-geometry

c++ - 为什么实例化数组比 glDrawElement 慢？

在我的程序中我想画很多球体。1st我为球体创建顶点和索引，然后将它们绑定(bind)到voa/vbo/ibo。之后我创建了1000个随机模型矩阵。现在我有两种绘制网格的方法。只需循环1000次调用glDrawElements的ModelMatrices列表。其中矩阵MVP在CPU上计算并像统一一样发送到着色器。将所有矩阵绑定(bind)到额外的VBO并将它们发送到着色器，就像“in”一样多变的。然后使用glDrawElementsInstanced调用一次。在测试程序中我绘制了1000个球体(大约2000万个顶点)当我使用第一种方法时，我得到大约27FPS，而第二种方法将性能降低到19

glDrawElement amp pastebin section noreferrer c++opengl glsl

28 29 303132 33 34