PERFORMANCE_草庐IT

C++ 加速多个 substr() 或等效函数调用以解析大字符串

我正在尝试解析从文件加载到内存中的大字符串。我正在使用可变长度的滑动窗口解析DNA序列(存储为字符串)。问题是字符串太大，遍历它们需要很长时间。我不知道这是否可能，但是否有可能以某种方式加快速度？我的意思是我希望I/O主导我的应用程序，所以我将逐行读取改为一次将整个文件读入内存，但在测试我的代码后我发现它大部分时间都在这样的循环中:size_tcurrentCharNumber=0;int16_twindowSize=50;//seqisastringoflength249250621while(seq.length()-currentLinePos将序列从文件加载到内存只需要几秒钟，

等效 amp code section windowSize c++string performance data-structures substr

c++ - "crosses initialization of variable"仅当初始化结合声明时

我读过thisquestion关于“跳转到案例标签”错误，但我还有一些疑问。我在Ubuntu12.04上使用g++4.7。这段代码报错:intmain(){intfoo=1;switch(foo){case1:inti=0;i++;break;case2:i++;break;}}错误是jump-to-case-label.cpp:Infunction‘intmain()’:jump-to-case-label.cpp:8:8:error:jumptocaselabel[-fpermissive]jump-to-case-label.cpp:5:9:error:crossesinitia

明时 amp code case section c++performance g++switch-statement

c++ - 提高 OpenGL 中的 VBO 性能

所以我目前正在尝试以合适的速度渲染复杂的模型，但遇到了一些麻烦；渲染单个模型会导致我的帧率变得紧张，而程序中没有任何额外的工作。我的模型(场景中只有一个)似乎太大了。我上传到缓冲区的顶点数组中有444384个float(因此模型中有24688个三角形)。//CreatevertexbuffersglGenBuffers(1,&m_Buffer);glBindBuffer(GL_ARRAY_BUFFER,m_Buffer);intSizeInBytes=m_ArraySize*6*sizeof(float);glBufferData(GL_ARRAY_BUFFER,SizeInBytes

amp OpenGL code the section c++performance 3d vbo

java - 重置计数器或让它增加并使用模数是否更有效

假设您需要跟踪一个方法被调用的次数，并在它被调用n次时打印一些东西。什么是最有效的:使用长变量_counter并在每次调用该方法时增加它。每次调用你测试相等性“_counter%n==0”使用一个int变量_counter并在每次调用该方法时增加它。当_counter=n时，打印消息并将变量_counter重置为0。有些人会说差异可以忽略不计，您可能是对的。我只是好奇最常用的方法是什么最佳答案在这种特殊情况下，由于您无论如何都需要一个if语句，所以我会说您应该在达到计数时将其设置为零。但是，对于每次都使用该值并且只想“当我们达到

java 重置 section code counter c++performance coding-style

c++ - “static const”、 “#define” 和 “enum” 在性能和内存使用方面的区别

可能是因为#define语句的内联。我知道答案可能取决于编译器，那么假设是GCC。已有类似问题aboutC和aboutC++，但它们更多地是关于使用方面的。最佳答案编译器会在给定基本优化后将它们视为相同。检查起来相当容易-考虑以下C代码:#definea1staticconstintb=2;typedefenum{FOUR=4}enum_t;intmain(){enum_tc=FOUR;printf("%d\n",a);printf("%d\n",b);printf("%d\n",c);return0;}用gcc-O3编译:00

ldquo rdquo section printf stackoverflow c++c performance gcc compilation

c++ - 为什么我在所有像素的双 for 循环中使用 SDL2 和 SDL_RenderCopy 时性能不佳？

我正在使用SDL2编写光线转换游戏。绘制地板时，我需要按像素调用SDL_RenderCopy。这会导致帧率下降到10fps以下的瓶颈。我正在寻找性能提升，但似乎找不到。以下是性能下降的粗略概述:intmain(){while(true){for(x=0;x 最佳答案您可能应该为此使用纹理流。基本上，您将创建一个SDL_TEXTUREACCESS_STREAMING类型的SDL_Texture，然后在每一帧“锁定”纹理，更新您需要的像素，然后再次“解锁”纹理。然后在单个SDL_RenderCopy调用中渲染纹理。LazyFoo示例-

SDL_RenderCopy RenderCopy section SDL code c++performance game-engine sdl-2 raycasting

c++ - 大条目的慢 std::map

我们有48,16,703个这种格式的条目。1abc2def......4816702blah4816703blah_blah由于条目的数量很大，我担心std::map在插入期间会花费很多时间，因为它需要为每次插入做平衡。仅将这些条目插入map会花费大量时间。我在做map[first]=second;两个问题:1.我在这种情况下使用std::map是否正确？2.我按上面的方式插入是否正确。或者我应该使用map.insert()很抱歉没有做实验并写下绝对数字，但我们希望就我们做的事情是否正确达成普遍共识。此外，它们的键并不总是连续的..附言当然，稍后我们还需要访问该映射以获取与键对应的值。

amp 43 section code map c++performance hashmap

c++ - 如何提高 C++ 中的 std::set_intersection 性能？

在尝试使用C++中的std::set和Python中的set()期间，我遇到了无法解释的性能问题。在C++中设置交集至少比Python慢3倍。那么有人能指出我可以对C++代码进行的优化和/或解释Python如何更快地做到这一点吗？我希望他们都使用类似的算法，复杂度为O(n)，而set是有序的。但可能Python做了一些优化，所以它达到了更小的系数。set_bench.cc#include#include#include#include#include#include#includevoidelapsed(std::functionf,conststd::string&s){autost

amp 43 code lt set c++performance hashtable

c++ - 在 8 字节边界上对齐 double ？

在数字代码中是否有一个通用的可移植习语(我正在用D编写，但与语言无关的C和C++答案对我也很有用)以确保所有经常访问的堆栈分配的double是在8字节边界上对齐？我目前正在优化一些数字代码，其中未对齐的堆栈分配double(仅在4字节边界上对齐)导致大约1.5到2倍的性能下降。最佳答案这是特定于编译器的。在x86上使用GCC，您将使用-malign-double 关于c++-在8字节边界上对齐double？，我们在StackOverflow上找到一个类似的问题：

amp double section stackoverflow c++c performance stack d

c++ - 如何有效地绘制数千个顶点？

我目前正在编写一个显示粒子系统演化的交互式模拟器。我正在使用VisualStudio在Windows732位上进行开发。目前，我有一个函数可以在屏幕上绘制所有粒子，看起来像这样:voidSimulator::draw(){glColor4f(255,255,255,0);glBegin();for(size_ti=0;i这对测试来说效果很好，但速度慢得离谱。如果我在屏幕上有200个粒子，不做任何其他计算(只是重复调用draw())，我得到大约60fps。但如果我使用1000个粒子，它的运行速度仅为15-20fps。我的问题是:如何更快地绘制粒子？我的模拟以相当不错的速度运行，并且在某个

数千 amp section stackoverflow questions c++performance opengl 3d