草庐IT

memory-efficient

全部标签

c++ - memory_order_relaxed 的使用

Stackoverflow上已经有一些问题本质上是关于memory_order_relaxed的用例,例如:Understandingmemory_order_relaxedWhataresomeusecasesformemory_order_relaxed但是,我仍然对memory_order_relaxed的精确语义感到困惑。通常,memory_order_relaxed的示例用例类似于std::shared_ptr-基本上它保留一个原子计数器,但不需要与其他线程同步。好的,那么我的理解是这样的:std::memory_order_relaxed,当与load()一起使用时,仅保证

c++ - atomic_thread_fence(memory_order_seq_cst)是否具有完整内存屏障的语义?

完全/通用内存屏障是指相对于系统其他组件而言,屏障之前指定的所有LOAD和STORE操作似乎都发生在屏障之后指定的所有LOAD和STORE操作之前的情形。根据cppreference,memory_order_seq_cst等于memory_order_acq_rel加上在这样标记的所有操作上的单个总修改顺序。但是据我所知,C++11中的获取或释放围栏都不会强制执行#StoreLoad(存储后加载)排序。释放栅栏要求任何后续的写操作都不能对先前的读/写进行重新排序;获取栅栏要求后续的读/写操作不能与先前的任何读操作重新排序。如果我错了,请纠正我;)举个例子atomicx;atomicy

c++ - 具有 memory_order_relaxed 的存储是否有可能永远不会到达其他线程?

假设我有一个线程A写入atomic_intx=0;,使用x.store(1,std::memory_order_relaxed);。如果没有任何其他同步方法,使用x.load(std::memory_order_relaxed);其他线程需要多长时间才能看到这一点?鉴于标准给出的C/C++内存模型的当前定义,写入x的值是否可能完全保持线程本地?我手头的实际案例是线程B频繁读取atomic_bool以检查它是否必须退出;另一个线程,在某个时候,将true写入此bool,然后在线程B上调用join()。显然我不介意在线程B甚至可以看到atomic_bool已设置之前调用join(),我也不

c++ - memory_order_acquire 真的足以锁定自旋锁吗?

根据AntonyWilliams的书C++ConcurrencyinAction,自旋锁可以按如下方式实现:classspinlock_mutex{std::atomic_flagflag;public:spinlock_mutex():flag(ATOMIC_FLAG_INIT){}voidlock(){while(flag.test_and_set(std::memory_order_acquire));}voidunlock(){flag.clear(std::memory_order_release);}};如果我没理解错的话,memory_order_acquire标签确保了

c++ - delete p where p is a pointer to array always a memory leak?

在一次软件session上的讨论之后,我着手确定使用普通delete删除动态分配的基元数组是否会导致内存泄漏。我已经编写了这个小程序并使用在WindowsXP上运行的visualstudio2008对其进行了编译:#include"stdafx.h"#include"Windows.h"constunsignedlongBLOCK_SIZE=1024*100000;int_tmain(){for(unsignedinti=0;i然后我使用任务管理器监视我的应用程序的内存消耗,令人惊讶的是内存被正确分配和释放,分配的内存没有像预期的那样稳定增加我修改了我的测试程序以分配一个非基本类型数组

java - C++ 到 Java : searching a collection efficiently

我的背景主要是C++,现在我正在愤怒地编写一些Java。我发现在C++中使用STL的一些基本内容在Java中似乎比我认为的更麻烦。我的结论是,可能有一个更好的Java惯用语我还没有理解。这是一个使用伪代码的示例。我有一些事物的集合,这些事物具有基于某些碰巧是字符串的成员变量的自然排序关系。classThing{Stringkey1;Stringkey2;}在C++中,我可能会定义一个排序运算符//////@brief///provideatotalorderfor'Things'usingkey1andkey2///booloperatorb.key1)returnfalse;else

c++ - Armadillo C++ : Efficient and concise way to multiply every row of a matrix by a vector?

我想知道是否有一种高效简洁的方法来对ArmadilloC++矩阵的每一行(或列)与vector进行逐元素乘法。行(或列)和vector大小相同。例如,如果fmat::each_row()(和/或each_col())可以用作右值,我想要这样的东西来编译(目前它不会编译):#includeintmain(){usingnamespacearma;fmatm(20,10);fvecv(10);//acolumnvectorm.each_row()%v.t();//Currentlyacompilererror.return0;} 最佳答案

c++ - 在 Qt Creator 中使用 'Analyze Memory' 工具

我正在使用QtCreator开发C++应用程序,我正在尝试追踪一些内存泄漏。我关注了theseinstructions*,并在我的Ubuntu机器上安装了Valgrind。我从AnalyzeMemory部分开始我的应用程序,在单击停止按钮后,我被告知ToolAnalyzeMemory已完成,发现928个问题。但是,分析部分没有显示任何结果,该部分仍为空白。我做错了什么吗?在哪里可以找到内存分析的结果?*令人困惑的是,说明要求“发布”构建配置,但选择此选项会导致Qt中出现警告,指出内存分析工具需要调试配置。两种方法我都试过了。 最佳答案

c++ - C++ 示例 "Memory barrier"

这个问题在这里已经有了答案:C++MemoryBarriersforAtomics(2个答案)关闭9年前。我正在阅读这个关于volatile关键字的问题的答案:https://stackoverflow.com/a/2485177/997112那个人说:Thesolutiontopreventingreorderingistouseamemorybarrier,whichindicatesbothtothecompilerandtheCPUthatnomemoryaccessmaybereorderedacrossthispoint.Placingsuchbarriersaroundo

c++ - 输入参数传递 : is there a size threshold for efficient pass-by-value?

在C++中,当输入参数复制成本低时(例如,int、float等),它通常被传递只需按值。相反,复制起来并不便宜的输入“观察到的”参数(例如std::string)由const&传递。我想知道像POD这样的类型表示具有int坐标的二维vector,例如structVec2i{intX;intY;};在32位MSVC编译器上,它只有8个字节(2*sizeof(int))。您会按值还是按const&传递它?那么Vec2d有double类型的坐标呢?(在MSVC上它将是2*sizeof(double),所以2*8=16字节。)是否有“大小阈值”(例如16字节?)用于放置一行并说:“对于超过X大