Memory

c++ - Cuda - 从设备全局内存复制到纹理内存

我正在尝试使用Cuda和C++在GPU上执行两项任务(分为2个内核)。作为输入，我采用NxM矩阵(作为float组存储在主机的内存中)。然后，我将使用一个内核对该矩阵执行一些操作，使其成为NxMxD矩阵。然后我有第二个内核，它对这个3D矩阵执行一些操作(我只是读取值，我不必向它写入值)。在纹理内存中操作对于我的任务来说似乎要快得多所以我的问题是是否可以在内核1之后从设备上的全局内存复制我的数据并将其直接传输到内核2的纹理内存而不将其取回给主人？更新我添加了一些代码来更好地说明我的问题。这是两个内核。第一个现在只是一个占位符，将2D矩阵复制到3D中。__global__voidcompu

amp 43 float texImIp 3D c++memory cuda textures

c++ - 内存管理容器设计问题 - 项目需要继承

我正在设计一个内存管理容器，考虑到性能和易用性，尤其是对于游戏开发项目。Here'sitinit'scurrentstate.我将从源代码中提取最重要的部分。//Uptrisatypedefforstd::unique_ptrclassMemoryManageable{boolalive{true};public:boolisAlive()const{returnalive;}};templatestructDeleter{booloperator()(constUptr&mItem)const{return!mItem->isAlive();}};templateclassMemor

容器 amp code items MemoryManager c++memory c++11 unique-ptr

c++ - 琐碎的析构函数会导致别名吗

C++11§3.8.1声明，对于具有普通析构函数的对象，我可以通过分配给它的存储来结束它的生命周期。我想知道微不足道的析构函数是否可以延长对象的生命周期并通过“销毁一个对象”导致别名问题，而我早就结束了它的生命周期。首先，我知道一些安全且无别名的东西void*mem=malloc(sizeof(int));int*asInt=(int*)mem;*asInt=1;//theobject'1'isnowalive,trivialconstructor+assignmentshort*asShort=(short*)mem;*asShort=2;//theobject'1'endsitsl

琐碎 amp code asInt object c++memory c++11 destructor

c++ - 什么是 C++11 原子 API 等同于 `` `asm volatile ("":::: "memory")`` `

一个代码库有一个COMPILER_BARRIER宏定义为__asm__volatile("":::"memory").宏的目的是防止编译器跨屏障重新排序读写。请注意，这显然是编译器屏障，不是处理器级内存屏障。事实上，这是相当可移植的，因为在AssemblerTemplate中没有实际的汇编指令，只有volatile和memory破坏。因此，只要编译器支持GCC的ExtendedAsm语法，它就应该可以正常工作。不过，我很好奇如果可能的话，在C++11原子API中表达这一点的正确方法是什么。以下似乎是正确的想法:atomic_signal_fence(memory_order_acq_r

amp 43 code memory volatile c++c++11 portability atomic barrier

C++0X memory_order 无围栏，应用，支持的芯片

作为我之前question的跟进,atomic类使用memory_order指定大多数操作范围。与栅栏相反，此内存顺序仅影响其操作的原子。据推测，通过使用几个这样的原子，您可以构建一个并发算法，其中其他内存的顺序并不重要。所以我有两个问题:有人能给我指出一个算法/情况的示例，该算法/情况可以从单个原子变量的排序中受益并且不需要需要栅栏吗？哪些现代处理器支持这种行为？也就是说，编译器不会只是将特定顺序转换为正常的围栏。最佳答案关于std::atomic操作的内存排序参数变量不会影响该操作本身的顺序，它会影响该操作与其他操作创建的顺

围栏 memory_order code memory 栅栏 c++c++11 atomic memory-fences

c++ - C++ 中的共享内存缓冲区不违反严格的别名规则

我正在努力在不违反C99严格别名规则的情况下实现共享内存缓冲区。假设我有一些代码处理一些数据并且需要有一些“暂存”内存来运行。我可以这样写:voidfoo(...someargumentshere...){int*scratchMem=newint[1000];//Allocate.//Dostuff...delete[]scratchMem;//Free.}然后我有另一个函数可以做一些其他的事情，也需要一个临时缓冲区:voidbar(...arguments...){float*scratchMem=newfloat[1000];//Allocate.//Dootherstuff..

amp 43 scratchMem section void c++memory buffer strict-aliasing type-punning

c++ - 可以在 C++ 中优化掉未使用的数据成员吗

我有一个C++类，它有一个私有(private)未使用的char[]严格地向类添加填充，以防止在共享数组中使用该类时出现错误共享。我的问题有两个:这个数据成员在某些情况下可以被编译器优化掉吗？当我使用-Wall编译时，如何消除privatefield*notused警告？最好不要明确地消除警告，因为我仍然想在其他地方捕获此问题的实例。我写了一个小测试来检查我的编译器，似乎该成员没有被删除，但我想知道标准是否允许这种优化。填充.cc#includeclassA{public:inta_{0};private:charpadding_[64];};intmain(){std::cout编译

amp 43 code section private c++memory

c++ - 为什么 memory_order_relaxed 在 x86 上使用原子(锁前缀)指令？

在VisualC++2013上，当我编译以下代码时#includeintmain(){std::atomicv(2);returnv.fetch_add(1,std::memory_order_relaxed);}我在x86上取回了以下程序集:51pushecxB802000000moveax,28D0C24leaecx,[esp]8701xchgeax,dwordptr[ecx]B801000000moveax,1F00FC101lockxadddwordptr[ecx],eax59popecxC3ret在x64上类似:B802000000moveax,287442408xchgea

memory_order_relaxed amp code section c++visual-c++x86 atomic relaxed-atomics

c++ - 在没有 Malloc/New 或 Free/Delete 的情况下管理连续的内存块

如果没有C++中其他内存管理器(例如Malloc/New)的帮助，如何创建自定义MemoryManager来管理给定的连续内存块？这里有更多的上下文:MemManager::MemManager(void*memory,unsignedchartotalsize){Memory=memory;MemSize=totalsize;}我需要能够使用MemManager分配和释放此连续内存块。构造函数被赋予block的总大小(以字节为单位)。分配函数应以字节为单位获取所需的内存量，并返回指向该内存块开头的指针。如果没有内存剩余，则返回NULL指针。Deallocate函数应接收指向必须释放的

amp Malloc block 的 MemManager c++memory contiguous

c++ - POD对象 vector 的内存布局

假设我有一个简单的C++类，classData{public:floatdata[3];voidclear(){data[0]=0.0f;data[1]=0.0f;data[2]=0.0f}}和数据的vector，std::vectorv(10);假设&v[0].data[0]指向一个包含30个float的数组是否安全？最佳答案来自标准23.3.6.1ClasstemplatevectoroverviewTheelementsofavectorarestoredcontiguously,meaningthatifvisavect

amp vector code section strong c++memory

71 72 737475 76 77