草庐IT

cuda-gdb

全部标签

【C/C++】在VSCode中配置C/C++环境(使用gdb和code-runner两种方式配置)

VSCode是很常用的代码编辑器,但相对于DevC++,VSCode需要进行一些配置才能运行C/C++的代码。以下为个人实践过程:文章目录一、下载编辑器和编译器1.VSCode编辑器:(1)下载(2)安装2.MinGW-w64编译器:(1)下载(2)安装二、设置环境变量三、在VSCode中下载必要的插件四、配置C/C++环境1.使用gdb调试配置(1)新建一个存放C/C++项目的文件夹(2)配置编辑器环境(3)配置task.json编译任务(4)配置launch.json调试任务(5)保存,重启VSCode2.使用code-runner配置环境一、下载编辑器和编译器1.VSCode编辑器:(1

c++ - gdb中的nexti和stepi有什么区别?

在使用gdb调试可执行文件时,我们可以使用两个命令逐步执行:stepi和下一步这两者之间有什么区别,为什么会有人选择其中一个?在gdb中使用帮助说:stepi:Steponeinstructionexactly.nexti:Steponeinstruction,butproceedthroughsubroutinecalls.因为我们在这里处理指令和机器代码(正在执行的程序的最小部分),所以我无法弄清楚子例程调用是什么。 最佳答案 stepi比nexti更详细.如果你调用sum()来自main()功能然后做stepi在sum()函数

c++ - "this"GDB 回溯中的指针变化

我正在检查核心转储,并注意到在一个帧中的“this”指针与下一帧(在同一线程中)不同。不仅仅是一点点不同,它从0x8167428变成了0x200。我不太精通GDB,但这对我来说似乎不对。这是有问题的吗?如果是,原因可能是什么? 最佳答案 如果在不同的对象上调用下一帧中的函数(即使对象是同一类型),则this指针可以在gdb跟踪中的帧之间改变,因为这是为了具体实例。这可能不是您的问题。0x200不是this的有效值,几乎可以肯定表示某种类型的内存损坏。this指针有时存储在堆栈中并作为不可见的第一个参数传递给函数。因此,如果您损坏了堆

c++ - CUDA - memcpy2d - 音调错误

我刚开始CUDA编程,并试图执行下面显示的代码。这个想法是将二维数组复制到设备,计算所有元素的总和,然后检索总和(我知道这个算法不是并行化的。事实上,它正在做更多的工作,然后是必要的。然而,这只是为了作为memcopy的练习)。#include#include#include#include#defineheight50#definewidth50usingnamespacestd;//Devicecode__global__voidkernel(float*devPtr,intpitch,int*sum){inttempsum=0;for(intr=0;r>>(devPtr,pitc

c++ - gdb python编程: how to write code that will set breakpoints to every method of a C++ class?

我希望能够在gdb中为C++类的每个方法设置断点。我认为最简单的方法可能是python,因为现在python可以完全访问gdb。我对python知之甚少,而在它上面加上gdb,它就更难了。我想知道是否有人知道如何编写一个类python代码来为gdb中命名类的每个方法设置断点。 最佳答案 假设您使用调试符号进行编译,您甚至不需要python:rbreaksource.cpp:. 关于c++-gdbpython编程:howtowritecodethatwillsetbreakpointsto

c++ - 将 pthreads 与 CUDA 结合使用 - 设计问题

我正在编写一些需要一些磁盘I/O的代码,并调用我编写的库来执行一些计算和GPU工作,然后调用更多磁盘I/O将结果写回文件。我想将其创建为多线程代码,因为文件非常大。我希望能够读取文件的一部分,将其发送到GPU库,然后将一部分写回文件。涉及的磁盘I/O非常大(如10GB),并且在GPU上的计算速度相当快。我的问题更像是一个设计问题。我应该使用单独的线程来预加载进入GPU库的数据,并且只让主线程实际执行对GPU库的调用,然后将结果数据发送到其他线程以写回磁盘,或者我是否应该继续让所有单独的线程各自完成自己的工作-获取一大块数据,在GPU上执行,然后写入磁盘,然后获取下一block数据?我正

c++ - 它是一个 gdb 错误吗?

1#include"string"2usingnamespacestd;34boolm_bInited=true;5intm_imaxsize=100;67inttest()8{9if(!m_bInited)10{11return-1;12}1314std::stringgbkInput="";15std::stringutf8Input="";16if(gbkInput.size()>m_imaxsize)17{18return1;19}20return0;21}2223intmain()24{25test();26return0;27}当使用第16行的gdbstep时,调试顺序是:

c++ - 在 CUDA 上乘以两个 float 变量

我有一个非常有趣的问题,但我花了3个小时才解决它,但我只是想不通发生了什么以及为什么它不起作用。我试过谷歌它,但没有结果。我正在CUDA上编写程序。我有一段非常简单的代码:__global__voidcalcErrorOutputLayer_kernel(*arguments...*){intidx=blockIdx.x*blockDim.x+threadIdx.x;floatgradient;floatderivation;derivation=pow((2/(pow(euler,neuron_device[startIndex+idx].outputValue)+pow(euler

c++ - gdb - 获取寄存器的变量名

在GDB中,inforegisters或infoall-registers将显示所有寄存器符号名称及其值。问题:如何获取存储在该寄存器中的变量名称(即来自源代码)?(或源代码中的行号,或任何东西)例如:intmy_reg=/*something*/;floatanother_reg=/*somethingelse*/;...那么,infoall-registers可能会返回:R00x00R10xfffbf016776176R20x00R30x00R40x66如何确定哪个寄存器(R0?R2?R4?)与my_reg“相关联”? 最佳答案

c++ - CUB (CUDA UnBound) 相当于 thrust::gather

由于Thrust库存在一些性能问题(有关详细信息,请参阅thispage),我计划重构一个CUDA应用程序以使用CUB而不是Thrust。具体来说,就是替换thrust::sort_by_key和thrust::inclusive_scan调用)。在我的应用程序的特定点上,我需要按键对3个数组进行排序。这就是我用推力做到这一点的方式:thrust::sort_by_key(key_iter,key_iter+numKeys,indices);thrust::gather_wrapper(indices,indices+numKeys,thrust::make_zip_iterator(