cuda-gdb

【C/C++】在VSCode中配置C/C++环境（使用gdb和code-runner两种方式配置）

VSCode是很常用的代码编辑器，但相对于DevC++，VSCode需要进行一些配置才能运行C/C++的代码。以下为个人实践过程：文章目录一、下载编辑器和编译器1.VSCode编辑器：（1）下载（2）安装2.MinGW-w64编译器：（1）下载（2）安装二、设置环境变量三、在VSCode中下载必要的插件四、配置C/C++环境1.使用gdb调试配置（1）新建一个存放C/C++项目的文件夹（2）配置编辑器环境（3）配置task.json编译任务（4）配置launch.json调试任务（5）保存，重启VSCode2.使用code-runner配置环境一、下载编辑器和编译器1.VSCode编辑器：（1

配置 code-runner xff img 插入 vscode c++c语言

c++ - gdb中的nexti和stepi有什么区别？

在使用gdb调试可执行文件时，我们可以使用两个命令逐步执行:stepi和下一步这两者之间有什么区别，为什么会有人选择其中一个？在gdb中使用帮助说:stepi:Steponeinstructionexactly.nexti:Steponeinstruction,butproceedthroughsubroutinecalls.因为我们在这里处理指令和机器代码(正在执行的程序的最小部分)，所以我无法弄清楚子例程调用是什么。最佳答案 stepi比nexti更详细.如果你调用sum()来自main()功能然后做stepi在sum()函数

amp nexti code strong section c++c debugging gdb

c++ - "this"GDB 回溯中的指针变化

我正在检查核心转储，并注意到在一个帧中的“this”指针与下一帧(在同一线程中)不同。不仅仅是一点点不同，它从0x8167428变成了0x200。我不太精通GDB，但这对我来说似乎不对。这是有问题的吗？如果是，原因可能是什么？最佳答案如果在不同的对象上调用下一帧中的函数(即使对象是同一类型)，则this指针可以在gdb跟踪中的帧之间改变，因为这是为了具体实例。这可能不是您的问题。0x200不是this的有效值，几乎可以肯定表示某种类型的内存损坏。this指针有时存储在堆栈中并作为不可见的第一个参数传递给函数。因此，如果您损坏了堆

amp 43 code section this c++debugging gdb

c++ - CUDA - memcpy2d - 音调错误

我刚开始CUDA编程，并试图执行下面显示的代码。这个想法是将二维数组复制到设备，计算所有元素的总和，然后检索总和(我知道这个算法不是并行化的。事实上，它正在做更多的工作，然后是必要的。然而，这只是为了作为memcopy的练习)。#include#include#include#include#defineheight50#definewidth50usingnamespacestd;//Devicecode__global__voidkernel(float*devPtr,intpitch,int*sum){inttempsum=0;for(intr=0;r>>(devPtr,pitc

amp memcpy2d code pitch int c++cuda

c++ - gdb python编程: how to write code that will set breakpoints to every method of a C++ class?

我希望能够在gdb中为C++类的每个方法设置断点。我认为最简单的方法可能是python，因为现在python可以完全访问gdb。我对python知之甚少，而在它上面加上gdb，它就更难了。我想知道是否有人知道如何编写一个类python代码来为gdb中命名类的每个方法设置断点。最佳答案假设您使用调试符号进行编译，您甚至不需要python:rbreaksource.cpp:. 关于c++-gdbpython编程:howtowritecodethatwillsetbreakpointsto

amp 43 section python gdb c++debugging

c++ - 将 pthreads 与 CUDA 结合使用 - 设计问题

我正在编写一些需要一些磁盘I/O的代码，并调用我编写的库来执行一些计算和GPU工作，然后调用更多磁盘I/O将结果写回文件。我想将其创建为多线程代码，因为文件非常大。我希望能够读取文件的一部分，将其发送到GPU库，然后将一部分写回文件。涉及的磁盘I/O非常大(如10GB)，并且在GPU上的计算速度相当快。我的问题更像是一个设计问题。我应该使用单独的线程来预加载进入GPU库的数据，并且只让主线程实际执行对GPU库的调用，然后将结果数据发送到其他线程以写回磁盘，或者我是否应该继续让所有单独的线程各自完成自己的工作-获取一大块数据，在GPU上执行，然后写入磁盘，然后获取下一block数据？我正

amp pthreads section noreferrer noopener c++multithreading cuda gpu

c++ - 它是一个 gdb 错误吗？

1#include"string"2usingnamespacestd;34boolm_bInited=true;5intm_imaxsize=100;67inttest()8{9if(!m_bInited)10{11return-1;12}1314std::stringgbkInput="";15std::stringutf8Input="";16if(gbkInput.size()>m_imaxsize)17{18return1;19}20return0;21}2223intmain()24{25test();26return0;27}当使用第16行的gdbstep时，调试顺序是:

amp 43 gdb code return c++string

c++ - 在 CUDA 上乘以两个 float 变量

我有一个非常有趣的问题，但我花了3个小时才解决它，但我只是想不通发生了什么以及为什么它不起作用。我试过谷歌它，但没有结果。我正在CUDA上编写程序。我有一段非常简单的代码:__global__voidcalcErrorOutputLayer_kernel(*arguments...*){intidx=blockIdx.x*blockDim.x+threadIdx.x;floatgradient;floatderivation;derivation=pow((2/(pow(euler,neuron_device[startIndex+idx].outputValue)+pow(euler

上乘 amp code strong section c++c cuda gpu multiplication

c++ - gdb - 获取寄存器的变量名

在GDB中，inforegisters或infoall-registers将显示所有寄存器符号名称及其值。问题:如何获取存储在该寄存器中的变量名称(即来自源代码)？(或源代码中的行号，或任何东西)例如:intmy_reg=/*something*/;floatanother_reg=/*somethingelse*/;...那么，infoall-registers可能会返回:R00x00R10xfffbf016776176R20x00R30x00R40x66如何确定哪个寄存器(R0？R2？R4？)与my_reg“相关联”？最佳答案

寄存 amp code section c++c debugging gdb cpu-registers

c++ - CUB (CUDA UnBound) 相当于 thrust::gather

由于Thrust库存在一些性能问题(有关详细信息，请参阅thispage)，我计划重构一个CUDA应用程序以使用CUB而不是Thrust。具体来说，就是替换thrust::sort_by_key和thrust::inclusive_scan调用)。在我的应用程序的特定点上，我需要按键对3个数组进行排序。这就是我用推力做到这一点的方式:thrust::sort_by_key(key_iter,key_iter+numKeys,indices);thrust::gather_wrapper(indices,indices+numKeys,thrust::make_zip_iterator(

amp 相当 code thrust gather c++cuda parallel-processing gpu

10 11 121314 15 16