草庐IT

cuda-c-programming-guide

全部标签

c++ - 我怎样才能让 Doxygen 知道 CUDA 内核调用?

我正在尝试使用Doxygen记录一个用CUDAC编写的项目。该文档工作正常。然而,调用者图不包括内核调用,如GPU_foo>>().例如,在这个简单的例子中:#include/*!*@briefglobalhellofoo*/__global__voidglobal_hello(void){printf("Hello\n");}/*!*@briefCPUhellofoo*/voidhello(void){printf("Hello\n");}/*!*@briefmain*/intmain(){hello();global_hello>>();return0;}使用相应的Doxyfile

c++ - 从 python 使用 Opencv Cuda 函数

对于我的一个类(class)项目,我需要使用OpenCVsGPU库。我正在处理使用OpenCVpython的现有代码,我的工作是找到一种访问OpenCVCuda库的方法,因为目前没有可访问的Python绑定(bind)到OpenCV的各种CUDA模块。我现在非常需要的两个函数是cuda::warpPerspective和cv::cuda::DescriptorMatcher::knnMatch()。我尝试按照@ostrumvulpes在AccessingOpenCVCUDAFunctionsfromPython(NoPyCUDA)中的建议来实现warpPerspective它工作得很好

c++ - 在 CUDA 源文件上使用 clang-tidy

存在多种专为C/C++设计的静态分析工具,但它们对于测试CUDA源代码并不是特别有用。自clangversion6能够编译CUDA,我想使用clang-tidy检查我的选项,它似乎没有切换架构的选项。有没有办法让它工作?例如用于打开CUDA解析器的编译时开关、自定义检查形式的扩展,或者它可能是计划中的功能? 最佳答案 基于clang的工具的一个问题是它们不以与clang完全相同的方式解析文件。第一个问题是,与C/C++编译不同,CUDA编译对源码进行了多次编译。默认情况下,当您给它一个CUDA文件时,clang会创建多个编译作业,并

c++ - 通过索引运算符插入到 boost::program_options::variables_map

我有一个boost::program_options::variables_map参数。现在我想像键值对一样手动插入到这个map中。示例:boost::program_options::variables_mapargsargs["document"]="A";args["flag"]=true;问题是我已经有了这两个选项desc.add_options()("document",po::value())("flag",po::value());但有时他们从命令行得到空输入。所以如果它们是空的,那么我必须在po::variables_mapargs本身中更新它们

c++ - Boost.Program_options 固定数量的 token

Boost.Program_options提供了一种通过命令行参数传递多个标记的工具,如下所示:std::vectornums;po::options_descriptiondesc("Allowedoptions");desc.add_options()("help","Producehelpmessage.")("nums",po::value>(&nums)->multitoken(),"Numbers.");po::variables_mapvm;po::store(po::parse_command_line(argc,argv,desc),vm);po::notify(vm

c++ - 如何在 Lua 脚本中创建 GUID?如果有帮助,请使用 LuaPlus

我目前正在使用LuaPlus开发一个项目,我需要能够使用GUID,但似乎无法在lua中找到它们。当我为lua构建数据时,没有setGUID,有设置数字、设置字符串等。还有一个Set()函数。有谁知道将GUID从c++传递到lua以及从lua传递到c++的正确方法。非常感谢。更新:谢谢大家的回复。感谢您的快速回复。我实际上不会经常搜索类型转换,主要是在我们加载所有内容时在前端搜索。但是,我可能有点担心太多,因为游戏有点小而且不会有大量Actor无论如何。我正在考虑在lua中编写一个优化的字符串比较,您可以在其中针对测试参与者检查GUID的第一个字符。如果通过,则转到第二个,依此类推。如果

c++ - boost::program_options 值 vector 与 zero_token

我正在尝试使用boost::program_options解析以下语法:a)$a.outverbosity:0b)$a.out-vverbosity:1c)$a.out-v-vverbosity:2d)$a.out-vvverbosity:2e)(optional)$a.out-v3verbosity:3到目前为止我的计划:#include#includenamespacepo=boost::program_options;intmain(intargc,char*argv[]){po::options_descriptiondesc;desc.add_options()("verbo

c++ - 非确定性输出的 CUDA 调试程序

我正在我的Ubuntu10.1064位系统上调试我的基于CUDA4.0/Thrust的图像重建代码,我一直在尝试找出如何调试我的输出图像出现的运行时错误一些随机的“噪音”。我的代码中没有随机数生成器输出,所以我希望输出在运行之间保持一致,即使它是错误的。然而,这不是……我只是想知道是否有人有调试此类CUDA运行时错误的通用程序。我没有在我的cuda内核中使用任何共享内存。我努力避免任何涉及全局内存的竞争条件,但我可能会遗漏一些东西。我试过使用gpuocelot,但它在识别我的一些CUDA和CUSPARSE函数调用时遇到了问题。此外,我的代码通常可以正常工作。就在我更改此设置时,我得到了

c++ - 使用cuda创建共现矩阵

//Thisismykernelfunction__global__voidcreateSCM(Pixel*pixelMat,//imageintimgRows,//imagedimensionsintimgCols,int*matrizSCM,//CoocurrencematrixintnumNiveles,//coocurrencematrixlevels=256intdelta_R,//value={-1,0or1}intdelta_C)//value={-1,0or1}{inti=blockIdx.y*blockDim.y+threadIdx.y;intj=blockIdx.x

c++ - CUDA 推力 : copy from device to device

我使用标准CUDAmalloc在CUDA中分配了一个内存数组,并将其传递给函数,如下所示:voidMyClass::run(uchar4*input_data)我还有一个类成员,它是一个推力device_ptr声明为:thrust::device_ptrdata=thrust::device_malloc这里的num_pts是数组中值的个数,input_data指针保证是num_pts长。现在,我想将输入数组复制到thrust_device_ptr中。我看过推力文档,其中很多都在谈论从设备复制到主机内存,反之亦然。我想知道在推力上执行此设备到设备复制的最佳性能最佳方式是什么,还是我应该