草庐IT

cuda-nvcc

全部标签

conda环境下使用nvcc -V报错nvcc: command not found的一种解决方法

前言缘起 实验室的学弟问我为什么他使用nvcc命令报错,起先我以为他用的是老师给的root账户,按照参考文献1便可以解决问题。 但由于并非root用户,/usr/local下没有cuda,于是便无法按照参考1中的方法去做。 这里提供一种方法,其实是参考了文献2,但似乎是歪打正着,因为2要解决的问题和我的不一样O_o。问题 使用nvcc-V报错如下解决方法 报错原因在于当前conda环境没有安装nvcc,于是使用如下命令安装即可condainstall-cnvidiacuda-nvcc 补充:执行上述命令后会默认安装cuda-nvcc的最新版本,于是这里涉及到cuda-nvcc版本号的确定问题,

关于linux:CUDA CUDPP .so建设

CUDACUDPP.sobuilding我想在我的项目中使用CUDPP库。我已经从项目页面下载了源代码。不幸的是,当我运行"make"时,只有静态库构建。我查看了Makefile文件并没有找到任何动态库配置。我不想在项目中保留静态库-它完全是不可移植的方式。我的问题是:如何构建CUDPP的.so动态库,而无需编写自己的Makefile/手动编译它?也许有人已经这样做了?编辑:我已将"g"替换为"g-fPIC",将"gcc"替换为"gcc-fPIC",并将"nvcc"替换为"nvcc-Xcompiler-fpic"。当我从存档中解压缩obj文件并将它们链接到共享库时,我没有收到任何错误。但是,当

关于linux:CUDA CUDPP .so建设

CUDACUDPP.sobuilding我想在我的项目中使用CUDPP库。我已经从项目页面下载了源代码。不幸的是,当我运行"make"时,只有静态库构建。我查看了Makefile文件并没有找到任何动态库配置。我不想在项目中保留静态库-它完全是不可移植的方式。我的问题是:如何构建CUDPP的.so动态库,而无需编写自己的Makefile/手动编译它?也许有人已经这样做了?编辑:我已将"g"替换为"g-fPIC",将"gcc"替换为"gcc-fPIC",并将"nvcc"替换为"nvcc-Xcompiler-fpic"。当我从存档中解压缩obj文件并将它们链接到共享库时,我没有收到任何错误。但是,当

关于 c :cuda 文件没有与 C 文件中定义的函数链接

cudafiledidnotlinkwithfunctiondefinedinCfile我有一个cuda文件test.cu,其中包含一个文件cuda.h。cuda.h包含test.cu.中使用的以下函数定义externvoidcheck_error(cudaError_tstatus);这个函数在cuda.c中定义如下:voidcheck_error(cudaError_tstatus){  cudaError_tstatus2=cudaGetLastError();  if(status!=cudaSuccess)  {     constchar*s=cudaGetErrorString(

关于 c :cuda 文件没有与 C 文件中定义的函数链接

cudafiledidnotlinkwithfunctiondefinedinCfile我有一个cuda文件test.cu,其中包含一个文件cuda.h。cuda.h包含test.cu.中使用的以下函数定义externvoidcheck_error(cudaError_tstatus);这个函数在cuda.c中定义如下:voidcheck_error(cudaError_tstatus){  cudaError_tstatus2=cudaGetLastError();  if(status!=cudaSuccess)  {     constchar*s=cudaGetErrorString(

cuda中动态分配的C类?

C++classeswithdynamicallocationincuda?我对将C类移植到CUDA有一个基本的疑问,我找不到一个直接、明确的答案来说明这到底是什么痛苦。我想有人会同意宿主的C代码会经常在构造函数和析构函数中使用new/delete运算符。考虑轻松将C代码移植到CUDA,很少有帖子声称它"简单",或者说更容易和更容易,并且给出的主要原因是带有__host____device__装饰器的示例。在一些帖子中不难发现,设备中的动态分配通常意味着性能的严重损失。那么,应该如何处理CUDA中的C类?添加装饰器不会改变发生在构造函数和析构函数核心的内存动态分配。似乎确实需要在没有new/d

在 C 中使用 CUDA 进行 Opencv 加速

OpencvaccelerationwithCUDAinC++我是HPC学生,我使用OpenCV函数和C进行项目编码。我必须并行代码以获得高性能,所以我决定使用CUDA加速。我对以下内容感到困惑a€|为了获得高性能,仅使用CUDA就足够了吗?我可以将OpenCV::GPU或OpenCV::CUDA与CudaGPU一起使用吗?OpenCV::GPU和OpenCV::CUDA有什么不同?只有拥有NVIDIA卡才能使用CUDA编程。仅当您进行并行处理时,才会使用通用GPU硬件的功能。例如,如果您正在处理图像,则图像的每个像素都有单独的操作。然后GPU编程有助于节省您的计算时间。在您的应用程序中,第二

cuda中动态分配的C类?

C++classeswithdynamicallocationincuda?我对将C类移植到CUDA有一个基本的疑问,我找不到一个直接、明确的答案来说明这到底是什么痛苦。我想有人会同意宿主的C代码会经常在构造函数和析构函数中使用new/delete运算符。考虑轻松将C代码移植到CUDA,很少有帖子声称它"简单",或者说更容易和更容易,并且给出的主要原因是带有__host____device__装饰器的示例。在一些帖子中不难发现,设备中的动态分配通常意味着性能的严重损失。那么,应该如何处理CUDA中的C类?添加装饰器不会改变发生在构造函数和析构函数核心的内存动态分配。似乎确实需要在没有new/d

在 C 中使用 CUDA 进行 Opencv 加速

OpencvaccelerationwithCUDAinC++我是HPC学生,我使用OpenCV函数和C进行项目编码。我必须并行代码以获得高性能,所以我决定使用CUDA加速。我对以下内容感到困惑a€|为了获得高性能,仅使用CUDA就足够了吗?我可以将OpenCV::GPU或OpenCV::CUDA与CudaGPU一起使用吗?OpenCV::GPU和OpenCV::CUDA有什么不同?只有拥有NVIDIA卡才能使用CUDA编程。仅当您进行并行处理时,才会使用通用GPU硬件的功能。例如,如果您正在处理图像,则图像的每个像素都有单独的操作。然后GPU编程有助于节省您的计算时间。在您的应用程序中,第二

关于 c :CUDA 5.5 nvlink undefined reference (inheritance)

CUDA5.5nvlinkundefinedreference(inheritance)我一直在研究我的GPU-raytracer实现,但由于我是CUDA的新手,我在编译和链接单独的.cu文件时遇到了一些问题。我的2个课程:Shader和Lambert。Lambert继承了Shader接口。当我编译时,我收到以下错误:Error4errorMSB3721:Thecommand""G:\\Development\\CUDAToolkit\\CUDAToolkitv5.5\\bin\vcc.exe"-dlink-o"Debug\\CUDARayTracer.device-link.obj"-Xco