草庐IT

libtorch_cuda_cu

全部标签

pytorch的安装(CUDA10.2+cuDNN8.3.3+torch1.10+​torchvision​0.11.1+python3.9)

(已存网盘和硬盘,文件夹含三个文件)本文基本逻辑是:一、先根据电脑硬件的条件获取本身CUDA版本,据此以及表格比较得出cuDNN、torch、torchvision、python版本。二、在NVIDIA官网下载CUDA和cuDNN,获取torch的下载链接,网页提供python3.9的下载链接三、安装CUDA后,把cuDNN这个补丁装到CUDA里边,因为CUDAtoolkit是CUDA的工具包,cuDNN是CUDA的加速器补丁;用环境为python3.9的pycharm执行官网的pip命令操作完成torch和torchvision的下载最后检查—————————————————————————

pytorch的安装(CUDA10.2+cuDNN8.3.3+torch1.10+​torchvision​0.11.1+python3.9)

(已存网盘和硬盘,文件夹含三个文件)本文基本逻辑是:一、先根据电脑硬件的条件获取本身CUDA版本,据此以及表格比较得出cuDNN、torch、torchvision、python版本。二、在NVIDIA官网下载CUDA和cuDNN,获取torch的下载链接,网页提供python3.9的下载链接三、安装CUDA后,把cuDNN这个补丁装到CUDA里边,因为CUDAtoolkit是CUDA的工具包,cuDNN是CUDA的加速器补丁;用环境为python3.9的pycharm执行官网的pip命令操作完成torch和torchvision的下载最后检查—————————————————————————

windows - 未检测到支持 CUDA 的设备

我是CUDA编程新手,完全卡住了。当我尝试运行提供的deviceQuery实用程序或示例应用程序之一时,出现以下错误:cudaGetDeviceCountreturned38noCUDA-capabledeviceisdetected.我使用的是Windows7,64位。我安装了VisualStudio2012,然后安装了CUDA5.064位。我的显卡是NVIDIAGeForceGTS250。今天我去了NVIDIA网站并重新安装了显卡的最新驱动程序。除了“确保您安装了有效的驱动程序”之外,我在Windows中找不到任何对此错误的支持。有谁知道可能出了什么问题?

C++使用ffmpeg解码v模块,支持cpu解码、amd64平台的cuda解码和NX平台的Nvmpi解码

仓库代码:https://gitee.com/liudegui/ffmpeg_decode_videoffmpeg_decode_video使用ffmpeg解码video模块,支持3种解码:cpu解码、amd64平台的cuda解码和NX平台的Nvmpi解码封装库只依赖ffmpeg,测试程序中用到了OpenCV,可用于将帧送往opencv检测程序ref:https://github.com/FFmpeg/FFmpeg/blob/master/doc/examples/hw_decode.cref:https://github.com/chinahbcq/ffmpeg_hw_decode概要该库希

windows - 如何以编程方式杀死 CUDA 内核

我有一个CUDA内核,它在我的旧Tesla卡中使用了20多秒。如果内核运行时间超过20秒,我想以编程方式终止CUDA内核。我的意图是,如果内核运行时间超过20秒,则应终止该内核并运行另一个精度较低的内核。我的操作系统是Windows764位。CUDA版本为5.0。GPU为特斯拉C1060请帮助我在不退出应用程序的情况下终止CUDA内核。 最佳答案 您可以使用assert从内核中停止现有内核的运行。(失败)在CC2.0或更高版本的设备上。然而,我认为这不会达到既定目的,至少不方便。您还可以使用cudaDeviceReset()从主机端

将 C 代码与 CUDA 链接时出现 CMake 错误

我在使用cmake构建项目时遇到链接错误。该构建在使用makefile(手动生成/无cmake)的Linux上运行良好,但Windows构建给我带来了问题。这是一个演示我的方法的准系统示例:我在同一目录中有3个文件(kernel.cu、kernel.h、main.c)主.c:externvoidkernel_wrapper();intmain(){kernel_wrapper();}内核.h:#ifndefKERNELH#defineKERNELHextern"C"voidkernel_wrapper();#endif内核.cu:#include#include"kernel.h"__

c++ - 使用 CMake、CUDA 9.0 RC 和 Visual Studio 2017 安装带有 contrib 模块的 OpenCV 3.3.0

我正在尝试使用最新的CUDA9.0RC安装带有contrib模块的OpenCV3.3.0,因此它与MicrosoftVisualStudio2017兼容。CUDA安装很简单,并成功集成到VS2017中。我正在根据各种在线说明使我能够在没有CUDA的情况下成功构建contrib模块。但是,当我运行CMake时(确保我将其设置为VS2017x64,请参阅:CMake:CUDAlibrariesnotfoundwhencompilingOpenCV),我得到了经典的:CMakeError:Thefollowingvariablesareusedinthisproject,buttheyare

c++ - 如何使用 CUDA c++ 将 vector 乘以矩阵

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭10年前。任何人都可以帮助我,我如何使用CUDAc++将vector(1*N)和矩阵(N*M)相乘并将结果存储在新vector(1*M)上。

c++ - CUDA 对 CPU 和 GPU 具有相同的功能

这个问题在这里已经有了答案:CUDAfunctioncall-ablebyeitherthedeviceorhost(1个回答)关闭8年前。为了从主机代码和GPU内核调用相同的函数,我是否必须保留相同函数的两个拷贝,如下所示:intsum(inta,intb){returna+b;}__deviceintsumGPU(inta,intb){returna+b;}或者是否有任何技术可以保留/管理函数的单个拷贝?

c++ - Cuda C++ 中的简单文件 I/O

我现在正在研究CudaC++。但是我在使用CUDA读写文件时遇到了问题。如何在CudaC++中实现文件输入输出过程?我想将.obj文件读入我的Cuda内核。我该怎么办? 最佳答案 使用普通主机(C++)文件操作读取文件。如果需要,然后使用普通的cudaMalloc和cudaMemcpy操作将数据传输到设备。您无法直接在CUDAC++中实现文件I/O,因为没有用于此的API,而且GPU不直接连接到文件系统。您必须通过操作系统才能获得文件系统服务。 关于c++-CudaC++中的简单文件I/