libtorch_cuda_cu

【bug记录】RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm

问题在训练到一定迭代次数之后报错：RuntimeError:CUDAerror:CUBLAS_STATUS_EXECUTION_FAILEDwhencallingcublasSgemm(handle,opa,opb,m,n,k,&alpha,a,lda,b,ldb,&beta,c,ldc)可能的原因shape维度不匹配变量不在同一个device上pytorch和cuda版本不匹配解决方案在train.py文件的开头加上os.environ['CUDA_VISIBLE_DEVICES']='0'，并且设置device='cuda'。但是有一个很奇怪的现象：如果不设置可见gpu，而是指定devic

Ubuntu20.04安装CUDA&&cudnn（初学者详细图文教程）

文章目录准备工作CUDA安装cudnn安装准备工作注：本机系统为Ubuntu20.041.安装显卡驱动打开‘软件和更新，点击附加驱动安装显卡驱动。2.gcc安装若系统为Ubuntu22.04，则需要安装。在终端输入一下指令，查看有没有gcc。gcc--version3.gcc安装本机ubuntu20.04gcc自带版本为9.4.0安装gcc-7，command：sudoapt-getinstallgcc-7g++-7安装完gcc-7，系统中就存在两个版本的gcc，因此要设置默认的gcc，命令如下：sudoupdate-alternatives--install/usr/bin/gccgcc/u

【Windows】怎么查看CUDA版本？Conda命令安装和NVIDIA官网安装包安装的CUDA有何区别？nvcc -V和nvidia-smi获得的CUDA版本有何区别？如何指定CUDA版本？

一、如何查看CUDA版本？1.1查看runtime版本的CUDA（1）nvcc-V或nvcc--version（2）在CUDA的include文件夹中找到cuda.h文件打开后搜索version。上面这张图的cuda路径是我在安装的时候自定义的，不要完全参考。（3）查看conda指令安装的CUDA版本用下面的代码去查看CUDA和cudnn版本。importtorchprint(torch.__version__)print(torch.version.cuda)print(torch.backends.cudnn.version()) 下面是我在虚拟环境1和2上运行的结果，有一个结果cuda

Jetson Xavier NX编译OpenCV(with cuda)

JetsonXavierNX默认安装的OpenCV4.5.4(不带cuda)，因项目要求OpenCV使用cuda作加速，因此，须重新编译OpenCV。这里为了方便直接在目标机上面编译，避免复杂的环境及依赖。1.下载OpenCV源代码下载地址：OpenCV·GitHub我这里下载opencv-4.5.4，opencv_contrib-4.5.4，下载后并解压。2.卸载原来的OpenCVsudoapt-getpurgelibopencv*python-opencv查看是否卸载：libs:pkg-configopencv--libsversion:pkg-configopencv--modversi

Linux/Debian/Ubuntu-OpenCV(4.5.4/4.6.0)+CUDA(11.3)配置编译全流程

文章目录前言相关资源下载OpenCVCUDA下载CUDNN下载编译错误异常前言本文用来记录在linux环境下docker中编译OpenCVwithcuda的过程，同时编译了4.5.4和4.6.0两个版本均可编译通过。本地是linux环境也可参考本文完成编译。系统：debian11CPU：i7内存：16G显卡：NvidiaQuadroM2000相关资源下载OpenCVgithub直接下载连接：OpenCV4.5.4sourcecodeOpenCV4.6.0sourcecode如需下载其他版本可自行通过下述链接下载：githubreleasepageCUDA下载对应CUDA版本最低显卡驱动要求1，

Jetson系列开发板/Linux安装OpenCV，编译CUDA模块，流程详解

一、前言本文主要介绍JetsonOringNano,JetsonNano,JetsonTX2这三块开发板上OpenCV的卸载安装及编译（支持CUDA模块）；解决了一些出现的问题。二、卸载OpenCV如何查看本机安装的OpenCV是否支持CUDA?如果已安装jtop，可以直接使用jtop查看，命令如下。sudojtop按数字6查看INFO页面（某些开发板是7INFO），可以看到：*OpenCV: 4.1.1 compiledCUDA: NO从官网拉下来的OpenCV（已编译）是不支持CUDA加速的，无法充分利用GPU。如果未安装jtop，可以使用以下命令查看opencv库：pkg-config-

学习记录：Windows系统cuda11.6，安装pytorch1.12.0、python3.9

1、查看显卡相关信息：nvidia-smi。显卡版本531.18，最大可以安装cuda12.1版本，安装步骤上一篇博客讲解过。2、查看cuda版本：nvcc-V3、查看anaconda是否安装：conda-V4、查询cuda11.6对应的pytorch版本：https://pytorch.org/get-started/previous-versions/显示对应的pytorch1.12.0、1.12.1，接着查询适合的python版本3.7、3.8、3.9、3.105、创建环境，安装pytorch1.12.0、python3.9condacreate-nlearnpython==3.9con

RuntimeError: CUDA out of memory 已解决

先说下我的电脑环境：win103060titorch10python3.8cuda11.3RuntimeError:CUDAoutofmemory.Triedtoallocate128.00MiB(GPU0;23.70GiBtotalcapacity;7.44GiBalreadyallocated;87.88MiBfree;7.71GiBreservedintotalbyPyTorch)Ifreservedmemoryis>>allocatedmemorytrysettingmax_split_size_mbtoavoidfragmentation.SeedocumentationforMem

cuda、cudnn、英伟达驱动版本对应关系

根据显卡型号、cuda版本确定英伟达驱动版本能够支持某一型号的GPU的英伟达驱动是一定的，我们想使用的tensorflow版本也是已知的，该tensorflow版本依赖的cuda版本也是一定的。所以根据显卡型号和cuda版本可以确定显卡驱动。参考链接：https://www.jianshu.com/p/7f6ae178121chttps://blog.csdn.net/weixin_42545878/article/details/94735192英伟达驱动、cuda、cudnn之间版本的对应关系：https://docs.nvidia.com/cuda/cuda-toolkit-releas

Ubuntu22.04安装CUDA11.8和CUDNN

下载CUDA11.8下载CUDA11.8选择对应的系统架构OS版本逐步执行上图命令编辑环境变量文件sudogedit~/.bashrc配置环境变量exportPATH=/usr/local/cuda-11.8/bin:$PATHexportLD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH重启重启重启重要的事情说三边查看版本nvcc-V结果安装cudnn下载cudnn找到适合你的cudnnhttps://developer.nvidia.com/rdp/cudnn-archive#a-collapse7415-10安装cudn