草庐IT

tiny-cuda-nn

全部标签

opencv-cuda开发(1):opencv-cuda对比CPU的加速测试

目录测试环境测试代码1测试代码2总结首先问问神奇的GPT 个人总结优化思路测试环境显卡:1050TI,CPU:I9-13900CUDA版本11.4opencv版本4.8.0测试代码1每次只进行一次运算,记录时间不包括读取图片和上传GPU的过程//cpucodecv::MatverticalProjection;cv::MathorizontalProjection;cv::MatdiffImage,diffImage2;cv::MattestImage=imread("test.png",0);cv::MatbackImage=imread("background.png",0);cv::Ma

【多版本cuda自由切换】在ubuntu上安装多个版本的CUDA,并且可以随时切换cuda-11.3//cuda-11.8//cuda-11.6//cuda-11.2

问题描述    项目开发中,不同的项目可能对不同的cuda版本有所要求,常见的是这几种cuda-11.3//cuda-11.8//cuda-11.6,按照之前的认知,一个主机只能安装一个版本的cuda,否则会引起环境混乱,知道cuda底层逻辑的人都知道这有多么扯蛋,对吧。    也正是因为受到这个东西的折磨,今天通学了一下底层逻辑和具体实操。解决办法        NVIDIA的显卡驱动与CUDA的版本并不是严格的一一对应关系,CUDA实际上也只是一个工具包,我们可以根据自己的需求进行安装,即可以安装多个CUDA版本。同时CUDNN是一个SDK,专门用于神经网络的加速包,它与CUDA也没有严格

CUDA简介, 配置和运行第一个CUDA程序(Windows和Linux)

CUDA简介CUDA(ComputeUnifiedDeviceArchitecture)是由NVIDIA开发的一种通用并行计算架构。CUDA允许程序员利用NVIDIAGPU的并行计算能力,加速各种计算密集型应用程序。CUDA技术基于GPU的并行计算原理。传统的CPU处理器拥有少量的核心,可以同时执行少量的线程。但是,现代GPU拥有数百甚至上千个核心,可以同时执行大量的线程,实现高度并行计算。CUDA技术通过将CUDA代码编译成针对GPU的指令,利用GPU的并行处理能力,加快程序执行速度。CUDA提供了一个基于C语言的编程模型和一组库,使程序员能够轻松地编写并行计算代码。CUDA代码可以在主机C

【GPU】linux 安装、卸载 nvidia 显卡驱动、cuda 的官方文档、推荐方式(runfile)

文章目录1.显卡驱动1.1.各版本下载地址1.2.各版本文档地址1.3.安装、卸载方式2.CUDA2.1.各版本下载地址2.2.各版本文档地址2.3.安装、卸载方式2.4.多版本CUDA切换方式1.显卡驱动1.1.各版本下载地址https://www.nvidia.com/Download/Find.aspx?lang=zh-cn1.2.各版本文档地址在下载页面选择具体驱动版本后,在其他信息框即可找到README文档链接1.3.安装、卸载方式以535.129.03版本为例(文档地址:https://download.nvidia.com/XFree86/Linux-x86_64/535.129

CUDA与PyTorch版本对应关系

PyTorch版本CUDA版本1.2.0、1.4.0、1.5.0、1.5.1、1.6.0、1.7.0、1.7.19.21.0.0、1.0.1、1.1.0、1.2.010.01.4.0、1.5.0、1.5.1、1.6.0、1.7.0、1.7.1、1.8.110.11.5.0、1.5.1、1.6.0、1.7.0、1.7.1、1.8.0、1.8.1、1.8.2、1.9.0、1.9.1、1.10.0、1.10.1、1.11.0、1.12.0、1.12.110.21.7.0、1.7.111.01.8.0、1.8.1、1.8.2、1.9.0、1.9.1、1.10.0、1.10.111.11.8.1、1.9

Ubuntu22.04系统安装软件、显卡驱动、cuda、cudnn、pytorch

Ubuntu22.04系统安装软件、显卡驱动、cuda、cudnn、pytorch安装Nvidia显卡驱动安装CUDA安装cuDNN安装VSCode安装Anaconda并更换源在虚拟环境中安装GPU版本的PyTorchReference这篇博文主要介绍的是Ubuntu22.04系统中软件、显卡驱动、cuda、cudnn、pytorch等软件和环境的安装和配置,在上一篇博文Ubuntu22.04双系统安装、配置及常用设置中介绍了Ubuntu22.04双系统的安装、配置、终端常用操作的快捷键以及一些常用设置(如同步时间、更改启动默认项、添加右击新建文件选项、创建桌面快捷方式等),有需要的可自行点击

CUDA|Windows 系统 CUDA、NVCC、CUDNN 版本查看方法

显卡、CUDADriver、NVCC、CUDAToolkit、CUDNN含义详见:https://zhuanlan.zhihu.com/p/91334380CUDA官方文档地址:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html(翻译:【翻译】CUDA12.0Toolkit主要组件版本说明)1.显卡步骤1:打开命令提示符(CMD)步骤2:进入CUDA安装目录(例如C:\ProgramFiles\NVIDIAGPUComputingToolkit\CUDA\v9.0\extras\demo_suite)步骤3:执行

[解决torch.nn.CrossEntropy()] Assertion `t >= 0 && t < n_classes` failed.的一种情况

 错误信息如下../aten/src/ATen/native/cuda/NLLLoss2d.cu:93:nll_loss2d_forward_kernel:block:[0,0,0],thread:[xxx,0,0]Assertion`t>=0&&t运行背景:Linux/Windows都有,我是先用nnUnet预处理了医学数据,由于它有b好多不同的类别,也就是多数据集联合训练,有A,B,C三种类别(A不等于B不等于 C),直接读取NifTi是没有问题的,读取预处理的npz格式数据,开始报错,本来以为是不是类别传错了,缩减到一个数据集也是报错.最后注释掉CrossEntropy()就不报错了,找

ubuntu22安装cuda12.3、cudnn8.9.6及NVIDIA TAO TOOLKIT

ubuntu221050ti显卡安装cuda12.3、cudnn8.9.6及NVIDIATAOTOOLKIT没有代理的同学,先把你的源改为国内源,清华阿里都可以!没有代理的同学,先把你的源改为国内源,清华阿里都可以!没有代理的同学,先把你的源改为国内源,清华阿里都可以!步骤1:安装NVIDIA显卡驱动首先,确保你的系统中已经安装了合适版本的NVIDIA驱动程序。可以使用以下命令安装:sudoubuntu-driversautoinstall步骤2:安装CUDA访问NVIDIA官方网站:https://developer.nvidia.com/cuda-downloads?target_os=L

RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb

今天跑一个项目时遇到了如下问题:RuntimeError:CUDAerror:CUBLAS_STATUS_EXECUTION_FAILEDwhencallingcublasSgemm(handle,opa,opb,m,n,k,&alpha,a,lda,b,ldb,&beta,c,ldc)简单查了一下,有说:1不同模块对device设置不同的;2cuda和pytorch版本不匹配;3shape维度不匹配简单分析了一下,我的pytorch用的还是1.4.0版本,cuda由于用的30系列,之前看帖子说30系列最好使用11.0以上版本的cuda,否则会报错。我也就没有尝试,直接安装了cuda11.6。