草庐IT

Pytorch-CUDA

全部标签

Ubuntu20.04下载cuda11.3+cuDNN8.2.0,卸载cuda11.6+cuDNN8.4全记录【保姆级教程】

文章目录0.前言1.安装cuda2.安装cuDNN2.1下载安装包和3个验证文件2.2解压安装包2.3配置相关库2.4验证cudnn是否安装成功2.4.1记录过程中的一些报错3.卸载cuda3.1切换到安装文件夹3.2执行自动卸载的脚本3.3查看是否卸载成功4.卸载cuDNN4.1查看安装的cuDNN4.2删除三个包4.3删除repo包0.前言CUDA(ComputeUnifiedDeviceArchitecture)是由NVIDIA公司推出的一种高性能并行计算架构。它利用GPU的并行处理能力,能够显著提高计算效率,尤其在科学计算、数据分析、深度学习等领域具有广泛应用。CUDA提供了一套编程模

使用c++onnxruntime部署yolov5模型并使用CUDA加速(超详细)

文章目录前言1.Yolo简介2.onnxruntime简介3.Yolov5模型训练及转换4.利用cmake向C++部署该onnx模型总结前言接到一个项目,需要用c++和单片机通信,还要使用yolo模型来做到目标检测的任务,但目前网上的各种博客并没有完整的流程教程,让我在部署过程费了不少劲,也踩了不少坑(甚至一度把ubuntu干黑屏)。于是想把训练及部署过程记录下来,并留给后来者方便使用。(博主使用的系统是ubuntu20.04)1.Yolo简介作为一个经典且实用的目标检测模型,yolo的性能强大已无需多言,现在(2023.4.1)yolo模型已经推出到yolov8,但是推理速度上yolov5还

PyTorch入门(一):Tensors

PyTorch入门(一):Tensors  张量(Tensors)是线性代数中的重要概念,它在数学和物理学中扮演着重要的角色,并在计算机科学领域中得到广泛应用。张量可以被看作是多维数组(或矩阵)的推广,它可以包含任意数量的维度。  在数学和物理学中,张量被用于描述物理量的属性和变换规律。它可以表示向量、矩阵、标量等,以及它们之间的运算和相互关系。张量具有坐标无关性,这意味着它的表示方式与坐标系的选择无关,只与物理量的本质属性有关。  在计算机科学领域,张量广泛应用于机器学习和深度学习等领域。在这些领域中,张量被用于表示和处理多维数据。例如,在图像处理中,一幅图像可以表示为一个三维张量,其中的每

在windows11环境下CUDA和cuDNN安装教程(超详细).卸载CUDA、安装CUDA的nsight visual studio edition失败的情况、vs2019里面没有CUDA新建项目

文章目录我的下载步骤顺序2->3->4->4.1->4.1.1->4.2->4.1.2注意事项1.前言2.cuda的下载及安装2.1如何判断自己应该下载什么版本的cuda呢?2.2下载CUDA2.3下载地址3.下载CUDNN3.1下载地址4.安装CUDA和cuDNN4.1安装CUDA4.1.1配置环境变量4.1.2配置SDK4.1.3验证deviceQuery和bandwidthTest4.1.4测试一下4.2安装cuDNN5.卸载CUDA6.安装CUDA失败的情况1.nsightvisualstudioedition失败1.1第一种方式1.2第二种方式7.VS2019+CUDA11.1新建项

【亲测】ubuntu20.4利用conda安装yoloV8 CUDA(python)环境

搭建yoloV8之前请确保显卡驱动程序及CUDA环境安装完成并且电脑中已经安装了miniconda3,我们用miniconda来管理yoloV8环境。安装CUDA+显卡驱动请参照:【亲测】ubuntu20.4显卡驱动+CUDA11.8一起安装_Coding_C++的博客-CSDN博客一、在miniconda创建yoloV8环境1、在miniconda上先创建一个环境命名为yolov8condacreate-nyolov8python=3.112、输入y 3、此时在miniconda上一个空环境就完成了4、激活刚创建的环境二、在创建的新环境(yolov8)下安装pytorch环境1、登陆pyto

配置VScode开发环境-CUDA编程

如果觉得本篇文章对您的学习起到帮助作用,请点赞+关注+评论,留下您的足迹💪💪💪本文主要介绍VScode下的CUDA编程配置,因此记录以备日后查看,同时,如果能够帮助到更多人,也不胜荣幸。文章目录一、创建compile_commands.json1、cmake中使用2、make中使用二、安装必要的插件1.远程连接ssh2.C/C++3.C/C++ExtensionPack4.NsightVisualStudioCodeEdition5.vscode-cudacpp三、配置c_cpp_properties.json四、配置setting.json五、配置tasks.json六、配置launch.j

快速解决深度学习推理过程cuda或tensorRT推理速度变慢的办法【亲测有效】

文章目录前言一、场景再现场景一场景二二、原因分析三、解决办法总结前言各位朋友,好久不见,距离上一次更博已经过去三月有余。这段时间里博主基于LabVIEW探索开发了一些工具包,包括OpenVIN工具包、TensoRT工具包以及一键训练工具包,这几天会整理一下分享给大家,今天要和大家分享的是好多朋友私信问我的深度学习推理过程中cuda或tensorRT变慢的问题。一、场景再现场景一以yolov5为例,为了节省开销,深度学习模型导入后,相机实时抓图,条件触发推理检测,也就是只有满足某个条件,才进行推理检测。在该场景下,发现使用CUDA加速推理检测的速度竟然比使用CPU实时循环抓图检测的速度都要慢,如

【玩转Jetson TX2 NX】(十)TX2 NX 安装Archiconda3+创建pytorch环境(详细教程+错误解决)

1写在前面的话该篇文章创建pytorch环境部分,大家谨慎参考。本以为已经完全解决错误,但实际上pytorch最终并未配置在所创建虚拟环境中,本人能力有限,实在搞不定,故大家可在此博客的踩坑基础上,继续前行,争取一次创建成功,加油!2TX2NX安装Archiconda3Archiconda下载链接:https://github.com/Archiconda/build-tools/releases进入界面如下,下载即可:将下载文件拷贝到JetsonTX2NX中,如图所示:输入命令安装./Archiconda3-0.2.3-Linux-aarch64.sh可能无法正常安装,这里需要给文件Arch

[PyTorch][chapter 63][强化学习-时序差分学习]

目录:  蒙特卡罗强化学习的问题  基于转移的策略评估  时序差分评估   Sarsa-算法  Q-学习算法一 蒙特卡罗强化学习的的问题   有模型学习:Bellman等式        免模型学习:蒙特卡罗强化学习  迭代:    使用策略  生成一个轨迹,    fort=0,1,...T-1do#完成多次采样的动作         :累积奖赏        求平均累积奖赏作为期望累积奖赏(有模型学习)的近似               1.1优点:      便于理解      样本数足够时可以保证收敛性      2.2 缺点      状态值的学习互相独立      没有充分状态之间

【opencv】【GPU】windows10下opencv4.8.0-cuda Python版本源码编译教程

【opencv】【GPU】windows10下opencv4.8.0-cudaPython版本源码编译教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【opencv】【GPU】windows10下opencv4.8.0-cudaPython版本源码编译教程前言准备工具anaconda/cuda/cudnnanaconda创建环境(选做)安装原生python(选做)cmakeopencv4.8.0opencv_contribCMake编译VS2019编译可能出现的问题cmake编译过程中可能出现的问题VS2019编译过程中可能出现的问题测试使用GPU总结前言Ope