草庐IT

CUDA-ExecutionProvider

全部标签

基于Docker的深度学习环境NVIDIA和CUDA部署以及WSL和linux镜像问题

基于Docker的深度学习环境部署1.什么是Docker?2.深度学习环境的基本要求3.Docker的基本操作3.1在Windows上安装Docker3.2在Ubuntu上安装Docker3.3拉取一个pytorch的镜像3.4部署自己的项目3.5导出配置好项目的新镜像4.分享新镜像4.1将镜像导出为tar分享给他人4.2或者将镜像推送到云仓库5.使用新镜像6.跨平台造成nvidia-smi不可用的问题6.1确认是该问题6.2win2linux问题如何解决?6.2.1手动创建软链接6.2.2使用Dockfile自动完成6.3linux2win问题如何解决?6.3.1在WSL使用时手动删除软链接

【MacOS】MacBook使用本机m1芯片GPU训练的方法(mps替代cuda)

记录:对于tensorflow环境配置,即使替换了M1适配的anaconda,使用苹果官方适配m1的tensorflow安装命令,仍旧出现各种问题,可见现在的M1版anaconda还是存在很大问题。所以在屡次不服气的碰壁下我还是改用了miniforge3…真香!so,建议使用miniforge3管理,miniforge3可以理解成miniconda/annoconda的社区版,提供了更稳定的对M1芯片的支持。使用miniforge3可成功安装支持m1版的tensorflow及pytorchMPS介绍(MacM1芯片为了追求高性能和节能,在底层设计上使用的是一种叫做arm架构的精简指令集,不同于

【stable-diffusion】4090显卡下dreambooth、lora、sd模型微调的GUI环境安装(cuda驱动、pytorch、xformer)

相关博文stable-diffusion-webui的基础功能手动安装,了解代码结构、依赖、模型出处安装成功结果主要参考cuda11.7下载-https://developer.nvidia.com/cuda-toolkit-archivecudnn8.6for11.x:https://developer.nvidia.com/rdp/cudnn-archivedreambooth\lora训练环境:最原始的命令端https://github.com/kohya-ss/sd-scriptsGUI端口https://github.com/bmaltais/kohya_ss环境安装参考:win11

cuda 安装和卸载 (Ubuntu 2204)

cuda需要Nvidia显卡或计算卡,AMD或intel显卡不行(但是也有套他们的标准)就算是亮机卡也可使用,比如GT710这种建议使用ubuntu来装,因为cuda就是在这个平台上开发的,当然别的linux系统也行以下操作在ubuntuserver2204,如果没有安装ubuntu系统,可以参考Ubuntuserver安装图解注意!请根据需要安装对应版本的cuda!不同版本安装大同小异主要思路:安装N卡(硬件),安装依赖、安装N卡驱动,安装nvcc、安装cuda另外,你可能还需要pytorch等常用的组件,在选择版本前务必根据你自己的需要选取,部分组件对操作系统也有要求,为了少做重复劳动,先

3050显卡驱动安装+配置pytorch的cuda环境

3050显卡驱动安装+配置pytorch的cuda环境前言一、下载3050驱动二、下载CUDA二、cuDNN下载三、cuDNN配置四、pytorch环境配置①、创建虚拟环境前言因为有一块3050的显卡,更新驱动的时候把之前配好的cuda10.0覆盖了,因此需要重新配置一下环境。记录一下过程,方便后面自己尽快恢复环境。一、下载3050驱动N卡的驱动下载过程都是一样的,先进入官网驱动程序下载选择对应的配置,有的是笔记本的,注意区分一下。配置好了就下载,下载好驱动程序后打开运行,简易安装即可。安装完出现NVIDIA控制面板则代表成功了。二、下载CUDA我之前安装的10.1版本用不了,只能重新安装11

Ubuntu18及22安装NVIDIA驱动、CUDA、CUDNN、Pytorch

前言安装pytorch的教程网上有许多,我记录并分享下自己两台笔记本上安装NVIDIA驱动、CUDA、CUDNN、Pytorch的过程和心得。首先说明,安装pytorch-gpu需要完成nvidia驱动安装、CUDA安装、CUDNN安装、torch库安装,其中CUDA和CUDNN版本要对应,不同版本的torch对CUDA版本有要求,nvidia驱动决定了你可以安装多高版本的CUDA,因此这些东西的版本不能随便乱装,我的安装版本是:联想GTX1050笔记本:Ubuntu18+驱动470+CUDA10.0+CUDNNfor10.0+torch1.0.0+python3.6Ubuntu18+驱动47

CMake编译CUDA项目报错

CMake编译CUDA项目报错现象解决方法结果现象configure后显示如下错误CMakeErroratC:/ProgramFiles/CMake/share/cmake-3.26/Modules/CMakeDetermineCompilerId.cmake:751(message):CompilingtheCUDAcompileridentificationsourcefile“CMakeCUDACompilerId.cu”failed.同时,注意到下面报错为C:\ProgramFiles\MicrosoftVisualStudio\2022\Community\MSBuild\Micro

CUDA实例系列一: 矩阵乘法优化

CUDA实例系列一----矩阵乘法优化很多朋友在学习CUDA的时候都会面临一个题目----矩阵乘法,这也是CUDA最广泛的应用之一.本文将详细讲解如何利用GPU加速矩阵乘法的计算.话不多说,先上代码,再解释:#include#include#include"error.cuh"#defineBLOCK_SIZE16__managed__inta[1000*1000];__managed__intb[1000*1000];__managed__intc_gpu[1000*1000];__managed__intc_cpu[1000*1000];__global__voidgpu_matrix_m

深度学习中的GPU与CUDA

对应视频教程:https://www.bilibili.com/video/BV1S5411X7FY/文章目录1.显卡(GPU)与驱动2.显卡与CUDA3.如何查看自己的显卡1.显卡(GPU)与驱动显卡,也称之为GPU。GPU的全称是GraphicsProcessingUnit(图形处理单元)。它出现的目的一目了然,就是用来显示图像的。没错,就是用来在电脑显示器上显示图像的。大家其实只要知道我们的电脑都有显卡这一点就行了。但我们在深度学习中说的显卡(GPU)一般特指是英伟达(NVIDIA)品牌的显卡,这个我们后面慢慢来说。除了显卡这个概念之外,还有个概念是驱动。驱动,相信大家都不陌生。我们有的

CUDA生态和ROCm生态对比分析

1介绍CUDACUDA是Nvidia于2006年推出的一套通用并行计算架构,旨在解决在GPU上的并行计算问题。其易用性和便捷性能够方便开发者方便的进行GPU编程,充分利用GPU的并行能力,可以大幅提高程序的性能。自从CUDA诞生以来,CUDA生态系统也迅速的发展,包括了大量的软件开发工具、服务和解决方案。CUDAToolkit包括了库、调试和优化工具、编译器和运行时库。ROCmAMDROCm是RadeonOpenCompute(platform)的缩写,是2015年AMD公司为了对标CUDA生态而开发的一套用于HPC和超大规模GPU计算提供的开源软件开发平台,ROCm只支持Linux平台。同样