草庐IT

CUDA-ExecutionProvider

全部标签

opencv4.7.0编译opencv-contrib-4.7.0以及CUDA

0、引言最近工作中需要用到使用CUDA加速后的opencv进行传统算法的开发,在编程之前,需要先解决环境编译和lib库问题,本文就是记录自己编译opencv-4.7.0的全过程。1、CUDA下载和安装可参考我之前的博客WIN10安装配置TensorRT详解中的前几节,可以清楚的知道如何在Windows10系统上安装适合自己的CUDA以及验证CUDA是否可用2、opencv-4.7.0+opencv-contrib-4.7.0下载opencv的官方网站release了很多版本的opencv,如下图所示:博主选择opencv-4.7.0的sources进行下载。opencv-contrib-4.7

cuda安装

查看nvidia的版本516.94可安装11.4最新(实验室电脑)笔记本上安装cuda10.0第一次会让设置临时解压目录,笔记本c盘内存不足,于是在D盘新建了一个temp的文件(应该安装完成后会自动删除)。选择自定义此处没有选择默认路径,而是在D盘新建了一个cuda的文件夹。查看环境变量点击设置–>搜索高级系统设置–>查看环境变量【如果没有需要自己添加】此处我都有,啊哈哈哈NVCUDASAMPLES_ROOTNVCUDASAMPLES11_0_ROOT验证是否安装成功:运行cmd,输入nvcc--version即可查看版本号;setcuda,可以查看CUDA设置的环境变量。

cuda安装

查看nvidia的版本516.94可安装11.4最新(实验室电脑)笔记本上安装cuda10.0第一次会让设置临时解压目录,笔记本c盘内存不足,于是在D盘新建了一个temp的文件(应该安装完成后会自动删除)。选择自定义此处没有选择默认路径,而是在D盘新建了一个cuda的文件夹。查看环境变量点击设置–>搜索高级系统设置–>查看环境变量【如果没有需要自己添加】此处我都有,啊哈哈哈NVCUDASAMPLES_ROOTNVCUDASAMPLES11_0_ROOT验证是否安装成功:运行cmd,输入nvcc--version即可查看版本号;setcuda,可以查看CUDA设置的环境变量。

如何判断自己的电脑里有没有cuda以及查看cuda版本

CUDA是一种由NVIDIA推出的通用并行计算架构,能够帮助开发人员快捷地创建、测试和部署基于深度学习应用程序。而运行CUDA应用程序需要系统至少具有一个支持CUDA的显卡和CUDA工具包兼容的驱动程序,这些工具包括CUDASDK、CUDAStudio、CUDATestingKit、CUDASoftwareDevelopmentKit、CUDADeveloperKit、CUDAPackageKit和CUDAEnterpriseToolkit等,每一种都具备了强大的功能。显卡驱动和cuda版本信息查看方法:1、在命令行中输入【nvidia-smi】可以当前显卡驱动版本和cuda版本。2、如果提示

低版本CUDA安装/多版本切换/用户级CUDA安装

前言:我想要安装TorchV1.7.1,根据版本信息只有cuda10.2和11.0。但是,本地安装的CUDA版本为11.6和11.2,都不能满足需求。因此需要降低CUDA版本为10.2本机系统信息CUDA版本和显卡驱动nvidia-smi目前CUDA版本为11.6,如下图所示,显卡驱动为510.47.03(根据下面的对照表,降级成CUDA10.2没问题)ubuntu系统版本和架构unamelsb_release-aCUDA版本和驱动版本的对照表参照官网:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html如上图所示

【CUDA driver initialization failed, you might not have a CUDA gpu】pytorch 解决方案

文章目录问题描述问题原因解决方案参考问题描述在coding的时候我们经常在指定device的时候用这么一句代码:device='cuda'iftorch.cuda.is_available()else'cpu'但是有时候我们会发现device确实是放在了cpu上面,所以为了明确出错的原因,我们在shell里先import了torch,再执行torch.cuda.is_available(),发现在返回False结果之前给出了错误原因,其中部分内容就是我们在标题中写的。问题原因这种情况一般来说有两种原因gpu的计算能力过差pytorch慢慢已经不支持cc(computecapability)小于

RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the

bug:RuntimeError:Inputtype(torch.cuda.FloatTensor)andweighttype(torch.FloatTensor)shouldbethesame源代码如下:if__name__=="__main__":fromtorchsummaryimportsummarymodel=UNet()print(model)summary(model,input_size=(1,480,480))在使用torchsummary可视化模型时候报错,报这个错误是因为类型不匹配,根据报错内容可以看出Inputtype为torch.FloatTensor(CPU数据类型

重新安装CUDA;解决cudart64_100.dll not found问题

本文主要参考了这篇博文,建议移步这篇文章好些。https://blog.csdn.net/weixin_44606139/article/details/127493438笔者考研,长时间没搞了,本文当个笔记,写的比较傻。笔者在调Tacotron2的官模的时候出现的tensorflow检测不到GPU的问题+TypeError:Descriptorscannotnotbecreateddirectly.的问题,具体TypeError那个问题如何解决就直接看输出的建议解决方式即可,如果实在出现了相同问题可以参考这篇https://blog.csdn.net/qq_45738555/article/

CUDA流:利用并行执行提高性能

引言CUDA流是CUDA编程中一个非常重要的概念。流(Stream)是异步执行CUDA命令序列的一种机制,它允许利用设备并行性,从而提高应用程序的性能。在本文中,将介绍CUDA流的基本概念、如何创建和使用流,以及如何利用流来并行执行多个CUDA命令序列,以便在GPU上提高应用程序的性能。1.CUDA流概述流是CUDA并行计算中的一种重要机制。在CUDA编程中,CPU和GPU之间的数据传输是一个非常耗时的操作。但是,在CPU执行数据传输的同时,GPU可以执行计算操作。CUDA流允许在GPU上并行执行多个CUDA命令序列,以充分利用设备并行性,提高应用程序的性能。在CUDA中,每个流都表示一组按顺

如何正确下载PyTorch、CUDA版本!!

因为在torch框架里经常出现NVIDIA、CUDA、PyTorch这几个不兼容,等等一些让人头疼的问题。这里总结正确下载pytorch的方法。目录安装pytorch安装CUDA安装pytorch一.查看自己cuda版本方法一: 方法二:CMD中输入:nvidia-smi 我的是CUDA版本12.0,版本向下兼容,意思就是CUDA12.0及以下版本的都可以安装二.打开pytorch的官网:PyTorchAnopensourcemachinelearningframeworkthatacceleratesthepathfromresearchprototypingtoproductiondepl