草庐IT

cuda-convnet

全部标签

windows安装cuda简易教程

        为了利用GPU进行深度学习等,或者为了安装pytorch对应版本,我们需要安装cuda。一、cuda版本选择:        我们首先需要了解自己电脑能够安装的cuda版本:    1.打开NVIDIA控制面板:     2.选择:帮助->系统信息    3.点击:组件     从图中我们可以看到本电脑的cuda最高可以安装10.1版本。二、cuda下载:2.1 最新版:可以不看,直接看后面简易版     1.进入cuda官网:NVIDIADeveloper​         2.点击Downloads,之后点击CUDAToolkit:​     3.Downloadnow:​

python - pytorch 如何从张量中删除 cuda()

我得到了TypeError:expectedtorch.LongTensor(gottorch.cuda.FloatTensor)。如何将torch.cuda.FloatTensor转换为torch.LongTensor?Traceback(mostrecentcalllast):File"train_v2.py",line110,inmain()File"train_v2.py",line81,inmainmodel.update(batch)File"/home/Desktop/squad_vteam/src/model.py",line131,inupdateloss_adv=s

python - 无法编译 cuda_ndarray.cu : libcublas. so.7.5:无法打开共享对象文件

我正在尝试在aws实例中导入theano库以使用GPU。我已经使用boto编写了一个python脚本来自动执行aws设置,它基本上会从我的本地计算机对实例执行ssh,然后在我执行“python-c'importtheano'”的地方启动bash脚本启动GPU。但是我收到以下错误:ERROR(theano.sandbox.cuda):Failedtocompilecuda_ndarray.cu:libcublas.so.7.5:cannotopensharedobjectfile:Nosuchfileordirectory当我尝试在实例命令shell中直接导入theano模块时,它会自动

python - 将 C++/CUDA 类传递给 PyCUDA 的 SourceModule

我有一个用C++编写的类,它也使用了cuda_runtime.h中的一些定义,这是名为ADOL-C的开源项目的一部分,你可以看看here!这在我使用CUDA-C时有效,但我想以某种方式在PyCUDA中导入此类,如果有可能的话。因此,我将在内核内部(而不是在“main”中)使用此类来定义用于计算函数导数的特定变量。有没有办法将此类传递给PyCUDA的SourceModule?我问了一个类似的问题,但在这里我想多解释一下。因此,有一个解决方案使用nvcc-cubin(感谢talonmies)编译我的C代码,然后使用driver.module_from_file()导入它,但是,我想使用So

python - 警告 (theano.sandbox.cuda) : CUDA is installed, 但设备 gpu 不可用(错误:cuda 不可用)

在UbuntuMATE16.04中,我尝试使用GPU在此处运行深度学习python示例:testingTheanowithGPU我确实运行了示例代码,THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32pythoncheck1.py不过好像用的是CPU,不是GPU。这是终端输出的最后一部分:WARNING(theano.sandbox.cuda):CUDAisinstalled,butdevicegpu0isnotavailable(error:cudaunavailable)...Usedthecpu我也试过运行这段代码:THEAN

python - python distutils可以编译CUDA代码吗?

我有CUDA代码,我想使用distutils为Python构建一个动态库。但即使安装了“nvcc”编译器,distutils似乎也无法识别“.cu”文件。不确定如何完成。 最佳答案 Distutils默认无法编译CUDA,因为它不支持同时使用多个编译器。默认情况下,它会根据您的平台设置编译器,而不是您拥有的源代码类型。我在github上有一个示例项目,其中包含一些猴子补丁到distutils中以破解以支持这一点。示例项目是一个C++类,它管理一些GPU内存和一个CUDA内核,包裹在swig中,并且所有这些都只用pythonsetup

python - 从 Python 访问 OpenCV CUDA 函数(无 PyCUDA)

我正在编写一个Python应用程序,它使用OpenCV的Python绑定(bind)来进行标记检测和其他图像处理。我想使用OpenCV的CUDA模块来CUDA加速我应用程序的某些部分,并在他们的.hpp文件中注意到他们似乎正在使用Python和Java的OpenCV导出宏。但是,我似乎无法访问这些CUDA函数,即使我正在构建OpenCVWITH_CUDA=ON。是否有必要使用PyCUDA等包装器来访问GPU函数,例如cudaarithm中的阈值?或者,如果我在我的Python代码中调用cv2.threshold()(而不是基于CPU的常规实现),是否已经使用了这些CUDA加速函数?CV

在Windows10环境安装CUDA11.7及PyTorch1.13--使用Nvidia RTX A4000开始炼丹之旅

在Windows10环境安装CUDA11.7及PyTorch1.13–使用NvidiaRTXA4000开始炼丹之旅前言这个双十一,RTX3090矿卡反倒是涨价了,RTX3090Ti当然也涨价了。。。只好从x宝搞一只工包丽台RTXA4000,唯一的好处就是显存大并且便宜。。。较RTX306012G,16G显存能玩的时间可能也长一点,毕竟现在是4K屏,显存大当然更从容些。硬件配置之前有写过:https://lizhiyong.blog.csdn.net/article/details/123294308主板:x99f8dCPU:e52696v3*2【36核72线程】内存条:DDR4ECC32G*8

python - 让 TensorFlow 使用由自定义 CUDA 例程即时生成的训练数据

假设我们生成自己的训练数据(例如,通过从一些扩散过程中采样并计算一些感兴趣的数量)并且我们有自己的CUDA例程,称为generate_data,它在GPU内存中为给定的一组输入生成标签.因此,我们处于一个特殊的环境中,我们可以以“在线”方式生成任意数量的训练数据批处理(在每次批处理迭代中,我们调用generate_data例程来生成新批处理并丢弃旧批处理).既然数据是在GPU上生成的,有没有办法让TensorFlow(PythonAPI)在训练过程中直接使用它?(例如填充占位符)这样,这样的管道会很有效。我的理解是,目前您需要在这样的设置中将数据从GPU复制到CPU,然后让Tensor

ubuntu18.04 cuda卸载及安装

1.若电脑上已经安装了其他版本的cuda及显卡驱动,需要完全卸载并删除相关文件,否则会导致安装不成功,执行如下:1.1卸载cuda,步骤如下:cd/usr/local/cuda-xx.x/bin/(进入你的cuda文件夹下)sudo./cuda-uninstallersudorm-rf/usr/local/cuda-xx.x(删除cuda文件夹)1.2卸载驱动,步骤如下:sudoapt-getremove--autoremovenvidia-cuda-toolkitsudoapt-getpurgenvidia-cuda-toolkit若上面的命令无效,则执行:sudonvidia-uninst