草庐IT

tiny-cuda-nn

全部标签

睿智的目标检测——YoloV7-Tiny-OBB旋转目标检测算法部署

YoloV7-OBB旋转目标检测算法部署学习前言源码下载安装TensorRT1.TensorRT简介2.下载TensorRT3.TensorRT安装安装torch2trt1.torch2trt简介2.torch2trt安装模型转换结果比对学习前言本文将借助torch2trt工具实现Yolov7-Tiny-OBB算法的TensorRT快速推理。源码下载https://github.com/Egrt/yolov7-tiny-obb喜欢的可以点个star噢。安装TensorRT1.TensorRT简介官网链接:https://developer.nvidia.com/tensorrtNVIDIA®T

睿智的目标检测——YoloV7-Tiny-OBB旋转目标检测算法部署

YoloV7-OBB旋转目标检测算法部署学习前言源码下载安装TensorRT1.TensorRT简介2.下载TensorRT3.TensorRT安装安装torch2trt1.torch2trt简介2.torch2trt安装模型转换结果比对学习前言本文将借助torch2trt工具实现Yolov7-Tiny-OBB算法的TensorRT快速推理。源码下载https://github.com/Egrt/yolov7-tiny-obb喜欢的可以点个star噢。安装TensorRT1.TensorRT简介官网链接:https://developer.nvidia.com/tensorrtNVIDIA®T

如何正确查看pytorch运行时真正调用的cuda版本

一般情况我们会安装使用多个cuda版本。而且pytorch在安装时也会自动安装一个对应的版本。正确查看方式: 想要查看Pytorch实际使用的运行时的cuda目录,可以直接输出之前介绍的cpp_extension.py中的CUDA_HOME变量。importtorchimporttorch.utilsimporttorch.utils.cpp_extensiontorch.utils.cpp_extension.CUDA_HOME上面输出的/usr/local/cuda即为软链接的cuda版本。  不正确查看方式:事实上,使用torch,version.cuda命令查看输出的cuda的版本并不

ARM架构下银河麒麟V10系统基于CUDA11.8编译PyTorch

概述公司近期想尝试本地用下ChatGLM模型,只有服务器安装了两张显卡,故而只能在服务器做尝试。CUDA驱动啥的,之前的同事已经安装完毕,并且成功识别出显卡,顾略去。按照GITREADME步骤开搞,一切顺利,最后在运行脚本的时候收到如下提示RuntimeError:NotcompiledwithCUDAsupport因为服务器是ARM的(CPU是PhytiumST2500)。字面意思,官方编译aarch64版本的PyTorch并没有开启CUDA支持。初步怀疑自己安装的不对,一通百度、google、bing,发现其他安装方法都得依赖conda这个工具,然后安装Miniconda3,Anacond

AI绘画——使用stable-diffusion生成图片时提示RuntimeError: CUDA out of memory处理方法

提示显存不足RuntimeError:CUDAoutofmemory.Triedtoallocate1.50GiB(GPU0;8.00GiBtotalcapacity;5.62GiBalreadyallocated;109.75MiBfree;5.74GiBreservedintotalbyPyTorch)Ifreservedmemoryis>>allocatedmemorytrysettingmax_split_size_mbtoavoidfragmentation.SeedocumentationforMemoryManagementandPYTORCH_CUDA_ALLOC_CONF1、

AI绘画——使用stable-diffusion生成图片时提示RuntimeError: CUDA out of memory处理方法

提示显存不足RuntimeError:CUDAoutofmemory.Triedtoallocate1.50GiB(GPU0;8.00GiBtotalcapacity;5.62GiBalreadyallocated;109.75MiBfree;5.74GiBreservedintotalbyPyTorch)Ifreservedmemoryis>>allocatedmemorytrysettingmax_split_size_mbtoavoidfragmentation.SeedocumentationforMemoryManagementandPYTORCH_CUDA_ALLOC_CONF1、

pytorch中nn.ModuleList()使用方法

定义ModuleList我们可以将我们需要的层放入到一个集合中,然后将这个集合作为参数传入nn.ModuleList中,但是这个子类并不可以直接使用,因为这个子类并没有实现forward函数,所以要使用还需要放在继承了nn.Module的模型中进行使用。model_list=nn.ModuleList([nn.Conv2d(1,5,2),nn.Linear(10,2),nn.Sigmoid()])x=torch.randn(32,3,24,24)formodelinmodel_list:model_list(x)使用ModuleList定义网络classNet(nn.Module):def__

CUDA和显卡驱动以及pytorch版本的对应关系

1支持CUDA的GPU  支持CUDA的NVIDIAQuadro和NVIDIARTXCUDAGPU|NVIDIADeveloper您的GPU计算能力您是否正在寻找GPU的计算能力然后查看以下表格。您可以在这里了解更多计算能力。NVIDIAGPU为全球数百万台台式机笔记本电脑工作站和超级计算机提供动力加速了消费者专业人士科学家和研究人员的计算密集型任务开始使用CUDA和GPU计算并免费加入我们的NVIDIA开发者计划。https://developer.nvidia.com/zh-cn/cuda-gpus#compute 2怎么知道nvidia显卡该用什么CUDA版本呢?在官网查询nvidia显

ubuntu将cuda卸载干净

先进入安装目录下的bin文件夹中cd/usr/local/cuda-12.0/bin执行cuda自带的卸载程序然后勾选我们要卸载的12.0版本,选择done卸载成功

0参数量 + 0训练,3D点云分析方法Point-NN刷新多项SOTA

论文链接:https://arxiv.org/pdf/2303.08134.pdf代码地址:https://github.com/ZrrSkywalker/Point-NN本文提出了一个用于3D点云分析的非参数网络Point-NN,它仅由纯不可学习的组件组成:最远点采样(FPS)、k近邻(k-NN)、三角函数(TrigonometricFunctions)以及池化(Pooling)操作。不需要参数和训练,它能够在各种3D任务上都取得不错的准确率,甚至在few-shot分类上可以大幅度超越现有的完全训练的模型。基于Point-NN的非参数框架,这项研究对于当前3D领域的贡献如下:1、首先,我们可