草庐IT

tiny-cuda-nn

全部标签

聊聊关于分类和分割的损失函数:nn.CrossEntropyLoss()

目录1.nn.CrossEntropyLoss()2.多分类中nn.CrossEntropyLoss()的应用3.分割中 nn.CrossEntropyLoss()的应用3.1测试文件3.2 输出可视化3.3 softmax 3.4log 3.5 CrossEntropyLoss1.nn.CrossEntropyLoss()分类中,经常用nn.CrossEntropyLoss()交叉熵损失函数y为真实值、y(hat)为预测值 这种采用了one-hot编码的形式,多分类中,只有一个label为1softmax可以将数据以概率的形式输出,所以输出是在0-1之间,那么log就会是负数,因此交叉熵损失

看这篇就够了——ubuntu系统中的cuda cudnn cudatookit及pytorch使用

一.基本概念1.1nvidia独立显卡独立显卡是指以独立板卡形式存在,可在具备显卡接口的主板上自由插拔的显卡。独立显卡具备单独的显存,不占用系统内存,而且技术上领先于集成显卡,能够提供更好的显示效果和运行性能。显卡作为电脑主机里的一个重要组成部分,对于喜欢玩游戏和从事专业图形设计的人来说显得非常重要。以前民用显卡图形芯片供应商主要包括ATI和NVIDIA两家。ubuntu需要自己安装nvidia驱动才能使用nvidia,安装nvidia驱动程序,可以让系统正确识别nVIDIA的图形显示卡,,进行2D/3D渲染,发挥显示卡应有的效能。1.2CUDA        CUDA(ComputeUnif

科技提升安全,基于YOLOv7【tiny/yolov7/yolov7x】开发构建商超扶梯场景下行人安全行为姿态检测识别系统

在商超等人流量较为密集的场景下经常会报道出现一些行人在扶梯上摔倒、受伤等问题,随着AI技术的快速发展与不断普及,越来越多的商超、地铁等场景开始加装专用的安全检测预警系统,核心工作原理即使AI模型与摄像头图像视频流的实时计算,通过对行为扶梯上的行为进行实时检测识别来对出现的危险行为进行快速预警响应避免后续出现严重的后果。本文的主要目的就是想要基于商超扶梯场景来开发构建行人安全行为检测识别系统,探索分析基于AI科技提升安全保障的可行性,本文是AI助力商超扶梯等场景安全提升的第六篇文章,前文系列如下:《科技提升安全,基于SSD开发构建商超扶梯场景下行人安全行为姿态检测识别系统》https://blo

3D Gaussian Splatting的cuda code总结

总结视频来源:https://www.youtube.com/watch?v=1buFrKUaqwM总结视频来源作者:AI葵3D高斯分布投影到图像上,每个像素投影到该像素上的高斯数不同,因此不能用pytorch并行化处理一、前向传播前向传播计算投影出来圆圈的半径计算圆圈覆盖的像素数(把画面分成了很多个方块,记录圆与哪些方块相连)计算每个高斯的前后顺序(alpha合成)计算每个像素的颜色1.preprocessCUDAdiff-gaussian-rasterization/cuda_rasterizer/forward.cu预处理CUDApreprocessCUDA函数用于解决第一个和第二个问题

超详细||深度学习环境搭建记录cuda+anaconda+pytorch+pycharm

本文用来记录windows系统上深度学习的环境搭建,目录如下一、安装显卡驱动首先为装有NVIDIAgpu的电脑安装显卡驱动,如果安装过了,或者想使用cpu的,可以跳过这一步。(其实这一步可以跳过,因为显卡驱动好想和深度学习环境没什么关系,保险起见还是安装上吧)1.去官网下载对应的显卡驱动:官方驱动|NVIDIA   2.完成下载,选择文件开始安装,直接解压在默认地址3.选择自定义安装选项,执行清洁安装(按情况选择)4.一直点下一步即可。二、安装VisualStudio可以跳过,但是很多深度学习环境需要用到,建议安装1.官网下载VisualStudioTools-免费安装Windows、Mac、

【Ubuntu20.04 CUDA11.1+Torch1.10+Anaconda 保姆级安装教程】

安装CUDA时需要和Torch版本对应起来,最好先去torch官网上确定要安装的torch版本对应的CUDA版本。在安装CUDA之前需要先确定是否已经安装驱动,打开终端输入nvidia-smi,若有输出,则表明驱动安装过,否则需要先安装驱动(驱动安装教程)一、CUDA11.1安装1、CUDA11.1下载先去CUDA官网上下载要安装的版本(CUDA11.1下载链接),依次选择Linux——》x86_64——》Ubuntu——》20.04——》runfile(local),根据自己的电脑配置选择即可打开终端,先复制第一条语句到终端下载CUDAwgethttps://developer.downlo

远程深度学习服务器配( cuda + cudnn + nvidia-cuda-toolkit + docker + vscode)

目录一、远程服务器端配置1.宿主机基本环境配置安装ubuntu18.04安装nvidia显卡驱动安装cuda11.0.3安装cudnn2.配置docker安装docker安装NVIDIAContainerToolkit安装镜像创建容器二、内网穿透1.创建zeirtier账号2.在宿主机上安装zerotier3.在本地机上安装zerotier三、本地机端配置1.安装并配置VSCode2.安装Xshell7和Xftp7一、远程服务器端配置宿主机配置为:显卡1070ti,系统ubuntu18.04,cuda11.0.3,cudnn8.0.51.宿主机基本环境配置安装ubuntu18.04安装ubun

PyTorch + CUDA 版本匹配安装

目录1.问题描述2.调查和解决2.1初步调查2.2官网安装方法2.3如果还是不匹配呢?1.问题描述        系统:Windows10,CUDA11.1.96        开始学习PyTorch。在用PyTorch进行一个深度学习训练时发现报告以下Warning信息:rank_zero_deprecation(GPUavailable:False,used:FalseTPUavailable:False,using:0TPUcoresIPUavailable:False,using:0IPUsHPUavailable:False,using:0HPUs        有点纳闷。用Tens

Pytorch复习笔记--nn.Conv2d()和nn.Conv3d()的计算公式

1--基本知识        nn.Conv2d()和nn.Conv3d()分别表示二维卷积和三维卷积;二维卷积常用于处理单帧图片来提取高维特征;三维卷积则常用于处理视频,从多帧图像中提取高维特征;    三维卷积可追溯于论文3DConvolutionalNeuralNetworksforHumanActionRecognition;    三维卷积使用三维卷积核,在T、H和W三个维度进行移动,以提取时间特征和空间特征,一个简单示意图如下:2--基本用法importtorchimporttorch.nnasnnif__name__=="__main__":B=8C=3T=10H=255W=25

ubuntu 18.04下安装Anaconda、Cuda、Cudnn、gpu-Pytorch

    登录服务器后,首先查看下系统版本:cat/proc/version,我们这个服务器有点特殊是arm版本的,通过nvidia-smi查看服务器显卡配置,这意味着我们要安装的cuda版本最高不能超过11.4,那么我们这里选择一个比较稳定的版本cuda11.3。1. anaconda安装:由于cpu不是intel的,需要安装arm版本的anaconda那么肯定会问,为什么要安装它呢:Anaconda是一个打包的集合,官网,它里面预装好了conda、某个版本的python、众多packages、科学计算工具等等。Anaconda支持Linux,Mac,Windows系统,提供了包管理与环境管理