草庐IT

pytorch_model

全部标签

狂肝两万字带你用pytorch搞深度学习!!!

深度学习基础知识和各种网络结构实战...狂肝两万字带你用pytorch搞深度学习!!!深度学习前言一、基本数据:Tensor1.1Tensor的创建1.2torch.FloatTensor1.3torch.IntTensor1.4torch.randn1.5torch.range1.6torch.zeros/ones/empty二、Tensor的运算2.1torch.abs2.2torch.add2.3torch.clamp2.4torch.div2.5torch.pow2.6torch.mm2.7torch.mv三、神经网络工具箱torch.nn3.1nn.Module类3.2搭建简易神经网

狂肝两万字带你用pytorch搞深度学习!!!

深度学习基础知识和各种网络结构实战...狂肝两万字带你用pytorch搞深度学习!!!深度学习前言一、基本数据:Tensor1.1Tensor的创建1.2torch.FloatTensor1.3torch.IntTensor1.4torch.randn1.5torch.range1.6torch.zeros/ones/empty二、Tensor的运算2.1torch.abs2.2torch.add2.3torch.clamp2.4torch.div2.5torch.pow2.6torch.mm2.7torch.mv三、神经网络工具箱torch.nn3.1nn.Module类3.2搭建简易神经网

Pytorch 多GPU训练

Pytorch多GPU训练目录Pytorch多GPU训练1导入库2指定GPU2.1单GPU声明2.2多GPU声明3数据放到GPU4把模型网络放到GPU【重要】torch.nn.DataParallel(DP)5其他:多GPU并行1导入库importtorch#深度学习的pytoch平台importtorch.nnasnnfromtorch.autogradimportVariablefromtorch.utils.dataimportDataLoaderfromtorch.utils.dataimportTensorDataset 2指定GPU2.1单GPU声明device=torch.dev

如何正确查看pytorch运行时真正调用的cuda版本

一般情况我们会安装使用多个cuda版本。而且pytorch在安装时也会自动安装一个对应的版本。正确查看方式: 想要查看Pytorch实际使用的运行时的cuda目录,可以直接输出之前介绍的cpp_extension.py中的CUDA_HOME变量。importtorchimporttorch.utilsimporttorch.utils.cpp_extensiontorch.utils.cpp_extension.CUDA_HOME上面输出的/usr/local/cuda即为软链接的cuda版本。  不正确查看方式:事实上,使用torch,version.cuda命令查看输出的cuda的版本并不

【论文&代码阅读】LORA: LOW-RANK ADAPTATION OF LARGE LAN- GUAGE MODELS

最近很多工作好像都绕不开lora,无论是sd还是llm....1.背景问题:大模型重新训练所有模型参数的完全微调变得不太可行。lora在做什么我们提出了低秩自适应,即LoRA,它冻结预先训练的模型权重,并将可训练的秩分解矩阵注入Transformer架构的每一层为什么work?学习过的参数化模型实际上存在于较低的内在维度上,因此假设模型自适应过程中权重的变化也具有较低的“内在秩”。LoRA允许我们通过优化适应过程中密集层变化的秩分解矩阵来间接训练神经网络中的一些密集层,同时保持预先训练的权重冻结该结论基于MeasuringtheIntrinsicDimensionofObjectiveLand

【强化学习】——Q-learning算法为例入门Pytorch强化学习

🤵‍♂️个人主页:@Lingxw_w的个人主页✍🏻作者简介:计算机研究生在读,研究方向复杂网络和数据挖掘,阿里云专家博主,华为云云享专家,CSDN专家博主、人工智能领域优质创作者,安徽省优秀毕业生🐋希望大家多多支持,我们一起进步!😄如果文章对你有帮助的话,欢迎评论💬点赞👍🏻收藏📂加关注+ 目录1、强化学习是什么1.1定义1.2基本组成1.3马尔可夫决策过程2、强化学习的应用3、常见的强化学习算法3.1Q-learning算法3.2Q-learning的算法步骤3.3Pytorch代码实现1、强化学习是什么1.1定义强化学习(ReinforcementLearning,RL)是一种机器学习方法,

pytorch中的矩阵切片操作完全讲解

我们经常需要从2维或3维tensor中进行切片操作,比如从mask模型中取出mask所在位置的向量。Talkischeap,showmecode. 以下所有维度从0开始,3维即0,1,2importtorchx=torch.tensor([[1,2,3],[4,5,6],[7,8,9]])print(x[[1,2],[0,2]])#第0维取1,2即[4,5,6],[7,8,9],在取出的第0维中,分别取第0个和2个,即4,9,输出[4,9]#tensor([4,9])#当第一维不指定值时,表示第一维的每一个都按第二维取值,如print(x[:,[0,2]])#会输出第一维每行的第0,2个,即,

ARM架构下银河麒麟V10系统基于CUDA11.8编译PyTorch

概述公司近期想尝试本地用下ChatGLM模型,只有服务器安装了两张显卡,故而只能在服务器做尝试。CUDA驱动啥的,之前的同事已经安装完毕,并且成功识别出显卡,顾略去。按照GITREADME步骤开搞,一切顺利,最后在运行脚本的时候收到如下提示RuntimeError:NotcompiledwithCUDAsupport因为服务器是ARM的(CPU是PhytiumST2500)。字面意思,官方编译aarch64版本的PyTorch并没有开启CUDA支持。初步怀疑自己安装的不对,一通百度、google、bing,发现其他安装方法都得依赖conda这个工具,然后安装Miniconda3,Anacond

论文笔记--LLaMA: Open and Efficient Foundation Language Models

论文笔记--LLaMA:OpenandEfficientFoundationLanguageModels1.文章简介2.文章概括3文章重点技术3.1数据集3.2模型训练4.数值实验5.文章亮点6.原文传送门7.References1.文章简介标题:LLaMA:OpenandEfficientFoundationLanguageModels作者:Touvron,Hugo,etal.日期:2023期刊:arxivpreprint2.文章概括  文章利用公开数据集训练并发布了一系列大语言模型LLaMA,在多个NLP下游任务中性能超过了GPT-3和PALM等模型。3文章重点技术3.1数据集Englis