草庐IT

一文带你入门Transformer

让我们初学一下Transformer,它确实相对难以理解,下面让我们开始吧!朋友们.Don'tworryaboutit前提在这里我们用x表示文本位置→输入用Tx表示文本长度用y表示输出的文本位置用Ty表示输出的文本长度目前这里有一个文本X:HarryPotterandhermionegrangerinventedanewspell这里我们用one-hot独热矩阵,每一个文本都会对应于1个one-hot,但是我们一个输入文本就要有一个one-hot,这样就会造成大量的参数,于是提出了RNN接下来我们学习RNNRNN模型这里的Wax、Waa、Wya都是参数,就和我们之前学神经网络的W是一个意思下面

一文带你入门Transformer

让我们初学一下Transformer,它确实相对难以理解,下面让我们开始吧!朋友们.Don'tworryaboutit前提在这里我们用x表示文本位置→输入用Tx表示文本长度用y表示输出的文本位置用Ty表示输出的文本长度目前这里有一个文本X:HarryPotterandhermionegrangerinventedanewspell这里我们用one-hot独热矩阵,每一个文本都会对应于1个one-hot,但是我们一个输入文本就要有一个one-hot,这样就会造成大量的参数,于是提出了RNN接下来我们学习RNNRNN模型这里的Wax、Waa、Wya都是参数,就和我们之前学神经网络的W是一个意思下面

安装pytorch-gpu的经验与教训

首先说明本文并不是安装教程,网上有很多,这里只是自己遇到的一些问题我是以前安装的tensorflow-gpu的,但是发现现在的学术论文大部分都是用pytorch复现的,因此才去安装的pytorch-gpu查看自己安装的CUDAnvcc-V这里我提供一个安装tensorflow时所用的CUDA对应表 安装cuDNN时版本一定要对应正确  安装完CUDA时要改一下环境变量  只用添加这个就好,其他三个CUDA会自动为你添加 我的是cuda-11.2但是官网没有配套的,直接就挑自己喜欢的下就行StartLocally|PyTorch  这里强调:千万不要相信在其他网站上的下载命令。有可能你下载的就是

安装pytorch-gpu的经验与教训

首先说明本文并不是安装教程,网上有很多,这里只是自己遇到的一些问题我是以前安装的tensorflow-gpu的,但是发现现在的学术论文大部分都是用pytorch复现的,因此才去安装的pytorch-gpu查看自己安装的CUDAnvcc-V这里我提供一个安装tensorflow时所用的CUDA对应表 安装cuDNN时版本一定要对应正确  安装完CUDA时要改一下环境变量  只用添加这个就好,其他三个CUDA会自动为你添加 我的是cuda-11.2但是官网没有配套的,直接就挑自己喜欢的下就行StartLocally|PyTorch  这里强调:千万不要相信在其他网站上的下载命令。有可能你下载的就是