草庐IT

pytorch_model

全部标签

【Pytorch项目实战】之语义分割:U-Net、UNet++、U2Net

文章目录博主精品专栏导航一、前言1.1、什么是图像分割?1.2、语义分割与实例分割的区别1.3、语义分割的上下文信息1.4、语义分割的网络架构二、网络+数据集2.1、经典网络的发展史(模型详解)2.2、分割数据集下载三、算法详解3.1、U-Net3.1.1、网络框架(U形结构+跳跃连接结构)3.1.2、镜像扩大(保留边缘信息)3.1.3、数据增强(变形)3.1.4、损失函数(交叉熵)3.1.5、性能表现3.2、UNet++3.2.1、网络框架(U型结构

【Pytorch项目实战】之语义分割:U-Net、UNet++、U2Net

文章目录博主精品专栏导航一、前言1.1、什么是图像分割?1.2、语义分割与实例分割的区别1.3、语义分割的上下文信息1.4、语义分割的网络架构二、网络+数据集2.1、经典网络的发展史(模型详解)2.2、分割数据集下载三、算法详解3.1、U-Net3.1.1、网络框架(U形结构+跳跃连接结构)3.1.2、镜像扩大(保留边缘信息)3.1.3、数据增强(变形)3.1.4、损失函数(交叉熵)3.1.5、性能表现3.2、UNet++3.2.1、网络框架(U型结构

PyTorch学习笔记(八)-------------- 多模态融合

目录一、什么是多模态二、为什么选用多模态三、如何实现多模态3.1、平衡融合3.2、加权融合3.3、堆叠融合3.4、注意力机制3.5、双向循环神经网络(Bi-LSTM)一、什么是多模态        多模态指的是由不同信息源提供的多种信息表示方式。这些信息表示方式可以是文本、图像、声音、视频等。        多模态信息的处理是许多人工智能应用的关键。例如,在视频分类任务中,我们可能希望利用视频的音频和视频轨道信息来判断视频的内容。在文本分类任务中,我们可能希望利用文本的语言、句法、语义信息来判断文本的类别。在图像分类任务中,我们可能希望利用图像的颜色、形状、纹理信息来判断图像的类别。     

PyTorch学习笔记(八)-------------- 多模态融合

目录一、什么是多模态二、为什么选用多模态三、如何实现多模态3.1、平衡融合3.2、加权融合3.3、堆叠融合3.4、注意力机制3.5、双向循环神经网络(Bi-LSTM)一、什么是多模态        多模态指的是由不同信息源提供的多种信息表示方式。这些信息表示方式可以是文本、图像、声音、视频等。        多模态信息的处理是许多人工智能应用的关键。例如,在视频分类任务中,我们可能希望利用视频的音频和视频轨道信息来判断视频的内容。在文本分类任务中,我们可能希望利用文本的语言、句法、语义信息来判断文本的类别。在图像分类任务中,我们可能希望利用图像的颜色、形状、纹理信息来判断图像的类别。     

Pytorch——实现Tensor矩阵的任意角度旋转、平移操作

文章目录矩阵/图像坐标旋转矩阵/图像坐标平移矩阵/图像坐标平移+旋转矩阵/图像坐标旋转定义旋转矩阵,对2D的Tensor操作时,shape应当为[B,2,3]importmathfromtorch.nnimportfunctionalasFB=1#batchsize#初始化一个旋转角度angle=45/180*math.pi#创建一个坐标变换矩阵transform_matrix=torch.tensor([[math.cos(angle),math.sin(-angle),0],[math.sin(angle),math.cos(angle),0]])#将坐标变换矩阵的shape从[2,3]转

Pytorch——实现Tensor矩阵的任意角度旋转、平移操作

文章目录矩阵/图像坐标旋转矩阵/图像坐标平移矩阵/图像坐标平移+旋转矩阵/图像坐标旋转定义旋转矩阵,对2D的Tensor操作时,shape应当为[B,2,3]importmathfromtorch.nnimportfunctionalasFB=1#batchsize#初始化一个旋转角度angle=45/180*math.pi#创建一个坐标变换矩阵transform_matrix=torch.tensor([[math.cos(angle),math.sin(-angle),0],[math.sin(angle),math.cos(angle),0]])#将坐标变换矩阵的shape从[2,3]转

python - Unresolved 导入 : models

我正在按照本指南使用python/django/eclipse/pydev做我的第一个项目http://docs.djangoproject.com/en/dev/intro/tutorial01/我唯一的补充是使用Eclipse/pydev。我收到许多与“Unresolved导入”相关的错误。我可以使用“删除错误标记”来删除错误,并且我的网站运行良好(我可以浏览它),但我想彻底摆脱这个问题,因为在我删除它们后会再次弹出错误。有什么想法吗?编辑使用Ubuntu9.1 最佳答案 检查你的pythonpath。你需要包含django的父

python - Unresolved 导入 : models

我正在按照本指南使用python/django/eclipse/pydev做我的第一个项目http://docs.djangoproject.com/en/dev/intro/tutorial01/我唯一的补充是使用Eclipse/pydev。我收到许多与“Unresolved导入”相关的错误。我可以使用“删除错误标记”来删除错误,并且我的网站运行良好(我可以浏览它),但我想彻底摆脱这个问题,因为在我删除它们后会再次弹出错误。有什么想法吗?编辑使用Ubuntu9.1 最佳答案 检查你的pythonpath。你需要包含django的父

【PyTorch如何实现CPU、GPU相互转换?】

拒绝CPU,PyTorch如何切换GPU计算?问题的提出1.CPU_to_GPU——定义device对象2.CPU_to_GPU——.cuda()方法3.GPU_to_CPU——.cpuEnd补充:问题的提出写代码时非常困惑,明明下载了cuda支持包和PyTorch-GPU版本,进行NN和CNN时却是用CPU在进行计算(CPU利用率超90%,GPU利用率不到5%),如下图:首先我检查了PyTorch是否安装成功,输入命令print(torch.cuda.is_available()),返回值为True,说明PyTorch是安装成功了,这可让我有点捉急。看了许多文章终于解决了深度学习时CPU和G

python - 使用 PyTorch 生成新图像

我正在学习GAN我已经完成了一门类(class),该类(class)为我提供了一个基于输入示例生成图像的程序示例。示例可以在这里找到:https://github.com/davidsonmizael/gan所以我决定使用它来基于面部正面照片的数据集生成新图像,但我没有取得任何成功。与上例不同的是,代码只产生噪声,而输入有实际图像。实际上,我不知道应该更改什么以使代码指向正确的方向并从图像中学习。我没有更改示例中提供的代码的单个值,但它不起作用。如果有人可以帮助我理解这一点并指出正确的方向,那将非常有帮助。提前致谢。我的鉴别器:classD(nn.Module):def__init__