草庐IT

CAM系列(一)之CAM(原理讲解和PyTorch代码实现)

本文首发自【简书】作者【西北小生_】的博客,转载请私聊作者!图1CAM实现示意图一、什么是CAM?CAM的全称是ClassActivationMapping或ClassActivationMap,即类激活映射或类激活图。论文《LearningDeepFeaturesforDiscriminativeLocalization》发现了CNN分类模型的一个有趣的现象:CNN的最后一层卷积输出的特征图,对其通道进行加权叠加后,其激活值(ReLU激活后的非零值)所在的区域,即为图像中的物体所在区域。而将这一叠加后的单通道特征图覆盖到输入图像上,即可高亮图像中物体所在位置区域。如图1中的输入图像和输出图像

关于 python:torch.rfft – 基于 fft 的卷积创建与空间卷积不同的输出

torch.rfft-fft-basedconvolutioncreatingdifferentoutputthanspatialconvolution我在Pytorch中实现了基于FFT的卷积,并通过conv2d()函数将结果与空间卷积进行了比较。使用的卷积滤波器是平均滤波器。conv2d()函数由于预期的平均滤波而产生了平滑的输出,但基于fft的卷积返回了更模糊的输出。我已在此处附加代码和输出-空间卷积-123456789101112131415161718192021222324fromPILimportImage,ImageOpsimporttorchfrommatplotlibimp

关于 python:torch.rfft – 基于 fft 的卷积创建与空间卷积不同的输出

torch.rfft-fft-basedconvolutioncreatingdifferentoutputthanspatialconvolution我在Pytorch中实现了基于FFT的卷积,并通过conv2d()函数将结果与空间卷积进行了比较。使用的卷积滤波器是平均滤波器。conv2d()函数由于预期的平均滤波而产生了平滑的输出,但基于fft的卷积返回了更模糊的输出。我已在此处附加代码和输出-空间卷积-123456789101112131415161718192021222324fromPILimportImage,ImageOpsimporttorchfrommatplotlibimp

深度学习炼丹-不平衡样本的处理

前言在机器学习的经典假设中往往假设训练样本各类别数目是均衡的,但在实际场景中,训练样本数据往往都是不均衡(不平衡)的。比如在图像二分类问题中,一个极端的例子是,训练集中有95个正样本,但是负样本只有5个。这种类别数据不均衡的情况下,如果不做不平衡样本的处理,会导致模型在数目较少的类别上出现“欠学习”现象,即可能在测试集上完全丧失对负样本的预测能力。除了常见的分类、回归任务,类似图像语义分割、深度估计等像素级别任务中也是存在不平衡样本问题的。解决不平衡样本问题的处理方法一般有两种:从“数据层面”入手:分为数据采样法和类别平衡采样法。从“算法层面”入手:代价敏感方法。注意本文只介绍不平衡样本的处理

生成对抗网络(GAN)

(文章目录)前言  在生成对抗网络(GenerativeAdversarialNetwork,简称GAN)发明之前,变分自编码器(VAE)被认为是理论完备,实现简单,使用神经网络训练起来很稳定,生成的图片逼近度也较高,但是人眼还是可以很轻易地分辨出真实图片与机器生成的图片。但在2014年GAN被提出之后,在之后的几年里面里迅速发展,生成的图片越来越逼真。1 GAN1.1 相关介绍  GAN模型的核心思想就是博弈思想,是生成器(造假者)和判别器(鉴别者)之间的博弈,在提出GAN的原始论文中,作者举了货币制造的例子。即像一台验钞机和一台制造假币的机器之间的博弈,两者不断博弈,博弈的结果假币越来越像

深度学习炼丹-不平衡样本的处理

前言在机器学习的经典假设中往往假设训练样本各类别数目是均衡的,但在实际场景中,训练样本数据往往都是不均衡(不平衡)的。比如在图像二分类问题中,一个极端的例子是,训练集中有95个正样本,但是负样本只有5个。这种类别数据不均衡的情况下,如果不做不平衡样本的处理,会导致模型在数目较少的类别上出现“欠学习”现象,即可能在测试集上完全丧失对负样本的预测能力。除了常见的分类、回归任务,类似图像语义分割、深度估计等像素级别任务中也是存在不平衡样本问题的。解决不平衡样本问题的处理方法一般有两种:从“数据层面”入手:分为数据采样法和类别平衡采样法。从“算法层面”入手:代价敏感方法。注意本文只介绍不平衡样本的处理

生成对抗网络(GAN)

(文章目录)前言  在生成对抗网络(GenerativeAdversarialNetwork,简称GAN)发明之前,变分自编码器(VAE)被认为是理论完备,实现简单,使用神经网络训练起来很稳定,生成的图片逼近度也较高,但是人眼还是可以很轻易地分辨出真实图片与机器生成的图片。但在2014年GAN被提出之后,在之后的几年里面里迅速发展,生成的图片越来越逼真。1 GAN1.1 相关介绍  GAN模型的核心思想就是博弈思想,是生成器(造假者)和判别器(鉴别者)之间的博弈,在提出GAN的原始论文中,作者举了货币制造的例子。即像一台验钞机和一台制造假币的机器之间的博弈,两者不断博弈,博弈的结果假币越来越像