前言在机器学习的经典假设中往往假设训练样本各类别数目是均衡的,但在实际场景中,训练样本数据往往都是不均衡(不平衡)的。比如在图像二分类问题中,一个极端的例子是,训练集中有95个正样本,但是负样本只有5个。这种类别数据不均衡的情况下,如果不做不平衡样本的处理,会导致模型在数目较少的类别上出现“欠学习”现象,即可能在测试集上完全丧失对负样本的预测能力。除了常见的分类、回归任务,类似图像语义分割、深度估计等像素级别任务中也是存在不平衡样本问题的。解决不平衡样本问题的处理方法一般有两种:从“数据层面”入手:分为数据采样法和类别平衡采样法。从“算法层面”入手:代价敏感方法。注意本文只介绍不平衡样本的处理
对比学习系列诸神黄昏时代的对比学习“军备竞赛”时期的对比学习好。对比学习之UnsupervisedLearningofVisualFeaturesbyContrastingClusterAssignmentsSimCSE:NLP中的对比学习这是一整个系列的文章是接着上面的123继续写的,4也属于这个系列,但是跟这篇文章并没有特别大的关系。所以要看完整的建议还是把123先看了。如果你不看也可以,我下面会简要的介绍一下前面所有的文章。不过只是一句带过,如果想详细了解的话,还是建议仔细看一下。回顾一下回忆一下我们前边提到的对比学习。这个学习的一个重点就是设置正样本和负样本进行对比,不同的对比学习之间
对比学习系列诸神黄昏时代的对比学习“军备竞赛”时期的对比学习好。对比学习之UnsupervisedLearningofVisualFeaturesbyContrastingClusterAssignmentsSimCSE:NLP中的对比学习这是一整个系列的文章是接着上面的123继续写的,4也属于这个系列,但是跟这篇文章并没有特别大的关系。所以要看完整的建议还是把123先看了。如果你不看也可以,我下面会简要的介绍一下前面所有的文章。不过只是一句带过,如果想详细了解的话,还是建议仔细看一下。回顾一下回忆一下我们前边提到的对比学习。这个学习的一个重点就是设置正样本和负样本进行对比,不同的对比学习之间