草庐IT

unsupervised-learning

全部标签

【scikit-learn基础】--『监督学习』之 决策树分类

决策树分类算法是一种监督学习算法,它的基本原理是将数据集通过一系列的问题进行拆分,这些问题被视为决策树的叶子节点和内部节点。决策树的每个分支代表一个可能的决策结果,而每个叶子节点代表一个最终的分类结果。决策树分类算法的历史可以追溯到1980年代初,当时研究者开始探索用机器学习来解决分类问题。在1981年,J.RossQuinlan开发了ID3算法,该算法使用信息增益来选择决策树的最佳划分属性。后来,在1986年,J.RossQuinlan提出了C4.5算法,该算法引入了剪枝技术,以防止过拟合,该算法还引入了处理连续属性、缺失数据和多值属性等新特性。在1998年,JeromeFriedman等人

【scikit-learn基础】--『监督学习』之 决策树分类

决策树分类算法是一种监督学习算法,它的基本原理是将数据集通过一系列的问题进行拆分,这些问题被视为决策树的叶子节点和内部节点。决策树的每个分支代表一个可能的决策结果,而每个叶子节点代表一个最终的分类结果。决策树分类算法的历史可以追溯到1980年代初,当时研究者开始探索用机器学习来解决分类问题。在1981年,J.RossQuinlan开发了ID3算法,该算法使用信息增益来选择决策树的最佳划分属性。后来,在1986年,J.RossQuinlan提出了C4.5算法,该算法引入了剪枝技术,以防止过拟合,该算法还引入了处理连续属性、缺失数据和多值属性等新特性。在1998年,JeromeFriedman等人

论文阅读 (108):A robust open-set multi-instance learning for defending adversarial attacks (2023 TIFS)

文章目录1概述1.1要点1.2代码1.3引用2方法2.1问题定义2.2基于GAN的AF攻击2.3用于开集CAF的双GAN策略2.4方法架构2.4.1CAF-GAN2.4.2多示例三元网络2.4.3分类模型2.4.4使用CAF作为surrogate的迁移更新1概述1.1要点题目:用于防御数字图像中对抗攻击的稳健开集多示例学习(Arobustopen-setmulti-instancelearningfordefendingadversarialattacksindigitalimage)背景:数字图像取证在多媒体取证中应用广泛;已有的取证方法,通过公开操作指纹来确定数字图像的完整性;针对操纵图像

【scikit-learn基础】--『监督学习』之 贝叶斯分类

贝叶斯分类是一种统计学分类方法,基于贝叶斯定理,对给定的数据集进行分类。它的历史可以追溯到18世纪,当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理,这个定理为统计决策提供了理论基础。不过,贝叶斯分类在实际应用中的广泛使用是在20世纪80年代,当时计算机技术的进步使得大规模数据处理成为可能。1.算法概述贝叶斯分类基于贝叶斯公式,通过已知样本信息来计算未知样本属于各个类别的概率,然后选择概率最大的类别作为未知样本的分类结果。贝叶斯公式的简化公式:\(P(A|B)=\frac{P(B|A)P(A)}{P(B)}\)其中:\(P(A)\):事件A发生的概率\(P(B)\):事件A发生的概率\(P(A|

【scikit-learn基础】--『监督学习』之 贝叶斯分类

贝叶斯分类是一种统计学分类方法,基于贝叶斯定理,对给定的数据集进行分类。它的历史可以追溯到18世纪,当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理,这个定理为统计决策提供了理论基础。不过,贝叶斯分类在实际应用中的广泛使用是在20世纪80年代,当时计算机技术的进步使得大规模数据处理成为可能。1.算法概述贝叶斯分类基于贝叶斯公式,通过已知样本信息来计算未知样本属于各个类别的概率,然后选择概率最大的类别作为未知样本的分类结果。贝叶斯公式的简化公式:\(P(A|B)=\frac{P(B|A)P(A)}{P(B)}\)其中:\(P(A)\):事件A发生的概率\(P(B)\):事件A发生的概率\(P(A|

satellite-image-deep-learning,一个遥感深度学习方向的宝藏网站

今天我们分享一个深度学习遥感相关的网站:「satellite-image-deep-learning」。这是一个github库,里面含有大量应用于卫星和航空图像的深度学习资源。主要包括以下几个方面:annotation:提供数据集注释信息,里面包含众多标注工具,有的可以自带坐标,有的可以生成geojson。既有针对遥感数据的标注工具,也有如labelme这些深度学习常用的工具。datasets:列出许多数据集。已经按来源和内容进行了分类model-training-and-deployment:列出有关深度学习模型的训练和部署的信息。包括正确处理数据,如何部署模型、跟踪模型等。software

【强化学习】Q-learning训练AI走迷宫

0.简单总结Q-learning?最简单的强化学习算法!不需要深度学习网络的算法!带有概率性的穷举特性!(甚至还有一点点动态规划的感觉)1.Q-learning介绍Q-learning是一种基于强化学习的算法,用于解决Markov决策过程(MDP)中的问题。这类问题我们理解为一种可以用有限状态机表示的问题。它具有一些离散的状态state、每一个state可以通过动作action转移到另外一个state。每次采取action,这个action都会带有一些奖励reward(也可以是负数,这样就表示惩罚了)。在Q-learning中,我们有一个智能体(Agent)和一个环境(Environment)

Learning in the Frequency Domain | 论文笔记

论文链接:[2002.12416]LearningintheFrequencyDomain(arxiv.org)https://arxiv.org/abs/2002.12416论文代码:kaix90/DCTNet(github.com)https://github.com/kaix90/DCTNet1、研究背景a)在传统方法中,高分辨率的RGB图片通常在CPU上进行预处理,然后转移到GPU上进行推理。因为没有经过压缩的RGB图片很大,所以CPU和GPU之间的传输带宽(CB)要求很高。为减少计算代价和传输带宽,高分辨率的RGB图片被下采样至更小的图片,但是这通常导致信息丢失和更低的推理准确率。b

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码 原文地址 预备知识:1.什么是MIL?多示例学习(MIL)是一种机器学习的方法,它的特点是每个训练数据不是一个单独的实例,而是一个包含多个实例的集合(称为包)。每个包有一个标签,但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则,或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法,以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度(span)的命名实体

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码 原文地址 预备知识:1.什么是MIL?多示例学习(MIL)是一种机器学习的方法,它的特点是每个训练数据不是一个单独的实例,而是一个包含多个实例的集合(称为包)。每个包有一个标签,但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则,或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法,以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度(span)的命名实体