草庐IT

scikit-bio

全部标签

【scikit-learn基础】--『监督学习』之 K-近邻分类

KNN(K-近邻),全称K-NearestNeighbors,是一种常用的分类算法。KNN算法的历史可以追溯到1957年,当时Cover和Hart提出了“最近邻分类”的概念。但是,这个算法真正得到广泛认知和应用是在1992年,由Altman发表的一篇名为“K-NearestNeighbors”的文章。近年来,随着大数据和机器学习的快速发展,KNN算法因其简单且表现优秀,被广泛应用于各种数据分类问题中。1.算法概述KNN算法的基本原理是:在特征空间中,如果一个样本的最接近的k个邻居中大多数属于某一个类别,则该样本也属于这个类别。换句话说,KNN算法假设类别是由其邻居决定的。那么,KNN算法判断数

【scikit-learn基础】--『监督学习』之 K-近邻分类

KNN(K-近邻),全称K-NearestNeighbors,是一种常用的分类算法。KNN算法的历史可以追溯到1957年,当时Cover和Hart提出了“最近邻分类”的概念。但是,这个算法真正得到广泛认知和应用是在1992年,由Altman发表的一篇名为“K-NearestNeighbors”的文章。近年来,随着大数据和机器学习的快速发展,KNN算法因其简单且表现优秀,被广泛应用于各种数据分类问题中。1.算法概述KNN算法的基本原理是:在特征空间中,如果一个样本的最接近的k个邻居中大多数属于某一个类别,则该样本也属于这个类别。换句话说,KNN算法假设类别是由其邻居决定的。那么,KNN算法判断数

【scikit-learn基础】--『监督学习』之 随机森林回归

随机森林回归(RandomForestRegression)是一种在机器学习领域广泛应用的算法,由美国科学家LeoBreiman在2001年提出。它是一种集成学习方法,通过整合多个决策树的预测结果来提高预测精度和稳定性。随机森林回归适用于各种需要预测连续数值输出的问题,如金融领域的股票价格预测、客户信用评分,医疗领域的疾病诊断和药物发现等。1.算法概述随机森林回归算法通过引入随机性来构建多个决策树,再通过对这些树的预测结果进行平均或投票来得出最终的预测结果。这里的随机性主要体现在两个方面:一是训练样本的随机选取,二是在训练过程中特征的随机选取。随机森林的算法过程并不复杂,主要的步骤如下:从原始

【scikit-learn基础】--『监督学习』之 随机森林回归

随机森林回归(RandomForestRegression)是一种在机器学习领域广泛应用的算法,由美国科学家LeoBreiman在2001年提出。它是一种集成学习方法,通过整合多个决策树的预测结果来提高预测精度和稳定性。随机森林回归适用于各种需要预测连续数值输出的问题,如金融领域的股票价格预测、客户信用评分,医疗领域的疾病诊断和药物发现等。1.算法概述随机森林回归算法通过引入随机性来构建多个决策树,再通过对这些树的预测结果进行平均或投票来得出最终的预测结果。这里的随机性主要体现在两个方面:一是训练样本的随机选取,二是在训练过程中特征的随机选取。随机森林的算法过程并不复杂,主要的步骤如下:从原始

【scikit-learn基础】--『监督学习』之 决策树回归

决策树算法是一种既可以用于分类,也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树,每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度,其构建通常采用自上而下的贪心搜索方式,通过比较不同划分标准来选择最优划分。决策树回归广泛应用于各种回归问题,如预测房价、股票价格、客户流失等。1.算法概述决策树相关的诸多算法之中,有一种CART算法,全称是classificationandregressiontree(分类与回归树)。顾名思义,这个算法既可以用来分类,也可以用来回归,本篇主要介绍其在回归问题上的应用。决策树算法的核心在于生成一棵决策树过程

大数据机器学习深入Scikit-learn:掌握Python最强大的机器学习库

文章目录大数据机器学习深入Scikit-learn:掌握Python最强大的机器学习库引言机器学习与Scikit-learn的重要性Scikit-learn的基本概述安装和配置如何安装Scikit-learn安装必要的依赖库Scikit-learn的主要特性强大的预处理功能众多的机器学习算法效果评估和模型选择可视化工具Scikit-learn的数据预处理数据清洗数据转换特征提取和特征选择Scikit-learn中的监督学习算法线性模型决策树支持向量机Scikit-learn中的无监督学习算法聚类降维评估模型和参数调优模型评估参数调优结论结论大数据机器学习深入Scikit-learn:掌握Pyt

【scikit-learn基础】--『监督学习』之 决策树回归

决策树算法是一种既可以用于分类,也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树,每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度,其构建通常采用自上而下的贪心搜索方式,通过比较不同划分标准来选择最优划分。决策树回归广泛应用于各种回归问题,如预测房价、股票价格、客户流失等。1.算法概述决策树相关的诸多算法之中,有一种CART算法,全称是classificationandregressiontree(分类与回归树)。顾名思义,这个算法既可以用来分类,也可以用来回归,本篇主要介绍其在回归问题上的应用。决策树算法的核心在于生成一棵决策树过程

【scikit-learn基础】--『监督学习』之 支持向量机回归

在机器学习中,支持向量机(SupportVectorMachine)算法既可以用于回归问题,也可以用于分类问题。支持向量机(SVM)算法的历史可以追溯到1963年,当时前苏联统计学家弗拉基米尔·瓦普尼克(VladimirN.Vapnik)和他的同事阿列克谢·切尔沃宁基斯(AlexeyYa.Chervonenkis)提出了支持向量机的概念。然而,由于当时的国际环境影响,他们用俄文发表的论文并没有受到国际学术界的关注。直到20世纪90年代,瓦普尼克移民到美国,随后发表了SVM理论。在此之后,SVM算法开始受到应有的重视。在1993年和1995年,CorinnaCortes和瓦普尼克提出了SVM的软

【scikit-learn基础】--『监督学习』之 LASSO回归

LASSO(LeastAbsoluteShrinkageandSelectionOperator)回归模型一般都是用英文缩写表示,硬要翻译的话,可翻译为最小绝对收缩和选择算子。它是一种线性回归模型的扩展,其主要目标是解决高维数据中的特征选择和正则化问题。1.概述在LASSO中,通过使用L1正则化项,它能够在回归系数中引入稀疏性,也就是允许某些系数在优化过程中缩减为零,从而实现特征的选择。与岭回归不同的是,LASSO的损失函数一般定义为:\(L(w)=(y-wX)^2+\lambda\parallelw\parallel_1\)其中\(\lambda\parallelw\parallel_1\)

Scikit-Learn线性回归(一)

Scikit-Learn线性回归一1、线性回归概述1.1、回归1.2、线性1.3、线性回归1.4、线性回归的优缺点1.5、线性回归与逻辑回归2、线性回归的原理2.1、线性回归的定义与原理2.2、线性回归的损失函数3、Scikit-Learn线性回归3.1、Scikit-Learn库3.2、Scikit-Learn线性回归API3.3、Scikit-Learn线性回归初体验3.4、线性回归案例(波士顿房价预测)4、附录1、线性回归概述线性回归(LinearRegression)是很基础的机器学习算法。线性回归在机器学习知识结构中的位置如下:1.1、回归回归(Regression)是一种应用广泛的