文章目录一、使用示例二、参数含义三、常见的scoring取值1.分类、回归和聚类scoring参数选择2.f1_micro和f1_macro区别3.负均方误差和均方误差一、使用示例importnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearnimportsvmfromsklearn.model_selectionimportcross_val_scoretarget=odata["target"]X=odata.drop(columns="target")clf=svm.SVC(kernel='linear
《Python机器学习手册——从数据预处理到深度学习》这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理解,在应用中也能更为熟练。以下是根据书上的代码进行实操,注释基本写明了每句代码的作用(写在本句代码之前)和print的输出结果(写在print之后)。不一定严格按照书上内容进行,根据代码运行时具体情况稍作顺序调整,也加入了一些自己的理解。如果复制到自己的环境下跑一遍输出,相信理解会更深刻更清楚。博客中每个代码块代表一次完整的运行结果,可以直接以此为单位复制并运行。04-处理
《Python机器学习手册——从数据预处理到深度学习》这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理解,在应用中也能更为熟练。以下是根据书上的代码进行实操,注释基本写明了每句代码的作用(写在本句代码之前)和print的输出结果(写在print之后)。不一定严格按照书上内容进行,根据代码运行时具体情况稍作顺序调整,也加入了一些自己的理解。如果复制到自己的环境下跑一遍输出,相信理解会更深刻更清楚。博客中每个代码块代表一次完整的运行结果,可以直接以此为单位复制并运行。04-处理
六、机器学习中的特征选择:6.1什么是特征选择? 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征, 特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯 定比选择前小,毕竟我们只选择了其中的一部分特征。6.2特征选择的主要方法(三大武器):1.Filter(过滤式):VarianceThreshold 使用:sklearn.feature_selection.VarianceThreshold 语法: 流程:2.Embedded(嵌入式
六、机器学习中的特征选择:6.1什么是特征选择? 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征, 特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯 定比选择前小,毕竟我们只选择了其中的一部分特征。6.2特征选择的主要方法(三大武器):1.Filter(过滤式):VarianceThreshold 使用:sklearn.feature_selection.VarianceThreshold 语法: 流程:2.Embedded(嵌入式
七、支持向量机7.1概述功能:用的最多的是分类,不过做其他的也有不错的效果对于三种不同的输入数据,每种分类器的表现。可以看出SVM最棒SVM是最接近深度学习的机器学习算法。线性SVM可以看成是神经网络的单个神经元,非线性的SVM则与两层的神经网络相当,非线性的SVM中如果添加多个核函数,则可以模仿多层的神经网络7.1.1支持向量机分类器是如何工作的这是一组两种标签的数据,两种标签分别由圆和方块代表支持向量机的分类方法:是在这组分布中找出一个超平面作为决策边界,使模型在数据上的分类误差尽量接近于小,尤其是在未知数据集上的分类误差(泛化误差)尽量小把决策边界B1向两边平移,直到碰到离这条决策边界最
七、支持向量机7.1概述功能:用的最多的是分类,不过做其他的也有不错的效果对于三种不同的输入数据,每种分类器的表现。可以看出SVM最棒SVM是最接近深度学习的机器学习算法。线性SVM可以看成是神经网络的单个神经元,非线性的SVM则与两层的神经网络相当,非线性的SVM中如果添加多个核函数,则可以模仿多层的神经网络7.1.1支持向量机分类器是如何工作的这是一组两种标签的数据,两种标签分别由圆和方块代表支持向量机的分类方法:是在这组分布中找出一个超平面作为决策边界,使模型在数据上的分类误差尽量接近于小,尤其是在未知数据集上的分类误差(泛化误差)尽量小把决策边界B1向两边平移,直到碰到离这条决策边界最
12、用邻域成分分析进行降维importnumpyasnpimportmatplotlib.pyplotaspltfromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.decompositionimportPCAfromsklearn.discriminant_analysisimportLinearDiscriminantAnalysisfromsklearn.neighborsimport(KNeighborsClassifier, Neighb
12、用邻域成分分析进行降维importnumpyasnpimportmatplotlib.pyplotaspltfromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.decompositionimportPCAfromsklearn.discriminant_analysisimportLinearDiscriminantAnalysisfromsklearn.neighborsimport(KNeighborsClassifier, Neighb