目录一、K-Means原理1.聚类简介①分层聚类②质心聚类③其他聚类2.K-means的原理3.K-means的应用场景二、K-Means的案例实战1.数据查看①数据导入及结构查看②查看数据描述2.数据可视化及预处理①条形图②热力图③核密度图④散点图⑤箱型图3.模型训练与精度评价①样本选择 ②模型训练③精度评价④模型调参三、结论 在本文中,你将学会:0K-means的数学原理1K-means的Scikit-Learn函数解释2K-means的案例实战一、K-Means原理1.聚类简介 机器学习算法中有100多种聚类算法,它们的使用取决于手头数据的性质。我们讨论一些主要的算法。
手把手教你安装Anaconda+Tensorflow+Pycharm这篇博文主要讲一下自己安装Anaconda+Tensorflow+Pycharm的一个过程。1.ANACONDA的安装Anaconda的下载地址不建议取官网下载安装,因为在实际的安装过程中发现:在官网下载的一般是最新版本,由于兼容性问题,在实际使用中显得并不是很好用,且会有各种报错.例如,安装官网的Anaconda后tensorflow找不到与之相匹配的版本.推荐使用下面的清华源镜像:网址链接-清华源下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/然后,选自
手把手教你安装Anaconda+Tensorflow+Pycharm这篇博文主要讲一下自己安装Anaconda+Tensorflow+Pycharm的一个过程。1.ANACONDA的安装Anaconda的下载地址不建议取官网下载安装,因为在实际的安装过程中发现:在官网下载的一般是最新版本,由于兼容性问题,在实际使用中显得并不是很好用,且会有各种报错.例如,安装官网的Anaconda后tensorflow找不到与之相匹配的版本.推荐使用下面的清华源镜像:网址链接-清华源下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/然后,选自
摘要:在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略。本文分享自华为云社区《基于K-means聚类算法进行客户人群分析》,作者:HWCloudAI。实验目标掌握如何通过机器学习算法进行用户群体分析;掌握如何使用pandas载入、查阅数据;掌握如何调节K-means算法的参数,来控制不同的聚类中心。案例内容介绍在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略。俗话说,“物以类聚,人以群分”,聚类算法其实就是将一些具有相同
摘要:在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略。本文分享自华为云社区《基于K-means聚类算法进行客户人群分析》,作者:HWCloudAI。实验目标掌握如何通过机器学习算法进行用户群体分析;掌握如何使用pandas载入、查阅数据;掌握如何调节K-means算法的参数,来控制不同的聚类中心。案例内容介绍在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略。俗话说,“物以类聚,人以群分”,聚类算法其实就是将一些具有相同
文章首发于我的github仓库-cv算法工程师成长之路,欢迎关注我的公众号-嵌入式视觉。torch.TensorTensor数据类型Tensor的属性view和reshape的区别Tensor与ndarray创建Tensor传入维度的方法参考资料torch.Tensortorch.Tensor是一种包含单一数据类型元素的多维矩阵,类似于numpy的array。可以使用使用torch.tensor()方法将python的list或序列数据转换成Tensor数据,生成的是dtype默认是torch.FloatTensor。注意torch.tensor()总是拷贝data。如果你有一个tensord
文章首发于我的github仓库-cv算法工程师成长之路,欢迎关注我的公众号-嵌入式视觉。torch.TensorTensor数据类型Tensor的属性view和reshape的区别Tensor与ndarray创建Tensor传入维度的方法参考资料torch.Tensortorch.Tensor是一种包含单一数据类型元素的多维矩阵,类似于numpy的array。可以使用使用torch.tensor()方法将python的list或序列数据转换成Tensor数据,生成的是dtype默认是torch.FloatTensor。注意torch.tensor()总是拷贝data。如果你有一个tensord
一、概述 当前人工智能技术实现的一种主要手段是机器学习,而机器学习能够解决的问题主要有三种:分类、聚类、回归,有监督的是分类,无监督的是聚类。所谓聚类,就是以一定的方法将一堆样本依它们本身的数据特性划分成不同的簇类,以达成不同的技术目的,k-means就是这样一种基础聚类算法。二、算法原理 对给定的样本集,k-means基于迭代的思想,由聚集中心点划定簇集,簇集反过来确定新的聚集中心点,周而复始,最终获得最佳划分的簇集。k-means中的k即想要划定的簇数,它是一个超参数,需由人工事先指定。样本的簇集划归由它与各个聚集中心点的距离来确定,划归到距离最近的那一个,其中距离的计算一般采用欧氏距
一、概述 当前人工智能技术实现的一种主要手段是机器学习,而机器学习能够解决的问题主要有三种:分类、聚类、回归,有监督的是分类,无监督的是聚类。所谓聚类,就是以一定的方法将一堆样本依它们本身的数据特性划分成不同的簇类,以达成不同的技术目的,k-means就是这样一种基础聚类算法。二、算法原理 对给定的样本集,k-means基于迭代的思想,由聚集中心点划定簇集,簇集反过来确定新的聚集中心点,周而复始,最终获得最佳划分的簇集。k-means中的k即想要划定的簇数,它是一个超参数,需由人工事先指定。样本的簇集划归由它与各个聚集中心点的距离来确定,划归到距离最近的那一个,其中距离的计算一般采用欧氏距
这个系列我们用现实中经常碰到的小样本问题来串联半监督,文本对抗,文本增强等模型优化方案。小样本的核心在于如何在有限的标注样本上,最大化模型的泛化能力,让模型对unseen的样本拥有很好的预测效果。之前在NER系列中我们已经介绍过DataAugmentation,不熟悉的童鞋看过来中文NER的那些事儿4.数据增强在NER的尝试。样本增强是通过提高标注样本的丰富度来提升模型泛化性,另一个方向半监督方案则是通过利用大量的相同领域未标注数据来提升模型的样本外预测能力。这一章我们来聊聊半监督方案中的一致性正则~一致性正则~一个好的分类器应该对相似的样本点给出一致的预测,于是在训练中通过约束样本和注入噪声