k-means聚类k-means聚类是无监督学习,训练数据集都是未添标签的(不知类别)。就连数据集最终要分成几类都是不知道的。聚类和分类的不同是,后者必须对分类的目标事物必须是已知的。聚类算法是根据样本之间的距离(相似度)来分类的,判断是否属于同一个簇。常见的计算距离的算法有欧式距离,曼哈顿距离和余弦相似性距离等。其中欧式距离,在二维平面上就是两点距离公式。应用假设有如下数据集,现在要用k-means聚类把它进行分类1.6589854.285136-3.4536873.4243214.838138-1.151539-5.379713-3.3621040.9725642.924086-3.567