草庐IT

c++ - OpenCV 在图像上运行 kmeans 算法

我试图在3channel彩色图像上运行kmeans,但每次我尝试运行该函数时它似乎崩溃并出现以下错误:OpenCVError:Assertionfailed(data.dims0)inunknownfunction,file..\..\..\OpenCV-2.3.0\modules\core\src\matrix.cpp,line2271我在下面的代码中包含了一些注释,以帮助指定传入的内容。非常感谢任何帮助。//Loadinanimage//Depth:8,Channels:3IplImage*iplImage=cvLoadImage("C:/TestImages/rainbox_bo

c++ - OpenCV K 均值 (kmeans2)

我正在使用Opencv的K-means实现对大量8维vector进行聚类。它们很好地聚类,但我找不到任何方法来查看聚类过程创建的原型(prototype)。这可能吗?OpenCV似乎只允许访问集群索引(或标签)。如果没有,我想是时候自己实现了! 最佳答案 我不能说我使用了OpenCV的Kmeans实现,但如果您可以访问给每个实例的标签,您可以通过计算属于每个集群的实例的平均vector来简单地获取质心。 关于c++-OpenCVK均值(kmeans2),我们在StackOverflow上

python - 当我们只向 kmeans 提供单个单词的 tfidf 向量时,kmeans 如何知道如何对文档进行聚类?

我正在使用scikitlearn的Kmeans算法对评论进行聚类。sentence_list=['hellohowareyou',"Iamdoinggreat","mynameisabc"]vectorizer=TfidfVectorizer(min_df=1,max_df=0.9,stop_words='english',decode_error='ignore')vectorized=vectorizer.fit_transform(sentence_list)km=KMeans(n_clusters=num_clusters,init='k-means++',n_init=10,

python openCV : kmeans example not working

我正在研究openCV示例,但有时这些示例无法运行。在许多情况下,我只需要做一些小的改动,然后它就可以工作了。在这种情况下,到目前为止我没有找到解决方案。如果我运行以下代码,我会在kmeans行上收到错误。我检查了数据类型,似乎一切正常。任何人都知道出了什么问题?谢谢!来自https://github.com/Itseez/opencv的代码示例:'''Keyboardshortcuts:ESC-exitspace-generatenewdistribution'''importnumpyasnpimportcv2fromgaussian_miximportmake_gaussians

python - 使用 Python 的 KMeans 算法聚类地理位置坐标(lat,long 对)

使用以下代码对地理位置坐标进行聚类会产生3个聚类:importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.cluster.vqimportkmeans2,whitencoordinates=np.array([[lat,long],[lat,long],...[lat,long]])x,y=kmeans2(whiten(coordinates),3,iter=20)plt.scatter(coordinates[:,0],coordinates[:,1],c=y);plt.show()使用Kmeans进行位置聚类是否正确,因为它使用Eu

python - scipy 中的 kmeans 和 kmeans2 有什么区别?

我是机器学习的新手,想知道scipy中的kmeans和kmeans2之间的区别。根据文档,他们都使用'k-means'算法,但如何选择它们? 最佳答案 根据文档,kmeans2似乎是标准的k-means算法并且运行直到收敛到局部最优-并且允许您更改种子初始化。kmeans函数将由于缺乏变化而提前终止,因此它甚至可能无法达到局部最优。此外,它的目标是生成一个码本来映射特征向量。码本本身不一定是从停止点生成的,而是会使用具有最低“失真”的迭代来生成码本。此方法还将多次运行kmeans。该文档有更多细节。如果您只想将k-means作为算法

python - 绘制 kmeans 的输出(PyCluster impl)

在python中,kmeans聚类的plot输出如何?我正在使用PyCluster包。allUserVector是一个nxm维向量,基本上是具有m个特征的n个用户。importPyclusteraspcimportnumpyasnpclusterid,error,nfound=pc.kcluster(allUserVector,nclusters=3,transpose=0,npass=1,method='a',dist='e')clustermap,_,_=pc.kcluster(allUserVector,nclusters=3,transpose=0,npass=1,method

python - cv2.kmeans 在 Python 中的用法

我正在考虑使用OpenCV的Kmeans实现,因为它说速度更快......现在我正在使用包cv2和函数kmeans,我无法理解他们引用中的参数描述:Python:cv2.kmeans(data,K,criteria,attempts,flags[,bestLabels[,centers]])→retval,bestLabels,centerssamples–Floating-pointmatrixofinputsamples,onerowpersample.clusterCount–Numberofclusterstosplitthesetby.labels–Input/outputi

python - 如何在 python 中执行具有权重/密度的集群?有权重的 kmeans 之类的东西?

我的数据是这样的:powerplantname,latitude,longitude,powergeneratedA,-92.3232,100.99,50B,,,10C,,,20D,,,40E,,,5我希望能够将数据聚类成N个聚类(比如3个)。通常我会使用kmeans:importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.cluster.vqimportkmeans2,whitencoordinates=np.array([[lat,long],[lat,long],...[lat,long]])x,y=kmeans2(whiten(

python - 如何可视化用于 kmeans 聚类的 tf-idf 向量的数据点?

我有一个文档列表和整个语料库中每个唯一单词的tf-idf分数。我如何在二维图上将其可视化,以便衡量运行k-means需要多少集群?这是我的代码:sentence_list=["Hihowareyou","Goodmorning"...]vectorizer=TfidfVectorizer(min_df=1,stop_words='english',decode_error='ignore')vectorized=vectorizer.fit_transform(sentence_list)num_samples,num_features=vectorized.shapeprint"nu