草庐IT

Scikit-Image

全部标签

python - 在 scikit 中绘制 ROC 曲线仅产生 3 分

TLDR:scikit的roc_curve函数仅为特定数据集返回3个点。为什么会这样,我们如何控制返回多少积分?我正在尝试绘制ROC曲线,但始终得到“ROC三角形”。lr=LogisticRegression(multi_class='multinomial',solver='newton-cg')y=data['target'].valuesX=data[['feature']].valuesmodel=lr.fit(X,y)#getprobabilitiesforclfprobas_=model.predict_log_proba(X)只是为了确保长度没问题:printlen(y)

python - scikit-learn 内核 PCA 解释方差

我一直在使用scikit-learn中的普通PCA,并毫无问题地获得每个主成分的方差比。pca=sklearn.decomposition.PCA(n_components=3)pca_transform=pca.fit_transform(feature_vec)var_values=pca.explained_variance_ratio_我想使用内核PCA探索不同的内核,还想要解释的方差比,但我现在看到它没有这个属性。有谁知道如何获得这些值?kpca=sklearn.decomposition.KernelPCA(kernel=kernel,n_components=3)kpca

使用 Scikit-learn 进行拟合时出现 Python MemoryError

我在具有24GB内存的Windows864位系统上运行Python2.7(64位)。在对通常的Sklearn.linear_models.Ridge进行拟合时,代码运行良好。问题:但是,当使用Sklearn.linear_models.RidgeCV(alphas=alphas)进行拟合时,我遇到了显示的MemoryError错误在执行拟合过程的rr.fit(X_train,y_train)行下方。我怎样才能避免这个错误?代码片段deffit(X_train,y_train):alphas=[1e-3,1e-2,1e-1,1e0,1e1]rr=RidgeCV(alphas=alphas

python - 在 scikit learn 中组合随机森林模型

我有两个RandomForestClassifier模型,我想将它们组合成一个元模型。他们都使用相似但不同的数据进行训练。我该怎么做?rf1#thisismyfirstfittedRandomForestClassifierobject,with250treesrf2#thisismysecondfittedRandomForestClassifierobject,alsowith250trees我想创建big_rf并将所有树组合成一个500棵树模型 最佳答案 我相信这可以通过修改RandomForestClassifier对象的e

python - 在 Scikit 特征选择后保留特征名称

在对一组数据运行Scikit-Learn的方差阈值后,它删除了几个特征。我觉得我在做一些简单而愚蠢的事情,但我想保留其余功能的名称。以下代码:defVarianceThreshold_selector(data):selector=VarianceThreshold(.5)selector.fit(data)selector=(pd.DataFrame(selector.transform(data)))returnselectorx=VarianceThreshold_selector(data)print(x)更改以下数据(这只是行的一小部分):SurvivedPclassSexA

python - cv2.imread : checking if image is being read

我正在用python编写一个OpenCV程序,在某些时候我有类似的东西importcv2importnumpyasnp...img=cv2.imread("myImage.jpg")#dostuffwithimagehere问题是我必须在继续之前检测图像文件是否被正确读取。如果无法打开图像,cv2.imread返回False,所以我想做类似的事情:if(img):#continuedoingstuff如果图像未打开(例如,如果文件不存在),img将等于None(如预期)。但是,当imread起作用时,条件中断:ValueError:Thetruthvalueofanarraywithm

python - 看门狗和 matplotlib : Processing an image and displaying results when a new file comes in directory

我正在尝试创建一个简单的应用程序,其中图像被推送到目录中(由外部进程)Python看门狗触发,图像由函数处理,结果显示在窗口中作业持续运行,当图像进入目录时触发处理功能。结果的绘图窗口应该只用新结果更新,而不是关闭窗口然后重新绘图。下面的代码不显示结果。绘图窗口保持空白然后崩溃。如果matplotlib以外的东西可以轻松完成这项工作,那也很好。#pltismatplotlib.pyplotdefprocess_and_plot(test_file):y,x=getresults(test_file)#functionwhichreturnsresultsonimagefiley_pos

python - 如何在 scikit-learn 中使用管道调整自定义内核函数的参数

目前我已经使用def函数成功定义了一个自定义内核函数(预计算内核矩阵),现在我正在使用GridSearchCV函数来获取最佳参数。因此,在自定义内核函数中,总共有2个参数需要调整(即下例中的gamm和sea_gamma),而且对于SVR模型,costc参数也必须调整。但直到现在,我只能使用GridSearchCV调整costc参数->请参阅下面的第一部分:示例。我已经搜索了一些类似的解决方案,例如:Isitpossibletotuneparameterswithgridsearchforcustomkernelsinscikit-learn?它说“一种方法是使用Pipeline、SVC

python - Scikit K 均值聚类性能度量

我正在尝试使用K-means方法进行聚类,但我想衡量聚类的性能。我不是专家,但我渴望了解有关聚类的更多信息。这是我的代码:importpandasaspdfromsklearnimportdatasets#loadingthedatasetiris=datasets.load_iris()df=pd.DataFrame(iris.data)#K-Meansfromsklearnimportclusterk_means=cluster.KMeans(n_clusters=3)k_means.fit(df)#K-meanstrainingy_pred=k_means.predict(df)

python - scikit 学习中的样本权重和类权重选项有什么区别?

我有类(class)不平衡问题,想使用成本敏感学习来解决这个问题。欠采样和过采样赋予类权重以使用修改后的损失函数问题Scikitlearn有2个选项,称为类权重和样本权重。样本权重实际上是在执行选项2)和类别权重选项1)。选项2)是处理类不平衡的推荐方法。 最佳答案 这是相似的概念,但使用sample_weights可以强制估计器更加关注某些样本,使用class_weights可以强制估计器关注某些特定类进行学习。sample_weight=0或class_weight=0基本上意味着估计器根本不需要在学习过程中考虑这些样本/类。因