SciKit-Learn

python - 在 scikit-learn 中实现 K 邻居分类器，每个对象具有 3 个特征

我想用scikit-learn模块(http://scikit-learn.org/dev/modules/generated/sklearn.neighbors.KNeighborsClassifier.html)实现一个KNeighborsClassifier我从我的图像中检索坚固性、伸长率和Humoments特征。我如何准备这些数据以进行培训和验证？我必须为我从图像中检索到的每个对象创建一个包含3个特征[Hm,e,s]的列表(从1个图像中有更多对象)？我读了这个例子(http://scikit-learn.org/dev/modules/generated/sklearn.nei

python - scikit-learn roc_auc_score() 返回精度值

我正在尝试使用sklearn.metrics.roc_auc_score使用以下方法计算ROC曲线下的面积:roc_auc=sklearn.metrics.roc_auc_score(actual,predicted)其中actual是一个带有真实分类标签的二元向量，predicted是一个带有我的分类器预测的分类标签的二元向量。但是，我得到的roc_auc的值与准确度值(标签被正确预测的样本的比例)完全相似。这不是一次性的事情。我在不同的参数值上尝试我的分类器，每次我都得到相同的结果。我在这里做错了什么？最佳答案这是因为您传递

roc_auc_score scikit-learn code section 的 python scikits

python - 如何将多项式变换应用于 scikit 学习中的特征子集

Scikitlearn的PolynomialFeatures促进多项式特征生成。这是一个简单的例子:importnumpyasnpimportpandasaspdfromsklearn.preprocessingimportPolynomialFeatures#Exampledata:X=np.arange(6).reshape(3,2)#Worksfinepoly=PolynomialFeatures(2)pd.DataFrame(poly.fit_transform(X))012345010100111234692145162025问题:是否可以仅将多项式变换应用于指定的特征列表？

python scikit 39 PolynomialFeatures sklearn scikit-learn

python - 如何使用 scikit-learn 获得优势比和其他相关特征

我正在经历这个oddsratiosinlogisticregressiontutorial，并试图用scikit-learn的逻辑回归模块得到完全相同的结果。使用下面的代码，我可以获得系数和截距，但我找不到找到教程中列出的模型的其他属性的方法，例如log-likelyhood、OddsRatio、Std。Err.,z,P>|z|,[95%Conf.间隔]。如果有人能告诉我如何用sklearn包计算它们，我将不胜感激。importpandasaspdfromsklearn.linear_modelimportLogisticRegressionurl='https://stats.idr

scikit-learn python section code https

python - Pandas 和 scikit-learn : KeyError: [. ...] 不在索引中

我不明白为什么在运行此代码时会出现错误KeyError:'[135113521353...135001350113502]notinindex':cv=KFold(n_splits=10)fortrain_index,test_indexincv.split(X):f_train_X,f_valid_X=X[train_index],X[test_index]f_train_y,f_valid_y=y[train_index],y[test_index]我使用X(一个Pandas数据框)来拆分Icv.split(X)。X.shapey.shapeOut:(13503,17)Out:(1

scikit-learn KeyError code index train python pandas machine-learning

python - scikit cosine_similarity 与 pairwise_distances

Scikit-learn的sklearn.metrics.pairwise.cosine_similarity和sklearn.metrics.pairwise.pairwise_distances(..metric="cosine")有什么区别？fromsklearn.feature_extraction.textimportTfidfVectorizerdocuments=("MacbookPro15'SilverGraywithNvidiaGPU","MacbookGPU")tfidf_vectorizer=TfidfVectorizer()tfidf_matrix=tfidf_

pairwise_distances cosine_similarity pairwise section cosine python nlp scikit-learn

使用 Pip 安装 Python Scikit-image 失败

我正在尝试安装scikit-image并收到此错误输出消息。我不确定如何正确地实际显示文本，所以我只做了一个简单的粘贴。building'skimage.external.tifffile._tifffile'extensioncompilingCsourcescreatingbuild\temp.win32-2.7\Release\skimage\externalcreatingbuild\temp.win32-2.7\Release\skimage\external\tifffileC:\Users\Kyle\AppData\Local\Programs\Common\Micros

Scikit-image Python tifffile include external pip

python - SciKit Learn、Keras 或 Pytorch 的差异

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭3年前。Improvethisquestion这些库可以完全互换吗？看这里，https://stackshare.io/stackups/keras-vs-pytorch-vs-scikit-learn，似乎主要区别在于底层框架(至少对于PyTorch而言)。

Pytorch python section class noreferrer machine-learning keras scikit-learn

python - 如何在 scikit-learn 中正确地将数字特征与文本(词袋)结合起来？

我正在写一个网页分类器，所以我混合了数字特征，我也想对文本进行分类。我正在使用词袋方法将文本转换为(大)数值向量。代码最终是这样的:fromsklearn.feature_extraction.textimportCountVectorizerfromsklearn.feature_extraction.textimportTfidfTransformerimportnumpyasnpnumerical_features=[[1,0],[1,1],[0,0],[0,1]]corpus=['Thisisthefirstdocument.','Thisisthesecondseconddo

何在 scikit-learn section noreferrer noopener python classification text-classification

python - scikit-learns LDA 函数中的错误 - 绘图显示非零相关

我使用scikit-learn的LDA函数做了一些LDA，我注意到在我的结果图中，LD之间存在非零相关性。fromsklearn.ldaimportLDAsklearn_lda=LDA(n_components=2)transf_lda=sklearn_lda.fit_transform(X,y)这很令人担忧，所以我回去使用Iris数据集作为引用。我还在scikit文档中找到了相同的非零相关LDA图，我可以重现它。无论如何，给你一个大概的样子左上图:这里显然有问题左下角的图:这是基于原始数据的，不是正确的方法，而是一种复制scikit结果的尝试右上角和右下角的绘图:这就是它的实际外观。

scikit-learns python scikit section scikit-learn r lda

58 59 606162 63 64