草庐IT

scikits-learn

全部标签

python - 如何使用 scikit-learn 获得优势比和其他相关特征

我正在经历这个oddsratiosinlogisticregressiontutorial,并试图用scikit-learn的逻辑回归模块得到完全相同的结果。使用下面的代码,我可以获得系数和截距,但我找不到找到教程中列出的模型的其他属性的方法,例如log-likelyhood、OddsRatio、Std。Err.,z,P>|z|,[95%Conf.间隔]。如果有人能告诉我如何用sklearn包计算它们,我将不胜感激。importpandasaspdfromsklearn.linear_modelimportLogisticRegressionurl='https://stats.idr

python - Pandas 和 scikit-learn : KeyError: [. ...] 不在索引中

我不明白为什么在运行此代码时会出现错误KeyError:'[135113521353...135001350113502]notinindex':cv=KFold(n_splits=10)fortrain_index,test_indexincv.split(X):f_train_X,f_valid_X=X[train_index],X[test_index]f_train_y,f_valid_y=y[train_index],y[test_index]我使用X(一个Pandas数据框)来拆分Icv.split(X)。X.shapey.shapeOut:(13503,17)Out:(1

python - scikit cosine_similarity 与 pairwise_distances

Scikit-learn的sklearn.metrics.pairwise.cosine_similarity和sklearn.metrics.pairwise.pairwise_distances(..metric="cosine")有什么区别?fromsklearn.feature_extraction.textimportTfidfVectorizerdocuments=("MacbookPro15'SilverGraywithNvidiaGPU","MacbookGPU")tfidf_vectorizer=TfidfVectorizer()tfidf_matrix=tfidf_

使用 Pip 安装 Python Scikit-image 失败

我正在尝试安装scikit-image并收到此错误输出消息。我不确定如何正确地实际显示文本,所以我只做了一个简单的粘贴。building'skimage.external.tifffile._tifffile'extensioncompilingCsourcescreatingbuild\temp.win32-2.7\Release\skimage\externalcreatingbuild\temp.win32-2.7\Release\skimage\external\tifffileC:\Users\Kyle\AppData\Local\Programs\Common\Micros

python - SciKit Learn、Keras 或 Pytorch 的差异

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭3年前。Improvethisquestion这些库可以完全互换吗?看这里,https://stackshare.io/stackups/keras-vs-pytorch-vs-scikit-learn,似乎主要区别在于底层框架(至少对于PyTorch而言)。

python - 如何在 scikit-learn 中正确地将数字特征与文本(词袋)结合起来?

我正在写一个网页分类器,所以我混合了数字特征,我也想对文本进行分类。我正在使用词袋方法将文本转换为(大)数值向量。代码最终是这样的:fromsklearn.feature_extraction.textimportCountVectorizerfromsklearn.feature_extraction.textimportTfidfTransformerimportnumpyasnpnumerical_features=[[1,0],[1,1],[0,0],[0,1]]corpus=['Thisisthefirstdocument.','Thisisthesecondseconddo

python - scikit-learns LDA 函数中的错误 - 绘图显示非零相关

我使用scikit-learn的LDA函数做了一些LDA,我注意到在我的结果图中,LD之间存在非零相关性。fromsklearn.ldaimportLDAsklearn_lda=LDA(n_components=2)transf_lda=sklearn_lda.fit_transform(X,y)这很令人担忧,所以我回去使用Iris数据集作为引用。我还在scikit文档中找到了相同的非零相关LDA图,我可以重现它。无论如何,给你一个大概的样子左上图:这里显然有问题左下角的图:这是基于原始数据的,不是正确的方法,而是一种复制scikit结果的尝试右上角和右下角的绘图:这就是它的实际外观。

python - 将 Tensorflow 输入管道与 skflow/tf learn 结合使用

我关注了TensorflowReadingData指南以TFRecord的形式获取我的应用程序数据,并在我的输入管道中使用TFRecordReader来读取此数据。我现在正在阅读有关使用skflow/tf.learn的指南构建一个简单的回归器,但我看不到如何通过这些工具使用我的输入数据。在以下代码中,应用程序在调用regressor.fit(..)时失败,出现ValueError:settinganarrayelementwithasequence.。错误:Traceback(mostrecentcalllast):File".../tf.py",line138,inrun()File

python - scikit-bio 从 gff3 文件中提取基因组特征

是否可以在scikit-bio中从基因组fasta文件中提取存储在gff3格式文件中的基因组特征?例子:基因组.fasta>sequence1ATGGAGAGAGAGAGAGAGAGGGGGCAGCATACGCATCGACATACGACATACATCAGATACGACATACTACTACTATGA注释.gff3#gff-version3sequence1sourcegene178.+.ID=gene1sequence1sourcemRNA178.+.ID=transcript1;parent=gene1sequence1sourceCDS16.+0ID=CDS1;parent=tran

python - 使用神经网络将旧系统更新为 Q-learning

最近,我阅读了很多关于使用神经网络进行Q学习的文章,并考虑更新发电厂锅炉中现有的旧优化系统,该系统由一个简单的前馈神经网络组成,可以近似许多感官输入的输出。然后将输出链接到基于线性模型的Controller,该Controller以某种方式再次输出最佳操作,以便整个模型可以收敛到所需的目标。识别线性模型是一项耗时的任务。我考虑过用Q函数的神经网络逼近来整修无模型Q学习。我画了一张图问你我走对不对。我的问题:如果你认为我很好地理解了这个概念,我的训练集是否应该由一侧的状态特征向量和Q_target-Q_current组成(这里我'我假设奖励越来越多)以迫使整个模型朝着目标前进,还是我遗漏