SciKit-Learn

python - 将 StandardScaler 应用于数据集的各个部分

这个问题在这里已经有了答案:pandasdataframecolumnsscalingwithsklearn(7个答案)关闭9个月前。我想使用sklearn的StandardScaler。是否可以将其应用于某些特征列而不是其他特征列？例如，假设我的数据是:data=pd.DataFrame({'Name':[3,4,6],'Age':[18,92,98],'Weight':[68,59,49]})AgeNameWeight018368192459298649col_names=['Name','Age','Weight']features=data[col_names]我拟合并转换数据

python - Scipy/Numpy/scikits - 基于两个数组计算精度/召回分数

我拟合逻辑回归模型并使用以下训练数据集训练模型importscikitsassklearnfromsklearn.linear_modelimportLogisticRegressionlr=LogisticRegression(C=0.1,penalty='l1')model=lr.fit(training[:,0:-1],training[:,-1)我有一个交叉验证数据集，其中包含与输入矩阵关联的标签，可以访问为cv[:,-1]我针对经过训练的模型运行我的交叉验证数据集，该模型根据预测返回0和1的列表cv_predict=model.predict(cv[:,0:-1])问题我想根

scikits python gt section digits numpy scipy precision scikit-learn

python - 如何使用 scikit-image 反转黑白？

我用ndimage读取图像，这会产生这样的二值图像:我想反转图像，使白色变成黑色，反之亦然。感谢您的帮助。最佳答案 numpy.invert(close_img)我使用反转数组。它对我有用。关于python-如何使用scikit-image反转黑白？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/28084908/

反转 scikit-image section code python image image-processing scipy

python - 使用 t-SNE 降维

我有两组数据训练和测试。两个数据集分别有30213条和30235条，每条66维。我正在尝试应用scikitlearn的t-SNE将维度减少到2。由于数据集很大，如果我尝试一次性处理整个数据，我会得到MemoryError，我尝试将它们分成block像这样一次转换一个block:tsne=manifold.TSNE(n_components=2,perplexity=30,init='pca',random_state=0)X_tsne_train=np.array([[0.0forjinrange(2)]foriinrange(X_train.shape[0])])X_tsne_tes

python t-SNE code section pend scikit-learn

python - 如何关闭 tf.contrib.learn Estimator 中的 events.out.tfevents 文件

在tensorflow.contrib.learn中使用estimator.Estimator时，在训练和预测之后，modeldir中有这些文件:p>检查点events.out.tfevents.1487956647events.out.tfevents.1487957016图表.pbtxtmodel.ckpt-101.data-00000-of-00001model.ckpt-101.indexmodel.ckpt-101.meta当图形复杂或变量数量大时，graph.pbtxt文件和事件文件可能会非常大。这是一种不写这些文件的方法吗？由于模型重新加载只需要检查点文件，因此删除它们不

Estimator tfevents section strong li python tensorflow

python - sklearn - 对类的子集进行精确评分的交叉验证

我有一个用于分类的数据集，其中包含3个类标签[0,1,2]。我想运行交叉验证并尝试多个估算器，但我只对1类和2类的精度评分感兴趣。我不关心0类的精度，我不希望它的评分摆脱CV优化。我也不关心任何类(class)的记忆。换句话说，我想确保无论何时预测1或2，它都具有很高的置信度。所以问题是，我如何运行cross_val_score并告诉其评分函数忽略0类精度？更新:根据已接受的答案，这是一个示例答案代码:defcustom_precision_score(y_true,y_pred):precision_tuple,recall_tuple,fscore_tuple,support_tu

sklearn python precision code tuple machine-learning cross-validation scikit-learn

python - 在 sklearn 中创建 TfidfTransformer 时， 'use_idf' 究竟做了什么？

我正在使用Python2.7中sklearn包中的TfidfTransformer。当我对这些论点感到满意时，我对use_idf变得有点困惑，如:TfidfVectorizer(use_idf=False).fit_transform()到底是什么use_idf什么时候做假或真？由于我们正在生成一个稀疏Tfidf矩阵，因此有一个参数来选择一个稀疏Tfidf矩阵是没有意义的；这似乎是多余的。Thispost很有趣，但似乎没有搞定。documentation只说，Enableinverse-document-frequencyreweighting，这不是很有启发性。任何评论表示赞赏。编辑

中创 TfidfTransformer strong section code python scikit-learn tf-idf

python - python的tfidf算法

我有这段代码用于使用tf-idf计算文本相似度。fromsklearn.feature_extraction.textimportTfidfVectorizerdocuments=[doc1,doc2]tfidf=TfidfVectorizer().fit_transform(documents)pairwise_similarity=tfidf*tfidf.Tprintpairwise_similarity.A问题是此代码将纯字符串作为输入，我想通过删除停用词、词干提取和tokkenize来准备文档。所以输入将是一个列表。如果我用tokkenized文档调用documents=[do

python tfidf feature_extraction section fit_transform scikit-learn tf-idf

python - 当 n_jobs>1 时，scikit-learn 的 GridSearchCV 停止工作

我之前问过here提出以下代码行:parameters=[{'weights':['uniform'],'n_neighbors':[5,10,20,30,40,50,60,70,80,90,100]}]clf=GridSearchCV(neighbors.KNeighborsRegressor(),parameters,n_jobs=4)clf.fit(features,rewards)但是当我运行它时出现了另一个与之前提出的问题无关的问题。Python以以下操作系统错误消息结束:Process:Python[1327]Path:/Library/Frameworks/Python.

GridSearchCV scikit-learn ActivePython activestate x00000001000 python numpy

python - ImportError : No module named sklearn. 预处理

我按照这些instructions在Ubuntu上成功安装了scikit-learn.但是，当我运行使用它的程序时出现此错误:Traceback(mostrecentcalllast):File"begueradj.py",line10,infromsklearn.preprocessingimportnormalizeImportError:Nomodulenamedsklearn.preprocessing我该如何解决这个问题？最佳答案您链接到的教程中给出的说明对于Ubuntu14.04已过时。Ubuntu14.04包名为p

ImportError sklearn section code python scikit-learn ubuntu-14.04

11 12 131415 16 17