scikit-tensor_草庐IT

python - 根据文本语料库中的出现次数列出词汇表中的单词，使用 Scikit-Learn CountVectorizer

我已经为scikit-learn中的一些文档安装了CountVectorizer。我想在文本语料库中查看所有术语及其相应频率，以便选择停用词。例如'and'123times,'to'100times,'for'90times,...andsoon这个有内置函数吗？最佳答案如果cv是您的CountVectorizer并且X是矢量化语料库，那么zip(cv.get_feature_names(),np.asarray(X.sum(axis=0)).ravel())为CountVectorizer提取的语料库中的每个不同术语返回(te

语料词汇表 code section python machine-learning scikit-learn text-extraction countvectorizer

python - scikit-learn 中的 PCA 投影和重建

我可以通过以下代码在scikit中执行PCA:X_train有279180行和104列。fromsklearn.decompositionimportPCApca=PCA(n_components=30)X_train_pca=pca.fit_transform(X_train)现在，当我想将特征向量投影到特征空间时，我必须执行以下操作:"""Projection"""comp=pca.components_#30x104com_tr=np.transpose(pca.components_)#104x30proj=np.dot(X_train,com_tr)#279180x104*1

scikit-learn python code train pca machine-learning

python - AttributeError: 'Tensor' 对象没有属性 '_keras_history'

我查找了所有“'Tensor'对象没有属性***”，但似乎没有一个与Keras相关(TensorFlow:AttributeError:'Tensor'objecthasnoattribute'log10'除外，它没有帮助)...我正在制作一种GAN(生成对抗网络)。在这里您可以找到结构。Layer(type)OutputShapeParam#Connectedto_____________________________________________________________________________input_1(InputLayer)(None,30,91)0___

amp 39 model keras section python attributeerror

python scikit错误-没有名为sklearn的模块

当我关注网站(https://www.kaggle.com/wiki/GettingStartedWithPythonForDataScience)并输入pythonmakeSubmission.py时，我收到以下错误消息:ImportError:Nomodulenamedsklearn我想我已经成功安装了以下内容:适用于Windows的Python3.4sciPy、NumPy和matplotlib安装工具scikit学习PyCharm然后我打开“Python3.4命令行”并输入importsys;print(sys.__path__)，但我收到了消息Traceback(mostrec

名为 sklearn section code python scikit-learn

python - Scikit-learn 返回的确定系数 (R^2) 值小于 -1

我正在做一个简单的线性模型。我有fire=load_data()regr=linear_model.LinearRegression()scores=cross_validation.cross_val_score(regr,fire.data,fire.target,cv=10,scoring='r2')printscores产生[0.00000000e+000.00000000e+00-8.27299054e+02-5.80431382e+00-1.04444147e-01-1.19367785e+00-1.24843536e+00-3.39950443e-011.95018287

Scikit-learn 的确 code section LinearRegression python statistics

python - 如何使用 Scikit Learn CountVectorizer 获取语料库中的词频？

我正在尝试使用scikit-learn的CountVectorizer计算一个简单的词频。importpandasaspdimportnumpyasnpfromsklearn.feature_extraction.textimportCountVectorizertexts=["dogcatfish","dogcatcat","fishbird","bird"]cv=CountVectorizer()cv_fit=cv.fit_transform(texts)printcv.vocabulary_{u'bird':0,u'cat':1,u'dog':2,u'fish':3}我期待它返回

语料 CountVectorizer code 34 python scikit-learn

python - Scikit-learn，获取每个类的准确率分数

是否有内置方法可以分别获取每个类的准确度分数？我知道在sklearn中我们可以通过使用metric.accuracy_score获得整体准确度。有没有办法获得各个类(class)的准确度分数？类似于metrics.classification_report。fromsklearn.metricsimportclassification_reportfromsklearn.metricsimportaccuracy_scorey_true=[0,1,2,2,2]y_pred=[0,0,2,2,1]target_names=['class0','class1','class2']class

准确率 Scikit-learn code section classification_report python machine-learning

python - scikit-learn svmlight 格式加载器中的弃用警告

我在以前从未见过的IPython笔记本中收到一条新的弃用警告。我看到的是以下内容:X,y=load_svmlight_file('./GasSensorArray/batch2.dat')/Users/cpd/.virtualenvs/py27-ipython+pandas/lib/python2.7/site-packages/sklearn/datasets/svmlight_format.py:137:DeprecationWarning:usinganon-integernumberinsteadofanintegerwillresultinanerrorinthefuture

scikit-learn svmlight section python

python - 是否可以在 scikit-learn 中打印决策树？

有没有办法在scikit-learn中打印经过训练的决策树？我想为我的论文训练一个决策树，我想把树的图片放在论文中。这可能吗？最佳答案有一种导出为graph_viz格式的方法:http://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html因此来自在线文档:>>>fromsklearn.datasetsimportload_iris>>>fromsklearnimporttree>>>>>>clf=tree.DecisionTre

scikit-learn python gt section

python - scikit 学习 SVM，如何保存/加载支持向量？

使用pythonscikitsvm，在运行clf.fit(X,Y)后，您将获得支持向量。我可以在实例化svm.SVC对象时直接加载这些支持向量(将它们作为参数传递)吗？这意味着我不需要每次都运行fit()方法来进行预测最佳答案来自scikit手册:http://scikit-learn.org/stable/modules/model_persistence.html1.2.4模型持久化可以使用Python内置的持久化模型，即pickle，将模型保存在scikit中。>>>fromsklearnimportsvm>>>froms

python scikit gt section machine-learning