草庐IT

SciKit-Learn

全部标签

python - 使用 scikit-learn 进行特征选择

我是机器学习的新手。我正在准备使用ScikitLearnSVM进行分类的数据。为了选择最好的功能,我使用了以下方法:SelectKBest(chi2,k=10).fit_transform(A1,A2)由于我的数据集包含负值,我收到以下错误:ValueErrorTraceback(mostrecentcalllast)/media/5804B87404B856AA/TFM_UC3M/test2_v.pyin()---->12345/usr/local/lib/python2.6/dist-packages/sklearn/base.pycinfit_transform(self,X,y

python - 使用 scikit-learn 进行特征选择

我是机器学习的新手。我正在准备使用ScikitLearnSVM进行分类的数据。为了选择最好的功能,我使用了以下方法:SelectKBest(chi2,k=10).fit_transform(A1,A2)由于我的数据集包含负值,我收到以下错误:ValueErrorTraceback(mostrecentcalllast)/media/5804B87404B856AA/TFM_UC3M/test2_v.pyin()---->12345/usr/local/lib/python2.6/dist-packages/sklearn/base.pycinfit_transform(self,X,y

python - 以安全正确的方式使用 RandomForestClassifier 的 predict_proba() 函数

我正在使用Scikit-learn。有时我需要标签/类的概率而不是标签/类本身。我不希望将垃圾邮件/非垃圾邮件作为电子邮件的标签,而希望仅具有以下示例:给定电子邮件是垃圾邮件的概率为0.78。为此,我将predict_proba()与RandomForestClassifier一起使用,如下所示:clf=RandomForestClassifier(n_estimators=10,max_depth=None,min_samples_split=1,random_state=0)scores=cross_val_score(clf,X,y)print(scores.mean())cla

python - 以安全正确的方式使用 RandomForestClassifier 的 predict_proba() 函数

我正在使用Scikit-learn。有时我需要标签/类的概率而不是标签/类本身。我不希望将垃圾邮件/非垃圾邮件作为电子邮件的标签,而希望仅具有以下示例:给定电子邮件是垃圾邮件的概率为0.78。为此,我将predict_proba()与RandomForestClassifier一起使用,如下所示:clf=RandomForestClassifier(n_estimators=10,max_depth=None,min_samples_split=1,random_state=0)scores=cross_val_score(clf,X,y)print(scores.mean())cla

python - 如何复制估算器以便在多个数据集上使用它?

这是一个创建两个数据集的示例:fromsklearn.linear_modelimportLogisticRegressionfromsklearn.datasetsimportmake_classification#dataset1X1,y1=make_classification(n_classes=2,n_features=5,random_state=1)#dataset2X2,y2=make_classification(n_classes=2,n_features=5,random_state=2)我想使用具有相同参数值的LogisticRegression估计器在每个数据

python - 如何复制估算器以便在多个数据集上使用它?

这是一个创建两个数据集的示例:fromsklearn.linear_modelimportLogisticRegressionfromsklearn.datasetsimportmake_classification#dataset1X1,y1=make_classification(n_classes=2,n_features=5,random_state=1)#dataset2X2,y2=make_classification(n_classes=2,n_features=5,random_state=2)我想使用具有相同参数值的LogisticRegression估计器在每个数据

python - "No space left on device"拟合 Sklearn 模型时出错

我正在使用scikit-learn拟合包含大量数据的LDA模型。相关代码如下:lda=LatentDirichletAllocation(n_topics=n_topics,max_iter=iters,learning_method='online',learning_offset=offset,random_state=0,evaluate_every=5,n_jobs=3,verbose=0)lda.fit(X)(我想这里唯一可能相关的细节是我正在使用多个作业。)一段时间后,我收到“设备上没有剩余空间”错误,即使磁盘上有足够的空间和大量可用内存。我在两台不同的计算机上(在我的本地

python - "No space left on device"拟合 Sklearn 模型时出错

我正在使用scikit-learn拟合包含大量数据的LDA模型。相关代码如下:lda=LatentDirichletAllocation(n_topics=n_topics,max_iter=iters,learning_method='online',learning_offset=offset,random_state=0,evaluate_every=5,n_jobs=3,verbose=0)lda.fit(X)(我想这里唯一可能相关的细节是我正在使用多个作业。)一段时间后,我收到“设备上没有剩余空间”错误,即使磁盘上有足够的空间和大量可用内存。我在两台不同的计算机上(在我的本地

python - Lime vs TreeInterpreter 用于解释决策树

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion石灰来源:https://github.com/marcotcr/lime树解释器来源:treeinterpreter我试图了解DecisionTree如何使用Lime和treeinterpreter进行预测。虽然两者都声称他们能够在他们的描述中解释决策树。似乎两者都以不同的方式解释相同的DecisionTree。即特征贡献order。这怎么可能?如果两者都在看同一件事,并试图描述同一事件,

python - Lime vs TreeInterpreter 用于解释决策树

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion石灰来源:https://github.com/marcotcr/lime树解释器来源:treeinterpreter我试图了解DecisionTree如何使用Lime和treeinterpreter进行预测。虽然两者都声称他们能够在他们的描述中解释决策树。似乎两者都以不同的方式解释相同的DecisionTree。即特征贡献order。这怎么可能?如果两者都在看同一件事,并试图描述同一事件,