SKLEARN_草庐IT

python - 在 sklearn 中确定 SVM 分类器的最有贡献的特征

我有一个数据集，我想根据该数据训练我的模型。训练后，我需要知道对SVM分类器的分类起主要作用的特征。森林算法有一个叫做特征重要性的东西，有什么类似的吗？最佳答案是的，SVM分类器有coef_属性，但它只适用于具有linearkernel的SVM。对于其他内核，这是不可能的，因为数据是通过内核方法转换到另一个空间的，这与输入空间无关，请查看explanation.frommatplotlibimportpyplotaspltfromsklearnimportsvmdeff_importances(coef,names):imp=c

python - 在 sklearn 中确定 SVM 分类器的最有贡献的特征

我有一个数据集，我想根据该数据训练我的模型。训练后，我需要知道对SVM分类器的分类起主要作用的特征。森林算法有一个叫做特征重要性的东西，有什么类似的吗？最佳答案是的，SVM分类器有coef_属性，但它只适用于具有linearkernel的SVM。对于其他内核，这是不可能的，因为数据是通过内核方法转换到另一个空间的，这与输入空间无关，请查看explanation.frommatplotlibimportpyplotaspltfromsklearnimportsvmdeff_importances(coef,names):imp=c

sklearn python section names stackoverflow machine-learning scikit-learn svm

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手，正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame，我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归，所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题？还有，我想知道可视化结果根据结果进行预测？我搜索并浏览了

IndexError DataFrame code pre section python pandas scikit-learn linear-regression

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手，正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame，我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归，所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题？还有，我想知道可视化结果根据结果进行预测？我搜索并浏览了

IndexError DataFrame code pre section python pandas scikit-learn linear-regression

python - 为 CountVectorizer (sklearn) 添加词干支持

我正在尝试使用sklearn将词干添加到我的NLP管道中。fromnltk.stem.snowballimportFrenchStemmerstop=stopwords.words('french')stemmer=FrenchStemmer()classStemmedCountVectorizer(CountVectorizer):def__init__(self,stemmer):super(StemmedCountVectorizer,self).__init__()self.stemmer=stemmerdefbuild_analyzer(self):analyzer=supe

CountVectorizer sklearn 39 analyzer python nlp scikit-learn

python - 为 CountVectorizer (sklearn) 添加词干支持

我正在尝试使用sklearn将词干添加到我的NLP管道中。fromnltk.stem.snowballimportFrenchStemmerstop=stopwords.words('french')stemmer=FrenchStemmer()classStemmedCountVectorizer(CountVectorizer):def__init__(self,stemmer):super(StemmedCountVectorizer,self).__init__()self.stemmer=stemmerdefbuild_analyzer(self):analyzer=supe

CountVectorizer sklearn 39 analyzer python nlp scikit-learn

python - 使用 scikit-learn 进行特征选择

我是机器学习的新手。我正在准备使用ScikitLearnSVM进行分类的数据。为了选择最好的功能，我使用了以下方法:SelectKBest(chi2,k=10).fit_transform(A1,A2)由于我的数据集包含负值，我收到以下错误:ValueErrorTraceback(mostrecentcalllast)/media/5804B87404B856AA/TFM_UC3M/test2_v.pyin()---->12345/usr/local/lib/python2.6/dist-packages/sklearn/base.pycinfit_transform(self,X,y

scikit-learn python feature_selection selection sklearn machine-learning feature-selection chi-squared

python - 使用 scikit-learn 进行特征选择

我是机器学习的新手。我正在准备使用ScikitLearnSVM进行分类的数据。为了选择最好的功能，我使用了以下方法:SelectKBest(chi2,k=10).fit_transform(A1,A2)由于我的数据集包含负值，我收到以下错误:ValueErrorTraceback(mostrecentcalllast)/media/5804B87404B856AA/TFM_UC3M/test2_v.pyin()---->12345/usr/local/lib/python2.6/dist-packages/sklearn/base.pycinfit_transform(self,X,y

scikit-learn python feature_selection selection sklearn machine-learning feature-selection chi-squared

python - "No space left on device"拟合 Sklearn 模型时出错

我正在使用scikit-learn拟合包含大量数据的LDA模型。相关代码如下:lda=LatentDirichletAllocation(n_topics=n_topics,max_iter=iters,learning_method='online',learning_offset=offset,random_state=0,evaluate_every=5,n_jobs=3,verbose=0)lda.fit(X)(我想这里唯一可能相关的细节是我正在使用多个作业。)一段时间后，我收到“设备上没有剩余空间”错误，即使磁盘上有足够的空间和大量可用内存。我在两台不同的计算机上(在我的本地

时出 amp self python site-packages multithreading scikit-learn ioerror

python - "No space left on device"拟合 Sklearn 模型时出错

我正在使用scikit-learn拟合包含大量数据的LDA模型。相关代码如下:lda=LatentDirichletAllocation(n_topics=n_topics,max_iter=iters,learning_method='online',learning_offset=offset,random_state=0,evaluate_every=5,n_jobs=3,verbose=0)lda.fit(X)(我想这里唯一可能相关的细节是我正在使用多个作业。)一段时间后，我收到“设备上没有剩余空间”错误，即使磁盘上有足够的空间和大量可用内存。我在两台不同的计算机上(在我的本地

时出 amp self python site-packages multithreading scikit-learn ioerror