SciKit-Learn_草庐IT

python - 如何为 scikit-learn 分类器获取信息量最大的特征？

liblinear和nltk等机器学习包中的分类器提供了一个方法show_most_informative_features()，这对调试功能非常有帮助:viagra=Noneok:spam=4.5:1.0hello=Trueok:spam=4.5:1.0hello=Nonespam:ok=3.3:1.0viagra=Truespam:ok=3.3:1.0casino=Truespam:ok=2.0:1.0casino=Noneok:spam=1.5:1.0我的问题是是否为scikit-learn中的分类器实现了类似的功能。我搜索了文档，但找不到类似的东西。如果还没有这样的功能，有人知

何为 scikit-learn code section class python machine-learning classification

python - 如何为 scikit-learn 分类器获取信息量最大的特征？

liblinear和nltk等机器学习包中的分类器提供了一个方法show_most_informative_features()，这对调试功能非常有帮助:viagra=Noneok:spam=4.5:1.0hello=Trueok:spam=4.5:1.0hello=Nonespam:ok=3.3:1.0viagra=Truespam:ok=3.3:1.0casino=Truespam:ok=2.0:1.0casino=Noneok:spam=1.5:1.0我的问题是是否为scikit-learn中的分类器实现了类似的功能。我搜索了文档，但找不到类似的东西。如果还没有这样的功能，有人知

何为 scikit-learn code section class python machine-learning classification

python - ImportError : No module named sklearn. cross_validation

我在Ubuntu14.04中使用python2.7。我使用以下命令安装了scikit-learn、numpy和matplotlib:sudoapt-getinstallbuild-essentialpython-devpython-numpy\python-numpy-devpython-scipylibatlas-devg++python-matplotlib\ipython但是当我导入这些包时:fromsklearn.cross_validationimporttrain_test_split它返回给我这个错误:ImportError:Nomodulenamedsklearn.cr

cross_validation ImportError code section python scikit-learn

python - ImportError : No module named sklearn. cross_validation

我在Ubuntu14.04中使用python2.7。我使用以下命令安装了scikit-learn、numpy和matplotlib:sudoapt-getinstallbuild-essentialpython-devpython-numpy\python-numpy-devpython-scipylibatlas-devg++python-matplotlib\ipython但是当我导入这些包时:fromsklearn.cross_validationimporttrain_test_split它返回给我这个错误:ImportError:Nomodulenamedsklearn.cr

cross_validation ImportError code section python scikit-learn

python - 导入错误 : No module named model_selection

我正在尝试使用train_test_split函数并编写:fromsklearn.model_selectionimporttrain_test_split这会导致ImportError:Nomodulenamedmodel_selection为什么？又如何克服？最佳答案我猜你的scikit-learn版本有误，描述了类似的情况hereonGitHub.以前(在v0.18之前)，train_test_split位于cross_validation模块中:fromsklearn.cross_validationimporttrai

model_selection selection code section train_test_split python scikit-learn

python - 导入错误 : No module named model_selection

我正在尝试使用train_test_split函数并编写:fromsklearn.model_selectionimporttrain_test_split这会导致ImportError:Nomodulenamedmodel_selection为什么？又如何克服？最佳答案我猜你的scikit-learn版本有误，描述了类似的情况hereonGitHub.以前(在v0.18之前)，train_test_split位于cross_validation模块中:fromsklearn.cross_validationimporttrai

model_selection selection code section train_test_split python scikit-learn

python - scikit-learn 中的 class_weight 参数是如何工作的？

我在理解scikit-learn的逻辑回归中的class_weight参数如何运作时遇到了很多麻烦。情况我想使用逻辑回归对非常不平衡的数据集进行二元分类。类别标记为0(阴性)和1(阳性)，观察数据的比例约为19:1，大多数样本的结果为阴性。第一次尝试:手动准备训练数据我将拥有的数据拆分为不相交的数据集以进行训练和测试(大约80/20)。然后我手动对训练数据进行随机抽样，得到不同比例的训练数据，而不是19:1；从2:1->16:1。然后，我对这些不同的训练数据子集进行逻辑回归训练，并将召回率(=TP/(TP+FN))绘制为不同训练比例的函数。当然，召回是在不相交的TEST样本上计算的，这

class_weight scikit-learn code weight python

python - scikit-learn 中的 class_weight 参数是如何工作的？

我在理解scikit-learn的逻辑回归中的class_weight参数如何运作时遇到了很多麻烦。情况我想使用逻辑回归对非常不平衡的数据集进行二元分类。类别标记为0(阴性)和1(阳性)，观察数据的比例约为19:1，大多数样本的结果为阴性。第一次尝试:手动准备训练数据我将拥有的数据拆分为不相交的数据集以进行训练和测试(大约80/20)。然后我手动对训练数据进行随机抽样，得到不同比例的训练数据，而不是19:1；从2:1->16:1。然后，我对这些不同的训练数据子集进行逻辑回归训练，并将召回率(=TP/(TP+FN))绘制为不同训练比例的函数。当然，召回是在不相交的TEST样本上计算的，这

class_weight scikit-learn code weight python

python - sklearn 错误 ValueError : Input contains NaN, 无穷大或对于 dtype ('float64' 的值太大)

我正在使用sklearn，但亲和力传播存在问题。我已经建立了一个输入矩阵，但我不断收到以下错误。ValueError:InputcontainsNaN,infinityoravaluetoolargefordtype('float64').我跑了np.isnan(mat.any())#andgetsFalsenp.isfinite(mat.all())#andgetsTrue我尝试过使用mat[np.isfinite(mat)==True]=0删除无限值，但这也不起作用。我可以做些什么来摆脱矩阵中的无限值，以便我可以使用亲和传播算法？我正在使用anaconda和python2.7.9。

ValueError amp code section pre python python-2.7 scikit-learn

python - sklearn 错误 ValueError : Input contains NaN, 无穷大或对于 dtype ('float64' 的值太大)

我正在使用sklearn，但亲和力传播存在问题。我已经建立了一个输入矩阵，但我不断收到以下错误。ValueError:InputcontainsNaN,infinityoravaluetoolargefordtype('float64').我跑了np.isnan(mat.any())#andgetsFalsenp.isfinite(mat.all())#andgetsTrue我尝试过使用mat[np.isfinite(mat)==True]=0删除无限值，但这也不起作用。我可以做些什么来摆脱矩阵中的无限值，以便我可以使用亲和传播算法？我正在使用anaconda和python2.7.9。

ValueError amp code section pre python python-2.7 scikit-learn