Scikit-Image

python - 多项式朴素贝叶斯参数 alpha 设置？ scikit学习

有谁知道在做朴素贝叶斯分类时如何设置alpha参数吗？例如我首先使用词袋构建特征矩阵，矩阵的每个单元格都是词的计数，然后我使用tf(termfrequency)对矩阵进行归一化。但是当我使用朴素贝叶斯构建分类器模型时，我选择使用多项式N.B(我认为这是正确的，而不是伯努利和高斯)。默认的alpha设置是1.0(文档说它是拉普拉斯平滑，我不知道是什么)。结果真的很糟糕，只有21%的召回率找到了正类(目标类)。但是当我设置alpha=0.0001(我随机选择)时，结果得到95%的召回率。此外，我检查了多项式N.Bformula，我认为这是因为alpha问题，因为如果我使用单词计数作为特征，

贝叶朴素 section alpha python scikit-learn classification naivebayes

python - Scikit 学习错误消息 'Precision and F-score are ill-defined and being set to 0.0 in labels'

这个问题在这里已经有了答案:UndefinedMetricWarning:F-scoreisill-definedandbeingsetto0.0inlabelswithnopredictedsamples(7个答案)ClassificationReport-PrecisionandF-scoreareill-defined(2个答案)关闭去年。我正在研究二元分类模型，分类器是朴素贝叶斯。我有一个几乎平衡的数据集，但是我在预测时收到以下错误消息:UndefinedMetricWarning:PrecisionandF-scoreareill-definedandbeingsetto0.

ill-defined Precision section train 39 python scikit-learn classification

python - SGDClassifier 与 LogisticRegression 与 scikit-learn 库中的 sgd 求解器

scikit-learn库具有以下看起来相似的分类器:逻辑回归分类器有不同的求解器，其中之一是'sgd'http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression它还有一个不同的分类器“SGDClassifier”和损失对于逻辑回归，参数可以称为“log”。http://scikit-learn.org/stable/modules/generated/sklearn.linear

求解 LogisticRegression SGDClassifier scikit-learn linear_model python machine-learning

python - 用于降维的 Scikit-learn 主成分分析 (PCA)

我想进行降维和数据集成的主成分分析。我有3个特征(变量)和5个样本，如下所示。我想通过转换它们(计算第一台PC)将它们集成到一维(1个特征)输出中。我想使用转换后的数据进行进一步的统计分析，因为我相信它显示了3个输入特征的“主要”特征。我首先使用scikit-learn使用python编写了一个测试代码，如下所示。这是简单的情况，即3个特征的值都相等。换句话说，我对三个相同的向量[0,1,2,1,0]应用了PCA。代码importnumpyasnpfromsklearn.decompositionimportPCApca=PCA(n_components=1)samples=np.ar

Scikit-learn python section power speed pca feature-extraction

python - scikit-learn 中的 10*10 折交叉验证？

是classsklearn.cross_validation.ShuffleSplit(n,n_iterations=10,test_fraction=0.10000000000000001,indices=True,random_state=None)scikit-learn中10*10foldCV的正确方法？(通过将random_state更改为10个不同的数字)因为我没有在StratifiedK-Fold或K-Fold中找到任何random_state参数并且与K分开-折叠对于相同的数据总是相同的。如果ShuffleSplit是正确的，一个问题是它被提及了Note:contrar

scikit-learn python code section random_state machine-learning scikits

python - 将 scikit-learn TfIdf 与 gensim LDA 结合使用

我在scikit中使用了各种版本的TFIDF来学习建模一些文本数据。vectorizer=TfidfVectorizer(min_df=1,stop_words='english')结果数据X的格式如下:'withxyzstoredelementsinCompressedSparseRowformat>我想尝试使用LDA来降低稀疏矩阵的维数。有没有一种简单的方法可以将NumPy稀疏矩阵X馈送到gensimLDA模型中？lda=models.ldamodel.LdaModel(corpus=corpus,id2word=dictionary,num_topics=100)我可以忽略sci

scikit-learn python section gensim code text-mining lda

python - 如何使用 XGBoost 获取 Predictions 和使用 Scikit-Learn Wrapper 的 XGBoost 进行匹配？

我是Python中XGBoost的新手，所以如果这里的答案很明显，我深表歉意，但我正在尝试使用panda数据框并在Python中获取XGBoost来给我使用Scikit-Learn包装器时得到的相同预测对于同一个练习。到目前为止，我一直无法这样做。举个例子，这里我使用波士顿数据集，转换为Pandas数据框，训练数据集的前500个观察值，然后预测最后6个。我先用XGBoost做，然后用Scikit-Learn包装器和即使我将模型的参数设置为相同，我也会得到不同的预测。具体来说，数组预测看起来与数组预测2非常不同(请参见下面的代码)。任何帮助将不胜感激!fromsklearnimportd

XGBoost Scikit-Learn 39 train code python

python - 从 Scikit (Python) 中的管道检索中间特征

我使用的管道与给定的管道非常相似inthisexample:>>>text_clf=Pipeline([('vect',CountVectorizer()),...('tfidf',TfidfTransformer()),...('clf',MultinomialNB()),...])我使用GridSearchCV在参数网格上找到最佳估计器。但是，我想使用CountVectorizer()中的get_feature_names()方法获取训练集的列名称。如果不在管道外实现CountVectorizer()是否可行？最佳答案使用g

python Scikit code 39 section scikit-learn pipeline

python - Image in Image with cvMatchTemplate - 但是怎么做呢？

我想找出某个子图像出现在源图像的哪个位置(例如源图像:http://i.pictr.com/6xg895m69q.png，子图像:http://i.pictr.com/jdaz9zwzej.png)。据我所知，有必要转换数组以使它们对OpenCV“可读”，这是我尝试过的方法，但由于某种原因，它不起作用。到目前为止，这是我的代码:fromPILimportImageimportnumpyfrompylabimport*importcv2importcvimage=cv2.imread('source_img.jpg')template=cv2.imread('template_img.j

Image cvMatchTemplate result section cv python image-processing opencv python-2.7 computer-vision

python - 在ubuntu上导入caffe时ImportError cannot import name BytesIO

我正在尝试制作caffe在我的机器上运行Ubuntu12.04LTS。完成Installationpage上的所有步骤后,我成功地训练了LeNet模型并尝试将其用作here的教程.然后我得到以下错误:Traceback(mostrecentcalllast):File"",line1,inImportError:NomodulenamedcaffeErrorinsys.excepthook:Traceback(mostrecentcalllast):File"/usr/lib/python2.7/dist-packages/apport_python_hook.py",line66,i

ImportError BytesIO python import module python-2.7 ubuntu scikit-image caffe

73 74 757677 78 79