草庐IT

$sklearn

全部标签

python - sklearn 逻辑回归 "ValueError: Found array with dim 3. Estimator expected <= 2."

我试图解决thisproblem6inthisnotebook.问题是使用来自sklearn.linear_model的LogisticRegression模型,使用50、100、1000和5000个训练样本来训练一个简单的模型。lr=LogisticRegression()lr.fit(train_dataset,train_labels)这是我试图做的代码,它给了我错误。ValueError:Foundarraywithdim3.Estimatorexpected有什么想法吗? 最佳答案 scikit-learn期望fit的训练

python - 如何安装sklearn?

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭6年前。Improvethisquestion我有一个数字识别程序,并且我已经安装了NumPy和OpenCv库。但是,我还需要安装sklearn库。请帮我弄清楚如何在我的系统上安装它。 最佳答案 pipinstallnumpyscipyscikit-learn如果您没有pip,请使用安装它pythonget-pip.py从followinglink

python - sklearn中StratifiedKFold和StratifiedShuffleSplit的区别

从标题我想知道两者之间有什么区别StratifiedKFold带参数shuffle=TrueStratifiedKFold(n_splits=10,shuffle=True,random_state=0)和StratifiedShuffleSplitStratifiedShuffleSplit(n_splits=10,test_size=’default’,train_size=None,random_state=0)以及使用StratifiedShuffleSplit有什么好处 最佳答案 在stratKFolds中,每个测试集都不

python - SKlearn 导入 MLPClassifier 失败

我正在尝试使用multilayerperceptron来自python中的scikit-learn。我的问题是,导入不起作用。scikit-learn的所有其他模块都运行良好。fromsklearn.neural_networkimportMLPClassifierImportError:cannotimportnameMLPClassifier我在VisualStudio2015中使用Python环境Python64位3.4。我在控制台上安装了sklearn:condainstallscikit-learn我还安装了numpy和pandas。在出现上述错误后,我还安装了scikit-

python - 使用 Sklearn 的 TfidfVectorizer 变换

我正在尝试使用Sklearn的TfidfVectorizer对象获取单个文档的tf-idf向量。我根据一些训练文档创建了一个词汇表,并使用fit_transform来训练TfidfVectorizer。然后,我想找到任何给定测试文档的tf-idf向量。fromsklearn.feature_extraction.textimportTfidfVectorizerself.vocabulary="alistofwordsIwanttolookforinthedocuments".split()self.vect=TfidfVectorizer(sublinear_tf=True,max_

python - 如何将 sklearn fit_transform 与 Pandas 一起使用并返回数据帧而不是 numpy 数组?

我想将缩放(使用sklearn.preprocessing中的StandardScaler())应用到pandas数据帧。以下代码返回一个numpy数组,因此我丢失了所有列名和索引。这不是我想要的。features=df[["col1","col2","col3","col4"]]autoscaler=StandardScaler()features=autoscaler.fit_transform(features)我在网上找到的一个“解决方案”是:features=features.apply(lambdax:autoscaler.fit_transform(x))它似乎有效,但会

python - 使用 sklearn.AgglomerativeClustering 绘制树状图

我正在尝试使用AgglomerativeClustering提供的children_属性构建树状图,但到目前为止我运气不佳。我不能使用scipy.cluster因为scipy中提供的凝聚集群缺少一些对我很重要的选项(例如指定集群数量的选项)。我将非常感谢那里的任何建议。importsklearn.clusterclstr=cluster.AgglomerativeClustering(n_clusters=2)clusterer.children_ 最佳答案 这里是simplefunction用于从sklearn获取层次聚类模型并使

python - sklearn 中的 SVM 是否支持增量(在线)学习?

我目前正在为文本文章设计推荐系统(“有趣”或“不有趣”的二元案例)。我的规范之一是它应该不断更新以适应不断变化的趋势。据我所知,最好的方法是使用支持增量的机器学习算法/onlinelearning.Perceptron和Winnow等算法支持在线学习,但我不完全确定支持向量机。scikit-learnpython库是否支持在线学习?如果支持,支持向量机是可以利用它的算法之一吗?我显然并不完全依赖于使用支持向量机,但由于它们的全面性能,它们通常是二进制分类的首选算法。我愿意改变任何最终最适合的方式。 最佳答案 虽然SVM的在线算法确实

python - sklearn 随机森林可以直接处理分类特征吗?

假设我有一个分类特征,颜色,它采用值['红色','蓝色','绿色','橙色'],我想用它来预测随机森林中的某些东西。如果我对其进行一次热编码(即我将其更改为四个虚拟变量),我如何告诉sklearn这四个虚拟变量实际上是一个变量?具体来说,当sklearn随机选择要在不同节点上使用的特征时,它应该包括红色、蓝色、绿色和橙色的假人,或者不应该包括任何一个。我听说没有办法做到这一点,但我想必须有一种方法来处理分类变量,而不是将它们任意编码为数字或类似的东西。 最佳答案 不,没有。某人的workingonthis并且补丁可能有一天会合并到主

python - 将分类数据传递给 Sklearn 决策树

有几篇关于如何将分类数据编码到Sklearn决策树的帖子,但是从Sklearn文档中,我们得到了这些Someadvantagesofdecisiontreesare:(...)Abletohandlebothnumericalandcategoricaldata.Othertechniquesareusuallyspecializedinanalyzingdatasetsthathaveonlyonetypeofvariable.Seethealgorithmsformoreinformation.但运行以下脚本importpandasaspdfromsklearn.treeimpor