草庐IT

$sklearn

全部标签

解决Python中加载sklearn新闻数据集出现的HTTP Error 403 Forbidden问题

解决Python中加载sklearn新闻数据集出现的HTTPError403Forbidden问题在使用Python调用sklearn中的fetch_20newsgroups函数加载新闻数据集时,有时会遇到HTTPError403Forbidden错误,主要是由于爬虫被禁止访问导致的。本文将介绍两种常用的解决方法。方法一:更改请求头通常,HTTPError403Forbidden错误是由于缺少合适的请求头信息所引起的。我们可以为请求加入User-Agent信息,让服务器认为是正常的浏览器访问,从而避免被拒绝。下面是修改请求头的代码示例:fromsklearn.datasetsimportfet

python - 使用 Python scikit sklearn 调用最近邻 (knn) 分类器的预测函数

我试图调用最近邻的预测函数并得到以下错误:AttributeError:'NearestNeighbors'objecthasnoattribute'predict'代码是:fromsklearn.neighborsimportNearestNeighborssamples=[[0.,0.,0.],[0.,.5,0.],[1.,1.,.5]]neigh=NearestNeighbors()neigh.fit(samples)neigh.predict([[1.,1.,1.]])#thiscauseerror我已经阅读了文档并且它具有预测功能:http://scikit-learn.or

python - 从matlab中直接在python中使用sklearn

请不要将此标记为howtocallpythonandsklearnfrommatlab?的重复项因为这个问题在我看来没有得到真正的回答。我认为自MatlabReleaseR2014b以来,有可能directlyusepythonfrommatlab.简而言之,你只需要将py放在python调用的前面。我的设置(在使用命令pyversion('PATH_TO_PYTHON')为matlab提供python路径后,运行正常。我什至可以使用dask多处理。非常酷。对于例如,执行py.dask.distributed.Client结果PythonClientwithproperties:asy

python - 无法在 scikit-learn 中导入 sklearn.model_selection

我正在尝试导入sklearn.model_selection。我尝试重新安装scikit-learn和anaconda,但仍然无法正常工作。这是我收到的错误信息:ImportErrorTraceback(mostrecentcalllast)in()4get_ipython().magic(u'matplotlibinline')5#fromsklearn.model_selectionimporttrain_test_split---->6importsklearn.model_selection/Users/Lu/anaconda/lib/python2.7/site-packag

python - 如何使用 sklearn 的 cross_val_score() 标准化数据

假设我想使用LinearSVC对数据集执行k折交叉验证。我将如何对数据执行标准化?我读到的最佳做法是在训练数据上构建标准化模型,然后将该模型应用于测试数据。当使用简单的train_test_split()时,这很容易,因为我们可以这样做:X_train,X_test,y_train,y_test=train_test_split(X,y,stratify=y)clf=svm.LinearSVC()scalar=StandardScaler()X_train=scalar.fit_transform(X_train)X_test=scalar.transform(X_test)clf.f

python - sklearn Latent Dirichlet 分配变换 v. Fittransform

我正在使用sklearn的NMF和LDA子模块来分析未标记的文本。我阅读了文档,但不确定这些模块(NMF和LDA)中的变换函数是否与R的主题模型中的后验函数相同(请参阅PredictingLDAtopicsfornewdata)。基本上,我正在寻找一个函数,它可以让我使用在训练集数据上训练的模型来预测测试集中的主题。我预测了整个数据集的主题。然后我将数据分成训练集和测试集,在训练集上训练模型并使用该模型转换测试集。虽然预计我不会得到相同的结果,但比较这两个运行主题并不能向我保证转换函数与R的包具有相同的功能。非常感谢您的回复。谢谢 最佳答案

python - 导入错误 : cannot import name 'logsumexp' when importing sklearn. model_selection

我试图在python3.5的anaconda环境下用JupiterNotebook导入sklearn.model_selection,但我被警告说我没有“model_selection”模块,所以我做了conda更新scikit-learn。之后,我在导入sklearn.model_selection时收到了ImportError:cannotimportname'logsumexp'的消息。我重新安装了sklearn和scipy,但仍然收到同样的错误信息。我可以提点建议吗? 最佳答案 我刚才遇到了完全相同的问题。在我更新了scik

python - 从文件加载数据集,与 sklearn/numpy 一起使用,包括标签

我看到通过sklearn我们可以使用一些预定义的数据集,例如mydataset=datasets.load_digits()我们可以获得数据集mydataset的数组(numpy数组?).data和相应标签的数组mydataset.target。但是我想加载我自己的数据集以便能够将它与sklearn一起使用。我应该如何以及以哪种格式加载我的数据?我的文件具有以下格式(每行是一个数据点):-0.2080,0.3480,0.3280,0.5040,0.9320,1.0000,label1-0.2864,0.1992,0.2822,0.4398,0.7012,0.7800,label3...

python - sklearn StandardScaler 返回全零

我有一个从以前的模型中保存的sklearnStandardScaler,我正在尝试将其应用于新数据scaler=myOldStandardScalerprint("ORIG:",X)print("CLASS:",X.__class__)X=scaler.fit_transform(X)print("SCALED:",X)我有三个观察值,每个观察值有2000个特征。如果我分别运行每个观察,我会得到一个全为零的输出。ORIG:[[3.19029839e-040.00000000e+001.90985485e-06...,0.00000000e+000.00000000e+000.00000

python - 如何从sklearn AgglomerativeClustering遍历树?

我有一个numpy文本文件数组:https://github.com/alvations/anythingyouwant/blob/master/WN_food.matrix它是术语之间的距离矩阵,我的术语列表是这样的:http://pastebin.com/2xGt7Xjh我使用以下代码生成了一个层次集群:importnumpyasnpfromsklearn.clusterimportAgglomerativeClusteringmatrix=np.loadtxt('WN_food.matrix')n_clusters=518model=AgglomerativeClustering