learning_topic

python - Scikit-learn 教程文档位置

我在Ubuntu14.04上安装了scikit-learn0.16.1，并且正在学习教程。SKL已安装所有默认配置。教程说明Thesourceofthistutorialcanbefoundwithinyourscikit-learnfolder:scikit-learn/doc/tutorial/text_analytics/我在整个驱动器上都使用了find，但没有“tutorial”文件夹。没有任何地方。有人知道这些文件的实际安装位置吗？最佳答案查找包内容包的安装位置取决于您安装scikit-learn的方式如果您通过以

程文档位 scikit-learn code scikit python ubuntu

python - 为什么我们用 sklearn 导入 scikit-learn？

为什么我们安装scikit-learn包:condainstallscikit-learn然后使用名称sklearn在脚本中导入(模块来自)包，例如:fromsklearnimportx 最佳答案 scikit-learn不是python中的有效标识符，所以它不可能是那个。我想他们本可以将包命名为scikit_learn，但需要输入的内容很多，所以我想他们只是为了方便起见而决定缩短包名称。当然，如果您愿意，您可以:importsklearnasscikit_learn:-) 关于pyth

scikit-learn sklearn code section scikit python

python - 使用 scikit-learn 对连续变量和分类变量(整数类型)进行特征预处理

主要目标如下:将StandardScaler应用于连续变量将LabelEncoder和OnehotEncoder应用于分类变量连续变量需要缩放，但同时有几个分类变量也是整数类型。应用StandardScaler会导致不良影响。另一方面，StandardScaler会缩放基于整数的分类变量，这也不是我们想要的。由于连续变量和分类变量混合在单个PandasDataFrame中，建议的工作流程是什么来处理此类问题？说明我的观点的最好例子是KaggleBikeSharingDemand数据集，其中season和weather是整数分类变量最佳答案

scikit-learn python code section StandardScaler pandas machine-learning categorical-data

python - 无法导入 Scikit-Learn

我尝试在我的LinuxMint12上安装scikit-learn但失败了。我从http://pypi.python.org/pypi/scikit-learn/下载了这个包并安装sudopython2.7setup.pyinstall然后我将目录更改为home并启动了python2.7shell。在导入sklearn时，我得到了:>>>importsklearn/usr/lib/python2.7/dist-packages/scipy/spatial/__init__.py:7:RuntimeWarning:numpy.dtypesizechanged,mayindicatebina

Scikit-Learn python dist-packages python2 importerror

python - 如何在 scikit-learn 的 LogisticRegressionCV 调用中将参数传递给评分函数

问题我正在尝试使用scikit-learn的LogisticRegressionCV与roc_auc_score作为评分指标。fromsklearn.linear_modelimportLogisticRegressionfromsklearn.metricsimportroc_auc_scoreclf=LogisticRegressionCV(scoring=roc_auc_score)但是当我尝试拟合模型时(clf.fit(X,y))，它会抛出一个错误。ValueError:averagehastobeoneof(None,'micro','macro','weighted','s

LogisticRegressionCV 何在 code roc_auc_score python function arguments scikit-learn scoring

python - 使用 scikit learn 训练逻辑回归以进行多类分类

根据scikitmulticlassclassification逻辑回归可以通过设置用于多类分类multi_class=multinomial在构造函数中。但是这样做会出错:代码:text_clf=Pipeline([('vect',TfidfVectorizer()),('clf',LogisticRegression(multi_class='multinomial')),])text_clf=text_clf.fit(X_train,Y_train)错误:ValueError:求解器liblinear不支持多项式后端。你能告诉我这里出了什么问题吗？注意:将multi_class保

训练 python section strong code scikit-learn classification

python - Scikit-learn:preprocessing.scale() 与 preprocessing.StandardScaler()

我理解缩放意味着以均值(mean=0)为中心并使单位方差(variance=1)。但是，scikit-learn中的preprocessing.scale(x)和preprocessing.StandardScalar()有什么区别？最佳答案它们做的完全一样，但是:preprocessing.scale(x)只是一个函数，它转换一些数据preprocessing.StandardScaler()是一个支持TransformerAPI的类我会一直使用后者，即使我不需要inverse_transform和co。由StandardSc

preprocessing StandardScaler code section python scikit-learn scale

python - 这条消息是什么意思？从 : can't read/var/mail/ex48 (Learn Python the Hard Way ex49)

这个问题在这里已经有了答案:GettingPythonerror"from:can'tread/var/mail/Bio"(7个答案)关闭6个月前。在ex49中，我们被告知使用以下命令调用在ex48中创建的lexicon.py文件。当我尝试使用以下命令导入词典文件时>>>fromex48importlexicon它返回以下内容:from:can'tread/var/mail/ex48我试过查找这个。这是什么意思？文件放错地方了吗？

python section notice code

python - 如何使用 scikit-learn 获取每个 k-means 集群的惯性值？

我正在使用scikitlearn进行聚类(k-means)。当我使用详细选项运行代码时，它会打印每次迭代的惯性。算法完成后，我想获得每个形成的簇的惯性(k个惯性值)。我怎样才能做到这一点？最佳答案我设法使用fit_transform方法获取该信息，他们获取每个样本与其簇之间的距离。model=cluster.MiniBatchKMeans(n_clusters=n)distances=model.fit_transform(trainSamples)variance=0i=0forlabelinmodel.labels_:var

scikit-learn k-means section variance fit_transform python machine-learning scipy

python - 在 scikit-learn 和/或 pandas 中重新采样

Pandas或Scikit-learn中是否有根据指定策略进行重采样的内置函数？我想根据分类变量对数据重新采样。例如，如果我的数据有75%的男性和25%的女性，但我想用50%的男性和50%的女性来训练我的模型。(我还希望能够概括为不是50/50的情况)我需要的是根据指定比例对我的数据重新采样的东西。最佳答案我在下面尝试了一个函数来做我想做的事。希望这对其他人有帮助。X和y分别假定为PandasDataFrame和Series。defresample(X,y,sample_type=None,sample_size=None,cl

scikit-learn python sample sample_size size pandas