SciKit-Learn

python - 使用部分拟合的 sklearn 投票合奏

有人可以告诉我如何使用部分拟合在sklearn中使用集成。我不想重新训练我的模型。或者，我们可以通过预训练模型进行集成吗？例如，我已经看到投票分类器不支持使用部分拟合进行训练。最佳答案 Mlxtend库有一个VotingEnsemble的实现，它允许您传入预拟合模型。例如，如果您有三个预训练模型clf1、clf2、clf3。以下代码将起作用。frommlxtend.classifierimportEnsembleVoteClassifierimportcopyeclf=EnsembleVoteClassifier(clfs=[cl

合奏 sklearn section EnsembleVoteClassifier 训练 python machine-learning scikit-learn ensemble-learning

python - Sklearn 预处理 - PolynomialFeatures - 如何保留输出数组/数据帧的列名/标题

TLDR:如何从sklearn.preprocessing.PolynomialFeatures()函数获取输出numpy数组的header？假设我有以下代码...importpandasaspdimportnumpyasnpfromsklearnimportpreprocessingasppa=np.ones(3)b=np.ones(3)*2c=np.ones(3)*3input_df=pd.DataFrame([a,b,c])input_df=input_df.Tinput_df.columns=['a','b','c']input_dfabc012311232123poly=pp

列名 PolynomialFeatures 39 input_df section python python-2.7 validation scikit-learn cross-validation

python - 学习 : Cross validation for grouped data

我正在尝试对分组数据实现交叉验证方案。我希望使用GroupKFold方法，但我一直收到错误消息。我究竟做错了什么？代码(与我使用的代码略有不同——我有不同的数据，所以我有一个更大的n_splits，但其他一切都是一样的)fromsklearnimportmetricsimportmatplotlib.pyplotaspltimportnumpyasnpfromsklearn.model_selectionimportGroupKFoldfromsklearn.grid_searchimportGridSearchCVfromxgboostimportXGBRegressor#gener

validation grouped code GroupKFold section python scikit-learn cross-validation

python - 多处理 scikit-learn

我使用load_file方法让linearsvc针对训练集和测试集工作，我试图让它在多处理器环境中工作。如何在LinearSVC().fit()LinearSVC().predict()上进行多处理工作？我还不太熟悉scikit-learn的数据类型。我也在考虑将样本拆分为多个数组，但我不熟悉numpy数组和scikit-learn数据结构。这样做会更容易放入multiprocessing.pool()中，这样，将样本分成block，训练它们并稍后组合训练集，它会工作吗？编辑:这是我的场景:假设，我们在训练样本集中有100万个文件，当我们想要在多个处理器上分发Tfidfvectoriz

scikit-learn python section code multithreading numpy machine-learning

python - 如何将 Pandas 中的变量指定为序数/分类？

我正在尝试使用scikit-learn在数据集上运行一些机器学习算法。我的数据集有一些类似于类别的特征。就像一个特征是A，它的值1,2,3指定某物的质量。1:上等，2:二等，3:三等。所以它是一个有序变量。类似地，我重新编码了一个变量City，具有三个值('London',Zurich','NewYork'到1,2,3但对值没有特定偏好。所以现在这是一个名义分类变量。如何指定算法以将它们视为pandas中的分类和顺序等？。与在R中一样，分类变量由factor(a)指定，因此不被视为连续值。pandas/python中有类似的东西吗？最佳答案

定为 python code pandas 39 scikit-learn categorical-data

python - 具有许多输出的文本[多级]分类

问题陈述:将文本文档归类到其所属的类别，并将该类别最多分为两级。样本训练集:DescriptionCategoryLevel1Level2ThegunshootingthathappenedinVegaskilledtwoCrime|HighCrimeHighDonaldTrumpelectedasPresidentofAmericaPolitics|HighPoliticsHighRianwoninfootballqualifierSports|LowSportsLowBrazilwoninfootballfinalSports|HighSportsHigh初始尝试:我尝试创建一个分

许多 python data test 39 python-2.7 scikit-learn classification

Python scikit 学习线性模型参数标准误差

我正在使用sklearn，特别是linear_model模块。在拟合一个简单的线性之后importpandasaspdimportnumpyasnpfromsklearnimportlinear_modelrandn=np.random.randnX=pd.DataFrame(randn(10,3),columns=['X1','X2','X3'])y=pd.DataFrame(randn(10,1),columns=['Y'])model=linear_model.LinearRegression()model.fit(X=X,y=y)我看到了如何通过coef_和intercept_

Python scikit code intercept X_with_intercept scikit-learn linear-regression variance

python - [sklearn][standardscaler] 我可以反转模型输出的 standardscaler 吗？

我有一些数据结构如下，试图根据特征预测t。train_dft:timetopredictf1:feature1f2:feature2f3:......t是否可以使用StandardScaler进行缩放，所以我改为预测t'然后反转StandardScaler以返回实时？例如:fromsklearn.preprocessingimportStandardScalerscaler=StandardScaler()scaler.fit(train_df['t'])train_df['t']=scaler.transform(train_df['t'])运行回归模型，检查分数，!!用实时值检查预

standardscaler 反转 code section python scikit-learn scale

python - 在 Python 中拟合具有固定协方差的高斯混合

我有一些带有簇(停止位置)的二维数据(GPS数据)，我知道这些数据类似于具有特征标准差(与GPS样本的固有噪声成比例)的高斯分布。下图可视化了一个样本，我希望它有两个这样的集群。图像宽25米，高13米。sklearn模块有一个函数sklearn.mixture.GaussianMixture这使您可以将高斯混合拟合到数据中。该函数有一个参数covariance_type，它使您能够假设有关高斯形状的不同内容。例如，您可以使用'tied'参数假设它们是统一的。但是，假设协方差矩阵保持不变似乎并不直接可行。从sklearn源代码来看，进行修改以启用此功能似乎微不足道，但使用允许此功能的更新

python code self centers machine-learning scikit-learn gmm

python - 在 scikit-learn 中获得多标签预测的准确性

在multilabelclassification中设置，sklearn.metrics.accuracy_score仅计算子集准确性(3):即为样本预测的标签集必须与y_true中相应的标签集完全匹配。这种计算准确度的方法有时被命名为精确匹配率(1):在scikit-learn中有没有其他典型的方法来计算准确度，即(如(1)和(2)中所定义，更明确地称为Hamming分数(4)(因为它与Hamming损失密切相关)，或基于标签准确度)？(1)Sorower,MohammadS."Aliteraturesurveyonalgorithmsformulti-labellearning."

scikit-learn python noreferrer true noopener classification

24 25 262728 29 30