草庐IT

SGDClassifier

全部标签

python - SGDClassifier 与 LogisticRegression 与 scikit-learn 库中的 sgd 求解器

scikit-learn库具有以下看起来相似的分类器:逻辑回归分类器有不同的求解器,其中之一是'sgd'http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression它还有一个不同的分类器“SGDClassifier”和损失对于逻辑回归,参数可以称为“log”。http://scikit-learn.org/stable/modules/generated/sklearn.linear

python - (如何)您可以使用 fit. 在 sklearn 中训练模型两次(多次)?

示例:我的数据不适合内存,我可以这样做吗:model=my_modelforiinrange(20)model.fit(X_i,Y_i)这将删除前19个匹配项。并且只保留最后一个。我怎样才能避免这种情况?我可以重新训练已保存和加载的模型吗?谢谢 最佳答案 有些模型有一个“warm_start”参数,它会用fit()的先前解决方案初始化模型参数例如参见SGDClassifier 关于python-(如何)您可以使用fit.在sklearn中训练模型两次(多次)?,我们在StackOverf

python - (如何)您可以使用 fit. 在 sklearn 中训练模型两次(多次)?

示例:我的数据不适合内存,我可以这样做吗:model=my_modelforiinrange(20)model.fit(X_i,Y_i)这将删除前19个匹配项。并且只保留最后一个。我怎样才能避免这种情况?我可以重新训练已保存和加载的模型吗?谢谢 最佳答案 有些模型有一个“warm_start”参数,它会用fit()的先前解决方案初始化模型参数例如参见SGDClassifier 关于python-(如何)您可以使用fit.在sklearn中训练模型两次(多次)?,我们在StackOverf

python - Python 中的加权逻辑回归

我正在寻找Python中逻辑回归(非正则化)的良好实现。我正在寻找一个也可以为每个向量获取权重的包。谁能建议一个好的实现/包?谢谢! 最佳答案 我注意到这个问题现在已经很老了,但希望这能对某人有所帮助。使用sklearn,您可以使用SGDClassifier类通过简单地将“log”作为损失传递来创建逻辑回归模型:sklearn.linear_model.SGDClassifier(loss='log',...).此类在fit()函数中实现加权样本:classifier.fit(X,Y,sample_weight=weights)其中

python - Python 中的加权逻辑回归

我正在寻找Python中逻辑回归(非正则化)的良好实现。我正在寻找一个也可以为每个向量获取权重的包。谁能建议一个好的实现/包?谢谢! 最佳答案 我注意到这个问题现在已经很老了,但希望这能对某人有所帮助。使用sklearn,您可以使用SGDClassifier类通过简单地将“log”作为损失传递来创建逻辑回归模型:sklearn.linear_model.SGDClassifier(loss='log',...).此类在fit()函数中实现加权样本:classifier.fit(X,Y,sample_weight=weights)其中

python - Sklearn SGDClassifier 部分拟合

我正在尝试使用SGD对大型数据集进行分类。由于数据太大而无法放入内存,我想使用partial_fit方法来训练分类器。我选择了适合内存的数据集样本(100,000行)来测试fit与partial_fit:fromsklearn.linear_modelimportSGDClassifierdefbatches(l,n):foriinxrange(0,len(l),n):yieldl[i:i+n]clf1=SGDClassifier(shuffle=True,loss='log')clf1.fit(X,Y)clf2=SGDClassifier(shuffle=True,loss='log

python - Sklearn SGDClassifier 部分拟合

我正在尝试使用SGD对大型数据集进行分类。由于数据太大而无法放入内存,我想使用partial_fit方法来训练分类器。我选择了适合内存的数据集样本(100,000行)来测试fit与partial_fit:fromsklearn.linear_modelimportSGDClassifierdefbatches(l,n):foriinxrange(0,len(l),n):yieldl[i:i+n]clf1=SGDClassifier(shuffle=True,loss='log')clf1.fit(X,Y)clf2=SGDClassifier(shuffle=True,loss='log