Desire2Learn_草庐IT

python - scikit-learn 中的不平衡

我在我的Python程序中使用scikit-learn来执行一些机器学习操作。问题是我的数据集存在严重的不平衡问题。是否有人熟悉scikit-learn或python中不平衡的解决方案？在Java中有SMOTE机制。python中有没有并行的东西？最佳答案这里有一个新的https://github.com/scikit-learn-contrib/imbalanced-learn它包含以下类别的许多算法，包括SMOTE对多数类进行欠采样。对少数类进行过采样。结合过采样和欠采样。创建整体平衡集。

scikit-learn 不平 section learn scikit python

python - 如何预测 scikit-learn 中的时间序列？

Scikit-learn使用了一种非常方便的方法，基于fit和predict方法。我有适合fit和predict格式的时间序列数据。例如我有以下Xs:[[1.0,2.3,4.5],[6.7,2.7,1.2],...,[3.2,4.7,1.1]]以及对应的ys:[[1.0],[2.3],...,[7.7]]这些数据具有以下含义。ys中存储的值形成一个时间序列。Xs中的值是对应的与时间相关的“因素”，已知它们对ys中的值有一定影响(例如:温度、湿度和大气压力)。现在，当然，我可以使用fit(Xs,ys)。但是后来我得到了一个模型，其中ys中的future值仅取决于因素，而不依赖于先前的Y值

scikit-learn python code section EWMA machine-learning time-series

python - 如何预测 scikit-learn 中的时间序列？

Scikit-learn使用了一种非常方便的方法，基于fit和predict方法。我有适合fit和predict格式的时间序列数据。例如我有以下Xs:[[1.0,2.3,4.5],[6.7,2.7,1.2],...,[3.2,4.7,1.1]]以及对应的ys:[[1.0],[2.3],...,[7.7]]这些数据具有以下含义。ys中存储的值形成一个时间序列。Xs中的值是对应的与时间相关的“因素”，已知它们对ys中的值有一定影响(例如:温度、湿度和大气压力)。现在，当然，我可以使用fit(Xs,ys)。但是后来我得到了一个模型，其中ys中的future值仅取决于因素，而不依赖于先前的Y值

scikit-learn python code section EWMA machine-learning time-series

python - get_dummies (Pandas) 和 OneHotEncoder (Scikit-learn) 之间的优缺点是什么？

我正在学习将分类变量转换为机器学习分类器的数值的不同方法。我遇到了pd.get_dummies方法和sklearn.preprocessing.OneHotEncoder()，我想看看它们在性能和使用方面有何不同。我在https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/上找到了关于如何使用OneHotEncoder()的教程因为sklearn文档对此功能没有太大帮助。我感觉我做得不对……但是能否解释一下使用p

优缺点 OneHotEncoder code strong python pandas machine-learning scikit-learn dummy-variable

python - get_dummies (Pandas) 和 OneHotEncoder (Scikit-learn) 之间的优缺点是什么？

我正在学习将分类变量转换为机器学习分类器的数值的不同方法。我遇到了pd.get_dummies方法和sklearn.preprocessing.OneHotEncoder()，我想看看它们在性能和使用方面有何不同。我在https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/上找到了关于如何使用OneHotEncoder()的教程因为sklearn文档对此功能没有太大帮助。我感觉我做得不对……但是能否解释一下使用p

优缺点 OneHotEncoder code strong python pandas machine-learning scikit-learn dummy-variable

Python scikit-learn : exporting trained classifier

我正在使用来自nolearn的DBN(深度信念网络)基于scikit-learn。我已经建立了一个可以很好地对我的数据进行分类的网络，现在我有兴趣导出模型以进行部署，但我不知道如何(每次我想预测某些东西时我都在训练DBN)。在matlab中，我只需导出权重矩阵并将其导入另一台机器。有人知道如何导出模型/要导入的权重矩阵而无需再次训练整个模型吗？最佳答案首先，安装joblib.你可以使用:>>>importjoblib>>>joblib.dump(clf,'my_model.pkl',compress=9)然后，在预测服务器上:>

scikit-learn classifier section joblib noreferrer python

Python scikit-learn : exporting trained classifier

我正在使用来自nolearn的DBN(深度信念网络)基于scikit-learn。我已经建立了一个可以很好地对我的数据进行分类的网络，现在我有兴趣导出模型以进行部署，但我不知道如何(每次我想预测某些东西时我都在训练DBN)。在matlab中，我只需导出权重矩阵并将其导入另一台机器。有人知道如何导出模型/要导入的权重矩阵而无需再次训练整个模型吗？最佳答案首先，安装joblib.你可以使用:>>>importjoblib>>>joblib.dump(clf,'my_model.pkl',compress=9)然后，在预测服务器上:>

scikit-learn classifier section joblib noreferrer python

python - 从 scikit-learn 中消除警告

这个问题在这里已经有了答案:HowtoignoredeprecationwarningsinPython(17个回答)关闭6年前。我想在教学时忽略所有包的警告，但scikit-learn似乎可以使用warnings包来控制它。例如:withwarnings.catch_warnings():warnings.simplefilter("ignore")fromsklearnimportpreprocessing/usr/local/lib/python3.5/site-packages/sklearn/utils/fixes.py:66:DeprecationWarning:inspe

scikit-learn python section warnings inspect

python - 从 scikit-learn 中消除警告

这个问题在这里已经有了答案:HowtoignoredeprecationwarningsinPython(17个回答)关闭6年前。我想在教学时忽略所有包的警告，但scikit-learn似乎可以使用warnings包来控制它。例如:withwarnings.catch_warnings():warnings.simplefilter("ignore")fromsklearnimportpreprocessing/usr/local/lib/python3.5/site-packages/sklearn/utils/fixes.py:66:DeprecationWarning:inspe

scikit-learn python section warnings inspect

python - scikit-learn .predict() 默认阈值

我正在处理不平衡类(5%1)的分类问题。我想预测类别，而不是概率。在一个二元分类问题中，scikit的classifier.predict()是否默认使用0.5？如果没有，默认方法是什么？如果是，我该如何更改？在scikit中，一些分类器具有class_weight='auto'选项，但并非所有分类器都有。使用class_weight='auto'，.predict()是否会以实际人口比例作为阈值？在像MultinomialNB这样不支持class_weight的分类器中，有什么方法可以做到这一点？除了使用predict_proba()然后自己计算类。最佳

scikit-learn predict code section python machine-learning classification