草庐IT

Desire2Learn

全部标签

python - scikit-learn 中的不平衡

我在我的Python程序中使用scikit-learn来执行一些机器学习操作。问题是我的数据集存在严重的不平衡问题。是否有人熟悉scikit-learn或python中不平衡的解决方案?在Java中有SMOTE机制。python中有没有并行的东西? 最佳答案 这里有一个新的https://github.com/scikit-learn-contrib/imbalanced-learn它包含以下类别的许多算法,包括SMOTE对多数类进行欠采样。对少数类进行过采样。结合过采样和欠采样。创建整体平衡集。

python - 如何预测 scikit-learn 中的时间序列?

Scikit-learn使用了一种非常方便的方法,基于fit和predict方法。我有适合fit和predict格式的时间序列数据。例如我有以下Xs:[[1.0,2.3,4.5],[6.7,2.7,1.2],...,[3.2,4.7,1.1]]以及对应的ys:[[1.0],[2.3],...,[7.7]]这些数据具有以下含义。ys中存储的值形成一个时间序列。Xs中的值是对应的与时间相关的“因素”,已知它们对ys中的值有一定影响(例如:温度、湿度和大气压力)。现在,当然,我可以使用fit(Xs,ys)。但是后来我得到了一个模型,其中ys中的future值仅取决于因素,而不依赖于先前的Y值

python - 如何预测 scikit-learn 中的时间序列?

Scikit-learn使用了一种非常方便的方法,基于fit和predict方法。我有适合fit和predict格式的时间序列数据。例如我有以下Xs:[[1.0,2.3,4.5],[6.7,2.7,1.2],...,[3.2,4.7,1.1]]以及对应的ys:[[1.0],[2.3],...,[7.7]]这些数据具有以下含义。ys中存储的值形成一个时间序列。Xs中的值是对应的与时间相关的“因素”,已知它们对ys中的值有一定影响(例如:温度、湿度和大气压力)。现在,当然,我可以使用fit(Xs,ys)。但是后来我得到了一个模型,其中ys中的future值仅取决于因素,而不依赖于先前的Y值

python - get_dummies (Pandas) 和 OneHotEncoder (Scikit-learn) 之间的优缺点是什么?

我正在学习将分类变量转换为机器学习分类器的数值的不同方法。我遇到了pd.get_dummies方法和sklearn.preprocessing.OneHotEncoder(),我想看看它们在性能和使用方面有何不同。我在https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/上找到了关于如何使用OneHotEncoder()的教程因为sklearn文档对此功能没有太大帮助。我感觉我做得不对……但是能否解释一下使用p

python - get_dummies (Pandas) 和 OneHotEncoder (Scikit-learn) 之间的优缺点是什么?

我正在学习将分类变量转换为机器学习分类器的数值的不同方法。我遇到了pd.get_dummies方法和sklearn.preprocessing.OneHotEncoder(),我想看看它们在性能和使用方面有何不同。我在https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/上找到了关于如何使用OneHotEncoder()的教程因为sklearn文档对此功能没有太大帮助。我感觉我做得不对……但是能否解释一下使用p

Python scikit-learn : exporting trained classifier

我正在使用来自nolearn的DBN(深度信念网络)基于scikit-learn。我已经建立了一个可以很好地对我的数据进行分类的网络,现在我有兴趣导出模型以进行部署,但我不知道如何(每次我想预测某些东西时我都在训练DBN)。在matlab中,我只需导出权重矩阵并将其导入另一台机器。有人知道如何导出模型/要导入的权重矩阵而无需再次训练整个模型吗? 最佳答案 首先,安装joblib.你可以使用:>>>importjoblib>>>joblib.dump(clf,'my_model.pkl',compress=9)然后,在预测服务器上:>

Python scikit-learn : exporting trained classifier

我正在使用来自nolearn的DBN(深度信念网络)基于scikit-learn。我已经建立了一个可以很好地对我的数据进行分类的网络,现在我有兴趣导出模型以进行部署,但我不知道如何(每次我想预测某些东西时我都在训练DBN)。在matlab中,我只需导出权重矩阵并将其导入另一台机器。有人知道如何导出模型/要导入的权重矩阵而无需再次训练整个模型吗? 最佳答案 首先,安装joblib.你可以使用:>>>importjoblib>>>joblib.dump(clf,'my_model.pkl',compress=9)然后,在预测服务器上:>

python - 从 scikit-learn 中消除警告

这个问题在这里已经有了答案:HowtoignoredeprecationwarningsinPython(17个回答)关闭6年前。我想在教学时忽略所有包的警告,但scikit-learn似乎可以使用warnings包来控制它。例如:withwarnings.catch_warnings():warnings.simplefilter("ignore")fromsklearnimportpreprocessing/usr/local/lib/python3.5/site-packages/sklearn/utils/fixes.py:66:DeprecationWarning:inspe

python - 从 scikit-learn 中消除警告

这个问题在这里已经有了答案:HowtoignoredeprecationwarningsinPython(17个回答)关闭6年前。我想在教学时忽略所有包的警告,但scikit-learn似乎可以使用warnings包来控制它。例如:withwarnings.catch_warnings():warnings.simplefilter("ignore")fromsklearnimportpreprocessing/usr/local/lib/python3.5/site-packages/sklearn/utils/fixes.py:66:DeprecationWarning:inspe

python - scikit-learn .predict() 默认阈值

我正在处理不平衡类(5%1)的分类问题。我想预测类别,而不是概率。在一个二元分类问题中,scikit的classifier.predict()是否默认使用0.5?如果没有,默认方法是什么?如果是,我该如何更改?在scikit中,一些分类器具有class_weight='auto'选项,但并非所有分类器都有。使用class_weight='auto',.predict()是否会以实际人口比例作为阈值?在像MultinomialNB这样不支持class_weight的分类器中,有什么方法可以做到这一点?除了使用predict_proba()然后自己计算类。 最佳