草庐IT

Logistic回归

全部标签

python - 如何计算 python 线性回归模型中斜率的 99% 置信区间?

我们有以下线性回归:y~b0+b1*x1+b2*x2。我知道Matlab中的回归函数会计算它,但numpy的linalg.lstsq不会(https://docs.scipy.org/doc/numpy-dev/user/numpy-for-matlab-users.html)。 最佳答案 StatsModels的RegressionResults有一个conf_int()方法。这里有一个使用它的例子(他们的OrdinaryLeastSquares例子的最小修改版本):importnumpyasnp,statsmodels.apia

python - 在 SciKit 线性回归上获取 'ValueError: shapes not aligned'

一般来说,SciKit和使用Python的线性代数/机器学习还很陌生,所以我似乎无法解决以下问题:我有一个训练集和一个测试集数据,包含连续和离散/分类值。CSV文件被加载到PandasDataFrame中并在形状上匹配,分别为(1460,81)和(1459,81)。但是,在使用Pandas'get_dummies之后,DataFrame的形状变为(1460,306)和(1459,294)。所以,当我用SciKitLinearRegression做线性回归时模块,它为306个变量构建了一个模型,并尝试用它预测一个只有294个变量的模型。这自然会导致以下错误:ValueError:shap

python - 时间序列 python(numpy 或 pandas)的线性回归

我是python和一般编程的新手,所以请原谅任何简单的错误/应该是显而易见的事情。我想做的很简单,我只想将线性趋势(一维多项式)拟合到一堆时间序列中,看看斜率是正的还是负的。现在我只是想让它在一个时间序列中工作。问题:似乎pandas和numpy都不能对日期时间进行回归。我的约会时间不规律(通常每月1天但不是同一天)所以不能使用LinearRegressionfromTimeSeriesPandas中提出的建议我的时间序列csv看起来像:StationName,year,month,day,depth,NO3-N,PO4-P,TotP,TotN,Kvarnbacken(Savaran)

python - Statsmodels 中是否实现了 LASSO 回归?

我很想在statsmodels中使用线性LASSO回归,以便能够使用“公式”符号来编写模型,这将在处理许多分类变量及其交互时节省我相当多的编码时间。但是,它似乎还没有在统计模型中实现? 最佳答案 Lasso确实在statsmodels中实现。文档在下面的url中给出:http://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.fit_regularized.html准确的说,statsmodel中的实现同时具有L1和L2正则化,它们

Python实现Stacking回归模型(随机森林回归、极端随机树回归、AdaBoost回归、GBDT回归、决策树回归)项目实战

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。1.项目背景Stacking通常考虑的是异质弱学习器(不同的学习算法被组合在一起),stacking学习用元模型组合基础模型。stacking的概念是学习几个不同的弱学习器,并通过训练一个元模型来组合它们,然后基于这些弱模型返回的多个预测结果输出最终的预测结果。本项目应用Stacking回归算法通过集成随机森林回归、极端随机森林回归、Adaboost回归、梯度提升树回归、决策树回归五个算法进行建模、预测及模型评估。2.数据获取本次建模数据来源于网络(本项目撰写人整理而成),数

python - 如何提高 Scikit python 中逻辑回归模型的准确性?

我正在尝试使用gre、gpa和ranks等预测变量来预测admit变量。但预测精度非常低(0.66)。下面给出了数据集。https://gist.github.com/abyalias/3de80ab7fb93dcecc565cee21bd9501a请在下面找到代码:In[73]:data.head(20)Out[73]:admitgregparank_2rank_3rank_4003803.610.01.00.0116603.670.01.00.0218004.000.00.00.0316403.190.00.01.0405202.930.00.01.0517603.001.00.0

python - 为什么 OLS 回归的 `sklearn` 和 `statsmodels` 实现给出不同的 R^2?

无意中我注意到,sklearn和statsmodels实现的OLS模型在不拟合截距时会产生不同的R^2值。否则他们似乎工作正常。以下代码产生:importnumpyasnpimportsklearnimportstatsmodelsimportsklearn.linear_modelasslimportstatsmodels.apiassmnp.random.seed(42)N=1000X=np.random.normal(loc=1,size=(N,1))Y=2*X.flatten()+4+np.random.normal(size=N)sklernIntercept=sl.Line

python - 多维高斯过程回归的训练超参数

这是一个代码的简单工作实现,我在Python的scikit-learn中使用高斯过程回归(GPR),具有二维输入(即x1和x2上的网格)和一维输出(y)。importnumpyasnpfrommatplotlibimportpyplotaspltfromsklearn.gaussian_processimportGaussianProcessRegressorfromsklearn.gaussian_process.kernelsimportRBF,ConstantKernelasCfrommpl_toolkits.mplot3dimportAxes3D#Exampleindepend

python - 线性回归——降低自由度

我有一个包含列的Pandas数据框OrderBalanceProfitcum(%)我在做线性回归model_profit_tr=pd.ols(y=df_closed['Profitcum(%)'],x=df_closed['Order'])问题是标准模型就像(不通过原点的直线方程)y=a*x+b有2个自由度(a和b)坡度(a):a=model_profit_tr.beta['x']和拦截(b):b=model_profit_tr.beta['intercept']我想减少模型的自由度(从2到1),我想要一个像这样的模型y=a*x 最佳答案

python - Seaborn:标注线性回归方程

我尝试为波士顿数据集拟合OLS。我的图表如下所示。如何在直线上方或图中某处标注线性回归方程?如何在Python中打印方程式?我是这个领域的新手。目前正在探索python。如果有人可以帮助我,那将加快我的学习曲线。非常感谢!我也试过了。我的问题是-如何以方程式格式在图中注释以上内容? 最佳答案 您可以使用线性拟合系数制作图例,如本例所示:importseabornassnsimportmatplotlib.pyplotaspltfromscipyimportstatstips=sns.load_dataset("tips")#getc