$回归

python - 如何提高 Scikit python 中逻辑回归模型的准确性？

我正在尝试使用gre、gpa和ranks等预测变量来预测admit变量。但预测精度非常低(0.66)。下面给出了数据集。https://gist.github.com/abyalias/3de80ab7fb93dcecc565cee21bd9501a请在下面找到代码:In[73]:data.head(20)Out[73]:admitgregparank_2rank_3rank_4003803.610.01.00.0116603.670.01.00.0218004.000.00.00.0316403.190.00.01.0405202.930.00.01.0517603.001.00.0

python - 为什么 OLS 回归的 `sklearn` 和 `statsmodels` 实现给出不同的 R^2？

无意中我注意到，sklearn和statsmodels实现的OLS模型在不拟合截距时会产生不同的R^2值。否则他们似乎工作正常。以下代码产生:importnumpyasnpimportsklearnimportstatsmodelsimportsklearn.linear_modelasslimportstatsmodels.apiassmnp.random.seed(42)N=1000X=np.random.normal(loc=1,size=(N,1))Y=2*X.flatten()+4+np.random.normal(size=N)sklernIntercept=sl.Line

statsmodels sklearn code blockquote python python-3.x scikit-learn linear-regression

python - 多维高斯过程回归的训练超参数

这是一个代码的简单工作实现，我在Python的scikit-learn中使用高斯过程回归(GPR)，具有二维输入(即x1和x2上的网格)和一维输出(y)。importnumpyasnpfrommatplotlibimportpyplotaspltfromsklearn.gaussian_processimportGaussianProcessRegressorfromsklearn.gaussian_process.kernelsimportRBF,ConstantKernelasCfrommpl_toolkits.mplot3dimportAxes3D#Exampleindepend

多维训练 code section import python scikit-learn

python - 线性回归——降低自由度

我有一个包含列的Pandas数据框OrderBalanceProfitcum(%)我在做线性回归model_profit_tr=pd.ols(y=df_closed['Profitcum(%)'],x=df_closed['Order'])问题是标准模型就像(不通过原点的直线方程)y=a*x+b有2个自由度(a和b)坡度(a):a=model_profit_tr.beta['x']和拦截(b):b=model_profit_tr.beta['intercept']我想减少模型的自由度(从2到1)，我想要一个像这样的模型y=a*x 最佳答案

mdash python code pre section numpy statistics pandas curve-fitting

python - Seaborn:标注线性回归方程

我尝试为波士顿数据集拟合OLS。我的图表如下所示。如何在直线上方或图中某处标注线性回归方程？如何在Python中打印方程式？我是这个领域的新手。目前正在探索python。如果有人可以帮助我，那将加快我的学习曲线。非常感谢!我也试过了。我的问题是-如何以方程式格式在图中注释以上内容？最佳答案您可以使用线性拟合系数制作图例，如本例所示:importseabornassnsimportmatplotlib.pyplotaspltfromscipyimportstatstips=sns.load_dataset("tips")#getc

Seaborn python section image noreferrer python-3.x matplotlib linear-regression

Python pandas 线性回归 groupby

我正在尝试通过pandaspython数据框对一组进行线性回归:这是数据框df:groupdatevalueA01-02-201616A01-03-201615A01-04-201614A01-05-201617A01-06-201619A01-07-201620B01-02-201616B01-03-201613B01-04-201613C01-02-201616C01-03-201616#importstandardpackagesimportpandasaspdimportnumpyasnp#importMLpackagesfromsklearn.linear_modelimpo

groupby Python code group date pandas dataframe group-by linear-regression

python - 如何在 Python scikit-learn 中输出随机森林中每棵树的回归预测？

除了组合预测之外，是否还有一种方法可以从随机森林中的每棵树中获取预测？我想输出列表中的所有预测，而不是查看整棵树。我知道我可以使用apply方法获取叶索引，但我不确定如何使用它从叶中获取值。编辑:这是我到目前为止从下面的评论中得到的内容。之前我不清楚可以调用estimators_属性中的树，但似乎可以在使用该属性的每棵树上使用predict方法。不过，这是最好的方法吗？numberTrees=100clf=RandomForestRegressor(n_estimators=numberTrees)clf.fit(X,Y)fortreeinrange(numberTrees):prin

何在 scikit-learn section code predict python random-forest

python - R、statmodels、sklearn 与逻辑回归分类任务的比较

我在R、pythonstatmodels和sklearn中做了一些逻辑回归实验。虽然R和statmodels给出的结果一致，但与sklearn返回的结果存在一些差异。我想了解为什么这些结果不同。我理解这可能不是木头下使用的相同优化算法。具体来说，我使用标准的Default数据集(在ISLbook中使用)。以下Python代码将数据读入数据框Default。importpandasaspd#dataisavailablehereDefault=pd.read_csv('https://d1pqsl2386xqi9.cloudfront.net/notebooks/Default.csv'

statmodels sklearn 39 Default code python r scikit-learn logistic-regression

python - 查找回归平面并将其绘制到一组点

我想为一些数据点拟合一个平面并绘制它。我当前的代码是这样的:importnumpyasnpfrommpl_toolkits.mplot3dimportAxes3Dimportmatplotlib.pyplotaspltpoints=[(1.1,2.1,8.1),(3.2,4.2,8.0),(5.3,1.3,8.2),(3.4,2.4,8.3),(1.5,4.5,8.0)]xs,ys,zs=zip(*points)fig=plt.figure()ax=fig.add_subplot(111,projection='3d')ax.scatter(xs,ys,zs)point=np.arra

并将 python normal section import numpy matplotlib scipy regression

python - 我可以使用带有 pandas 数据框的散点图绘制回归线并显示参数吗？

我想使用以下代码从Pandas数据帧生成散点图:df.plot.scatter(x='one',y='two,title='Scatterplot')是否有我可以随语句发送的参数，以便它绘制回归线并显示拟合参数？类似于:df.plot.scatter(x='one',y='two',title='Scatterplot',Regression_line) 最佳答案我认为DataFrame.plot()没有这样的参数。但是，您可以使用Seaborn轻松实现此目的.只需将Pandas数据框传递给lmplot(假设你已经安装了seabo

python pandas section seaborn 39 regression scatter-plot

54 55 565758 59 60