草庐IT

Linear-regression

全部标签

python - 使用带有 statsmodels 的 OLS 模型预测值

我使用OLS(多元线性回归)计算了一个模型。我将我的数据划分为训练和测试(各一半),然后我想预测第二部分标签的值。model=OLS(labels[:half],data[:half])predictions=model.predict(data[half:])问题是我得到了错误:文件“/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py”,第281行,预测返回np.dot(exog,参数)ValueErro

python - 增加线性回归的成本

出于训练目的,我在python中实现了线性回归。问题是成本在增加而不是减少。对于数据,我使用机翼自噪声数据集。资料可查here我按如下方式导入数据:importpandasaspddeffeatures():features=pd.read_csv("data/airfoil_self_noise/airfoil_self_noise.dat.txt",sep="\t",header=None)X=features.iloc[:,0:5]Y=features.iloc[:,5]returnX.values,Y.values.reshape(Y.shape[0],1)我的线性回归代码如下

python - python中用于计算最小范数解或从伪逆获得的解的最准确方法是什么?

我的目标是解决:Kc=y对于伪逆(即最小范数解):c=K^{+}y这样的模型(希望)是高次多项式模型。我特别感兴趣的是未确定的情况,在这种情况下,我们有比数据更多的多项式特征(很少有方程太多变量/未知量)f(x)=sum_ic_ix^i。注:columns=deg+1>N=rows是多项式特征的范德模式矩阵。我最初使用的是python函数np.linalg.pinv,但后来我注意到了一些奇怪的事情正在发生,正如我在这里注意到的那样:WhydodifferentmethodsforsolvingXc=yinpythongivedifferentsolutionwhentheyshould

python - python中用于计算最小范数解或从伪逆获得的解的最准确方法是什么?

我的目标是解决:Kc=y对于伪逆(即最小范数解):c=K^{+}y这样的模型(希望)是高次多项式模型。我特别感兴趣的是未确定的情况,在这种情况下,我们有比数据更多的多项式特征(很少有方程太多变量/未知量)f(x)=sum_ic_ix^i。注:columns=deg+1>N=rows是多项式特征的范德模式矩阵。我最初使用的是python函数np.linalg.pinv,但后来我注意到了一些奇怪的事情正在发生,正如我在这里注意到的那样:WhydodifferentmethodsforsolvingXc=yinpythongivedifferentsolutionwhentheyshould

python - Python 中的高效协整检验

我想知道是否有比以下方法更好的方法来测试两个变量是否协整:importnumpyasnpimportstatsmodels.apiassmimportstatsmodels.tsa.stattoolsastsy=np.random.normal(0,1,250)x=np.random.normal(0,1,250)defcointegration_test(y,x):#Step1:regressonvariableontheotherols_result=sm.OLS(y,x).fit()#Step2:obtaintheresidual(ols_resuld.resid)#Step3:

python - Python 中的高效协整检验

我想知道是否有比以下方法更好的方法来测试两个变量是否协整:importnumpyasnpimportstatsmodels.apiassmimportstatsmodels.tsa.stattoolsastsy=np.random.normal(0,1,250)x=np.random.normal(0,1,250)defcointegration_test(y,x):#Step1:regressonvariableontheotherols_result=sm.OLS(y,x).fit()#Step2:obtaintheresidual(ols_resuld.resid)#Step3:

python - sklearn中的LinearRegression方法中,fit_intercept参数到底是干什么用的?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion在sklearn.linear_model.LinearRegression方法中,有一个参数是fit_intercept=TRUE或fit_intercept=FALSE。我想知道如果我们将它设置为TRUE,它是否会向您的数据集添加一个全1的附加截距列?如果我已经有一个包含一列1的数据集,fit_intercept=FALSE是否说明了这一点,还是强制它拟合零截距模型?更新:似乎人们没有理

python - sklearn中的LinearRegression方法中,fit_intercept参数到底是干什么用的?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion在sklearn.linear_model.LinearRegression方法中,有一个参数是fit_intercept=TRUE或fit_intercept=FALSE。我想知道如果我们将它设置为TRUE,它是否会向您的数据集添加一个全1的附加截距列?如果我已经有一个包含一列1的数据集,fit_intercept=FALSE是否说明了这一点,还是强制它拟合零截距模型?更新:似乎人们没有理

python - Python 中的约束线性回归

我有一个classiclinear形式的回归问题:y=Xb其中y是一个响应向量X是一个输入变量的矩阵,b是我要搜索的拟合参数向量。Python提供了b=numpy.linalg.lstsq(X,y)来解决这种形式的问题。但是,当我使用它时,我倾向于为b的组件获得极大或极小的值。我想执行相同的拟合,但将b的值限制在0到255之间。看起来scipy.optimize.fmin_slsqp()是一个选项,但我发现它对于我感兴趣的问题的规模来说非常慢(X是类似于3375x1500,希望更大)。是否有任何其他Python选项可用于执行受限最少的操作正方形适合吗?或者是否有用于执行LassoReg

python - Python 中的约束线性回归

我有一个classiclinear形式的回归问题:y=Xb其中y是一个响应向量X是一个输入变量的矩阵,b是我要搜索的拟合参数向量。Python提供了b=numpy.linalg.lstsq(X,y)来解决这种形式的问题。但是,当我使用它时,我倾向于为b的组件获得极大或极小的值。我想执行相同的拟合,但将b的值限制在0到255之间。看起来scipy.optimize.fmin_slsqp()是一个选项,但我发现它对于我感兴趣的问题的规模来说非常慢(X是类似于3375x1500,希望更大)。是否有任何其他Python选项可用于执行受限最少的操作正方形适合吗?或者是否有用于执行LassoReg