Linear-regression

python - 使用带有 statsmodels 的 OLS 模型预测值

我使用OLS(多元线性回归)计算了一个模型。我将我的数据划分为训练和测试(各一半)，然后我想预测第二部分标签的值。model=OLS(labels[:half],data[:half])predictions=model.predict(data[half:])问题是我得到了错误:文件“/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py”，第281行，预测返回np.dot(exog,参数)ValueErro

python - 增加线性回归的成本

出于训练目的，我在python中实现了线性回归。问题是成本在增加而不是减少。对于数据，我使用机翼自噪声数据集。资料可查here我按如下方式导入数据:importpandasaspddeffeatures():features=pd.read_csv("data/airfoil_self_noise/airfoil_self_noise.dat.txt",sep="\t",header=None)X=features.iloc[:,0:5]Y=features.iloc[:,5]returnX.values,Y.values.reshape(Y.shape[0],1)我的线性回归代码如下

python 增加 self 34 the machine-learning linear-regression

python - python中用于计算最小范数解或从伪逆获得的解的最准确方法是什么？

我的目标是解决：Kc=y对于伪逆（即最小范数解）：c=K^{+}y这样的模型（希望）是高次多项式模型。我特别感兴趣的是未确定的情况，在这种情况下，我们有比数据更多的多项式特征（很少有方程太多变量/未知量）f(x)=sum_ic_ix^i。注：columns=deg+1>N=rows是多项式特征的范德模式矩阵。我最初使用的是python函数np.linalg.pinv，但后来我注意到了一些奇怪的事情正在发生，正如我在这里注意到的那样：WhydodifferentmethodsforsolvingXc=yinpythongivedifferentsolutionwhentheyshould

python 中用 code polyfit pinv numpy precision linear-algebra linear-regression

python - python中用于计算最小范数解或从伪逆获得的解的最准确方法是什么？

我的目标是解决：Kc=y对于伪逆（即最小范数解）：c=K^{+}y这样的模型（希望）是高次多项式模型。我特别感兴趣的是未确定的情况，在这种情况下，我们有比数据更多的多项式特征（很少有方程太多变量/未知量）f(x)=sum_ic_ix^i。注：columns=deg+1>N=rows是多项式特征的范德模式矩阵。我最初使用的是python函数np.linalg.pinv，但后来我注意到了一些奇怪的事情正在发生，正如我在这里注意到的那样：WhydodifferentmethodsforsolvingXc=yinpythongivedifferentsolutionwhentheyshould

python 中用 code polyfit pinv numpy precision linear-algebra linear-regression

python - Python 中的高效协整检验

我想知道是否有比以下方法更好的方法来测试两个变量是否协整:importnumpyasnpimportstatsmodels.apiassmimportstatsmodels.tsa.stattoolsastsy=np.random.normal(0,1,250)x=np.random.normal(0,1,250)defcointegration_test(y,x):#Step1:regressonvariableontheotherols_result=sm.OLS(y,x).fit()#Step2:obtaintheresidual(ols_resuld.resid)#Step3:

python 39 section data pandas linear-regression

python - Python 中的高效协整检验

我想知道是否有比以下方法更好的方法来测试两个变量是否协整:importnumpyasnpimportstatsmodels.apiassmimportstatsmodels.tsa.stattoolsastsy=np.random.normal(0,1,250)x=np.random.normal(0,1,250)defcointegration_test(y,x):#Step1:regressonvariableontheotherols_result=sm.OLS(y,x).fit()#Step2:obtaintheresidual(ols_resuld.resid)#Step3:

python 39 section data pandas linear-regression

python - sklearn中的LinearRegression方法中，fit_intercept参数到底是干什么用的？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion在sklearn.linear_model.LinearRegression方法中，有一个参数是fit_intercept=TRUE或fit_intercept=FALSE。我想知道如果我们将它设置为TRUE，它是否会向您的数据集添加一个全1的附加截距列？如果我已经有一个包含一列1的数据集，fit_intercept=FALSE是否说明了这一点，还是强制它拟合零截距模型？更新:似乎人们没有理

LinearRegression fit_intercept section code python scikit-learn linear-regression

python - sklearn中的LinearRegression方法中，fit_intercept参数到底是干什么用的？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭2年前。Improvethisquestion在sklearn.linear_model.LinearRegression方法中，有一个参数是fit_intercept=TRUE或fit_intercept=FALSE。我想知道如果我们将它设置为TRUE，它是否会向您的数据集添加一个全1的附加截距列？如果我已经有一个包含一列1的数据集，fit_intercept=FALSE是否说明了这一点，还是强制它拟合零截距模型？更新:似乎人们没有理

LinearRegression fit_intercept section code python scikit-learn linear-regression

python - Python 中的约束线性回归

我有一个classiclinear形式的回归问题:y=Xb其中y是一个响应向量X是一个输入变量的矩阵，b是我要搜索的拟合参数向量。Python提供了b=numpy.linalg.lstsq(X,y)来解决这种形式的问题。但是，当我使用它时，我倾向于为b的组件获得极大或极小的值。我想执行相同的拟合，但将b的值限制在0到255之间。看起来scipy.optimize.fmin_slsqp()是一个选项，但我发现它对于我感兴趣的问题的规模来说非常慢(X是类似于3375x1500，希望更大)。是否有任何其他Python选项可用于执行受限最少的操作正方形适合吗？或者是否有用于执行LassoReg

python code scipy section numpy mathematical-optimization linear-regression

python - Python 中的约束线性回归

我有一个classiclinear形式的回归问题:y=Xb其中y是一个响应向量X是一个输入变量的矩阵，b是我要搜索的拟合参数向量。Python提供了b=numpy.linalg.lstsq(X,y)来解决这种形式的问题。但是，当我使用它时，我倾向于为b的组件获得极大或极小的值。我想执行相同的拟合，但将b的值限制在0到255之间。看起来scipy.optimize.fmin_slsqp()是一个选项，但我发现它对于我感兴趣的问题的规模来说非常慢(X是类似于3375x1500，希望更大)。是否有任何其他Python选项可用于执行受限最少的操作正方形适合吗？或者是否有用于执行LassoReg

python code scipy section numpy mathematical-optimization linear-regression