草庐IT

多元回归

全部标签

python - Scikit Learn中的多变量/多元线性回归?

我在.csv文件中有一个数据集(dataTrain.csv和dataTest.csv),格式如下:Temperature(K),Pressure(ATM),CompressibilityFactor(Z)273.1,24.675,0.806677258313.1,24.675,0.888394713...,...,...并且能够使用此代码构建回归模型和预测:importpandasaspdfromsklearnimportlinear_modeldataTrain=pd.read_csv("dataTrain.csv")dataTest=pd.read_csv("dataTest.cs

python - Normal equation 和 Numpy 'least-squares' , 'solve' 回归方法的区别?

我正在使用多个变量/特征进行线性回归。我尝试通过使用正规方程方法(使用矩阵逆)、Numpy最小二乘法numpy.linalg.lstsq来获得thetas(系数)工具和np.linalg.solve工具。在我的数据中,我有n=143个特征和m=13000个训练示例。对于带有正则化的正规方程方法,我使用这个公式:Sources:Regularization(AndrewNg,Stanford)Normalequations(AndrewNg,Stanford)正则化用于解决矩阵不可逆的潜在问题(XtX矩阵可能变成奇异/不可逆)数据准备代码:importpandasaspdimportnu

python - Normal equation 和 Numpy 'least-squares' , 'solve' 回归方法的区别?

我正在使用多个变量/特征进行线性回归。我尝试通过使用正规方程方法(使用矩阵逆)、Numpy最小二乘法numpy.linalg.lstsq来获得thetas(系数)工具和np.linalg.solve工具。在我的数据中,我有n=143个特征和m=13000个训练示例。对于带有正则化的正规方程方法,我使用这个公式:Sources:Regularization(AndrewNg,Stanford)Normalequations(AndrewNg,Stanford)正则化用于解决矩阵不可逆的潜在问题(XtX矩阵可能变成奇异/不可逆)数据准备代码:importpandasaspdimportnu

python - 任何 Python 库都会生成发布风格回归表

我一直在使用Python进行回归分析。得到回归结果后,我需要将所有结果汇总到一个表中,并将它们转换为LaTex(用于发布)。是否有任何包可以在Python中执行此操作?像estout在Stata中给出了下表: 最佳答案 嗯,statsmodels中有summary_col;它没有estout的所有花里胡哨,但它确实具有您正在寻找的基本功能(包括导出到LaTeX):importstatsmodels.apiassmfromstatsmodels.iolib.summary2importsummary_colp['const']=1re

python - 任何 Python 库都会生成发布风格回归表

我一直在使用Python进行回归分析。得到回归结果后,我需要将所有结果汇总到一个表中,并将它们转换为LaTex(用于发布)。是否有任何包可以在Python中执行此操作?像estout在Stata中给出了下表: 最佳答案 嗯,statsmodels中有summary_col;它没有estout的所有花里胡哨,但它确实具有您正在寻找的基本功能(包括导出到LaTeX):importstatsmodels.apiassmfromstatsmodels.iolib.summary2importsummary_colp['const']=1re

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 如何在线性回归中强制零截距?

我有一些或多或少的线性数据形式:x=[0.1,0.2,0.4,0.6,0.8,1.0,2.0,4.0,6.0,8.0,10.0,20.0,40.0,60.0,80.0]y=[0.50505332505407008,1.1207373784533172,2.1981844719020001,3.1746209003398689,4.2905482471260044,6.2816226678076958,11.073788414382639,23.248479770546009,32.120462301367183,44.036117671229206,54.009003143831116

python - 如何在线性回归中强制零截距?

我有一些或多或少的线性数据形式:x=[0.1,0.2,0.4,0.6,0.8,1.0,2.0,4.0,6.0,8.0,10.0,20.0,40.0,60.0,80.0]y=[0.50505332505407008,1.1207373784533172,2.1981844719020001,3.1746209003398689,4.2905482471260044,6.2816226678076958,11.073788414382639,23.248479770546009,32.120462301367183,44.036117671229206,54.009003143831116

python - 使用 numpy 进行多元多项式回归

我有很多样本(y_i,(a_i,b_i,c_i))其中y被假定为在a,b,c中作为多项式变化达到一定程度。例如,对于给定的一组数据和2级,我可能会生成模型y=a^2+2ab-3cb+c^2+.5ac这可以使用最小二乘来完成,并且是numpy的polyfit例程的轻微扩展。Python生态系统中是否有标准实现? 最佳答案 sklearn提供了一种简单的方法来做到这一点。以发布的示例为基础here:#Xistheindependentvariable(bivariateinthiscase)X=array([[0.44,0.68],[0