草庐IT

Linear-regression

全部标签

python - Normal equation 和 Numpy 'least-squares' , 'solve' 回归方法的区别?

我正在使用多个变量/特征进行线性回归。我尝试通过使用正规方程方法(使用矩阵逆)、Numpy最小二乘法numpy.linalg.lstsq来获得thetas(系数)工具和np.linalg.solve工具。在我的数据中,我有n=143个特征和m=13000个训练示例。对于带有正则化的正规方程方法,我使用这个公式:Sources:Regularization(AndrewNg,Stanford)Normalequations(AndrewNg,Stanford)正则化用于解决矩阵不可逆的潜在问题(XtX矩阵可能变成奇异/不可逆)数据准备代码:importpandasaspdimportnu

python - Normal equation 和 Numpy 'least-squares' , 'solve' 回归方法的区别?

我正在使用多个变量/特征进行线性回归。我尝试通过使用正规方程方法(使用矩阵逆)、Numpy最小二乘法numpy.linalg.lstsq来获得thetas(系数)工具和np.linalg.solve工具。在我的数据中,我有n=143个特征和m=13000个训练示例。对于带有正则化的正规方程方法,我使用这个公式:Sources:Regularization(AndrewNg,Stanford)Normalequations(AndrewNg,Stanford)正则化用于解决矩阵不可逆的潜在问题(XtX矩阵可能变成奇异/不可逆)数据准备代码:importpandasaspdimportnu

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 使用 Sklearn 对 Pandas DataFrame 进行线性回归(IndexError : tuple index out of range)

我是Python新手,正在尝试在pandas数据帧上使用sklearn执行线性回归。这就是我所做的:data=pd.read_csv('xxxx.csv')之后我得到了一个包含两列的DataFrame,我们称它们为“c1”、“c2”。现在我想对(c1,c2)的集合进行线性回归,所以我输入了X=data['c1'].valuesY=data['c2'].valueslinear_model.LinearRegression().fit(X,Y)导致以下错误IndexError:tupleindexoutofrange这里有什么问题?还有,我想知道可视化结果根据结果进行预测?我搜索并浏览了

python - 如何在线性回归中强制零截距?

我有一些或多或少的线性数据形式:x=[0.1,0.2,0.4,0.6,0.8,1.0,2.0,4.0,6.0,8.0,10.0,20.0,40.0,60.0,80.0]y=[0.50505332505407008,1.1207373784533172,2.1981844719020001,3.1746209003398689,4.2905482471260044,6.2816226678076958,11.073788414382639,23.248479770546009,32.120462301367183,44.036117671229206,54.009003143831116

python - 如何在线性回归中强制零截距?

我有一些或多或少的线性数据形式:x=[0.1,0.2,0.4,0.6,0.8,1.0,2.0,4.0,6.0,8.0,10.0,20.0,40.0,60.0,80.0]y=[0.50505332505407008,1.1207373784533172,2.1981844719020001,3.1746209003398689,4.2905482471260044,6.2816226678076958,11.073788414382639,23.248479770546009,32.120462301367183,44.036117671229206,54.009003143831116

python - Pandas 滚动回归 : alternatives to looping

在已弃用的stats/ols模块中,我很好地利用了pandas的MovingOLS类(来源here)。不幸的是,它被pandas0.20彻底破坏了。在我看来,如何以有效方式运行滚动OLS回归的问题已被多次提出(例如here),但措辞有点宽泛,没有很好的答案。这是我的问题:如何最好地模仿pandas的MovingOLS的基本框架?这个类最吸引人的特性是能够将多个方法/属性视为单独的时间序列——即系数、r平方、t统计量等,而无需重新运行回归。例如,您可以创建类似model=pd.MovingOLS(y,x)的内容,然后调用.t_stat、.rmse、.std_err等。相反,在下面的示例中

python - Pandas 滚动回归 : alternatives to looping

在已弃用的stats/ols模块中,我很好地利用了pandas的MovingOLS类(来源here)。不幸的是,它被pandas0.20彻底破坏了。在我看来,如何以有效方式运行滚动OLS回归的问题已被多次提出(例如here),但措辞有点宽泛,没有很好的答案。这是我的问题:如何最好地模仿pandas的MovingOLS的基本框架?这个类最吸引人的特性是能够将多个方法/属性视为单独的时间序列——即系数、r平方、t统计量等,而无需重新运行回归。例如,您可以创建类似model=pd.MovingOLS(y,x)的内容,然后调用.t_stat、.rmse、.std_err等。相反,在下面的示例中

[paper reading]|LinK: Linear Kernel for LiDAR-based 3D Perception

摘要将2D大核的成功推广到3D感知具有挑战性,因为:1.处理3D数据的三次增加的开销;2.数据的稀缺性和稀缺性给优化带来了困难。以前的工作通过引入块共享权重,已经迈出了将内核大小从3×3×3尺度到7×7×7的第一步。但是,为了减少块内的特征变化,它只使用了适度的块大小,并没有获得像21×21×21这样更大的核。为了解决这一问题,我们提出了一种新的方法,称为LinK,以一种类似卷积的方式实现更大范围的感知接受域,有两个核心设计。第一种方法是用线性核生成器替代静态核矩阵,该生成器只自适应地为非空体素提供权值。第二种方法是在重叠块中重用预先计算的聚合结果,以降低计算复杂度。该方法成功地使每个体素在2

python - TensorFlow:变量初始化中的 "Attempting to use uninitialized value"

我正在尝试使用TensorFlow在Python中实现多元线性回归,但遇到了一些逻辑和实现问题。我的代码抛出以下错误:AttemptingtouseuninitializedvalueVariableCausedbyopu'Variable/read'理想情况下,weights输出应该是[2,3]defhypothesis_function(input_2d_matrix_trainingexamples,output_matrix_of_trainingexamples,initial_parameters_of_hypothesis_function,learning_rate,n