我正在尝试使用Patsy(使用sklearn、pandas)创建一个简单的回归模型。R风格的公式创建是一大亮点。我的数据包含一个名为“ship_city”的字段,它可以包含来自印度的任何城市。由于我将数据划分为训练集和测试集,因此有几个城市仅出现在其中一个集中。代码片段如下:df_train_Y,df_train_X=dmatrices(formula,data=df_train,return_type='dataframe')df_train_Y_design_info,df_train_X_design_info=df_train_Y.design_info,df_train_X.
假设我有一个数据框(我们称它为DF),其中y是因变量,x1,x2,x3是我的独立变量变量。在R中,我可以使用以下代码拟合线性模型,.将在模型中包含我的所有自变量:#Rcodeforfittinglinearmodelresult=lm(y~.,data=DF)如果不明确地将我所有的自变量添加到公式中,我无法弄清楚如何使用patsy公式对statsmodels执行此操作。patsy是否具有与R的.等效的功能?我没有运气在patsy文档中找到它。 最佳答案 我也没有在patsy文档中找到等效的.。但它缺乏简洁性,它可以通过在Python
我正在开发一个“预测模型即服务”的应用程序,其结构如下:离线训练模型定期将模型参数上传到“预测服务器”预测服务器将单个观察值作为输入,并输出预测结果我正在尝试使用patsy,但遇到以下问题:当单个预测进入时,如何将其转换为正确的形状,使其看起来像一行训练数据?patsy文档提供了当训练数据中的DesignInfo在内存中可用时的示例:http://patsy.readthedocs.io/en/latest/library-developers.html#predictions#offlinemodeltrainingimportpatsydata={'animal':['cat','
我正在开发一个“预测模型即服务”的应用程序,其结构如下:离线训练模型定期将模型参数上传到“预测服务器”预测服务器将单个观察值作为输入,并输出预测结果我正在尝试使用patsy,但遇到以下问题:当单个预测进入时,如何将其转换为正确的形状,使其看起来像一行训练数据?patsy文档提供了当训练数据中的DesignInfo在内存中可用时的示例:http://patsy.readthedocs.io/en/latest/library-developers.html#predictions#offlinemodeltrainingimportpatsydata={'animal':['cat','