草庐IT

Rolling_Mean

全部标签

使用 rolling_apply 的 Python 自定义函数用于 pandas

我想使用pandas.rolling_apply函数在滚动窗口的基础上应用我自己的自定义函数。但是我的函数需要两个参数,并且还有两个输出。这可能吗?下面是一个最小的可重现示例...importpandasaspdimportnumpyasnpimportrandomtmp=pd.DataFrame(np.random.randn(2000,2)/10000,index=pd.date_range('2001-01-01',periods=2000),columns=['A','B'])defgm(df,p):v=(((df+1).cumprod())-1)*preturnv.iloc[

python - 为什么 "numpy.mean"返回 'inf' ?

我需要计算超过1000行的数组的列的平均值。np.mean(some_array)给我inf作为输出但我很确定这些值没问题。我正在从here加载一个csv在我的Data变量中,“cement”列在我看来是“健康的”。In[254]:np.mean(Data[:230]['Cement'])Out[254]:275.75但是如果我增加行数问题开始:In[259]:np.mean(Data[:237]['Cement'])Out[259]:inf但是当我查看数据时In[261]:Data[230:237]['Cement']Out[261]:array([[425.],[333.],[25

Python:如何将 .mean 的特定列添加到数据框

如何将b和c的方法添加到我的数据框中?我尝试了合并,但它似乎没有用。所以我想用df.groupBy('date').mean()的结果将两个额外的列b_mean和c_mean添加到我的数据框中数据框abcdate023511591123711我有以下代码importpandasaspda=[{'date':1,'a':2,'b':3,'c':5},{'date':1,'a':5,'b':9,'c':1},{'date':1,'a':3,'b':7,'c':1}]df=pd.DataFrame(a)x=df.groupby('date').mean()编辑:期望的输出如下df.group

python - Pandas 数据框条件 .mean() 取决于特定列中的值

我正在尝试创建一个新列,它返回同一df中现有列的值的平均值。但是,应根据其他三个列中的分组来计算平均值。Out[184]:YEARdaytypehourtypescenariooption_value02015SATof_h00.13449912015SUNof_h163.01925022015WDof_h252.11351632015WDpk_h343.12651342015SATof_h456.431392当“YEAR”、“daytype”和“hourtype”相似时,我基本上想要一个新列“mean”来计算“optionvalue”的平均值。我尝试了以下方法但没有成功......I

python - sklearn.metrics.mean_squared_error 是不是越大越好(取反)?

一般来说,mean_squared_error越小越好。当我使用sklearn指标包时,它在文档页面中显示:http://scikit-learn.org/stable/modules/model_evaluation.htmlAllscorerobjectsfollowtheconventionthathigherreturnvaluesarebetterthanlowerreturnvalues.Thusmetricswhichmeasurethedistancebetweenthemodelandthedata,likemetrics.mean_squared_error,are

python - 从 pandas.rolling_apply 返回两个值

我正在使用pandas.rolling_apply将数据拟合到分布并从中获取值,但我还需要它报告滚动拟合优度(特别是p值)。目前我是这样做的:deffunc(sample):fit=genextreme.fit(sample)returngenextreme.isf(0.9,*fit)defp_value(sample):fit=genextreme.fit(sample)returnkstest(sample,'genextreme',fit)[1]values=pd.rolling_apply(data,30,func)p_values=pd.rolling_apply(data,

python - pd.rolling_mean 已弃用 - ndarrays 的替代品

编辑:这个问题是在2016年提出的,并且在功能最终被删除多年后,类似的问题已经发布在SO上,例如module'pandas'hasnoattribute'rolling_mean'但是,问题涉及新的pd.rolling.mean()的性能,应该保持开放状态直到相关的pandasissue是固定的。看起来pd.rolling_mean正在被ndarrays弃用,pd.rolling_mean(x,window=2,center=False)FutureWarning:pd.rolling_meanisdeprecatedforndarraysandwillberemovedinafutu

python - pd.rolling_mean 已弃用 - ndarrays 的替代品

编辑:这个问题是在2016年提出的,并且在功能最终被删除多年后,类似的问题已经发布在SO上,例如module'pandas'hasnoattribute'rolling_mean'但是,问题涉及新的pd.rolling.mean()的性能,应该保持开放状态直到相关的pandasissue是固定的。看起来pd.rolling_mean正在被ndarrays弃用,pd.rolling_mean(x,window=2,center=False)FutureWarning:pd.rolling_meanisdeprecatedforndarraysandwillberemovedinafutu

python - 为什么pandas rolling使用单维ndarray

我的动机是使用pandasrolling功能来执行滚动多因素回归(这个问题不是关于滚动多因素回归)。我希望我能够在df.rolling(2)之后使用apply并使用生成的pd.DataFrame提取ndarray使用.values并执行必要的矩阵乘法。结果并非如此。这是我发现的:importpandasaspdimportnumpyasnpnp.random.seed([3,1415])df=pd.DataFrame(np.random.rand(5,2).round(2),columns=['A','B'])X=np.random.rand(2,1).round(2)物体是什么样子的

python - 为什么pandas rolling使用单维ndarray

我的动机是使用pandasrolling功能来执行滚动多因素回归(这个问题不是关于滚动多因素回归)。我希望我能够在df.rolling(2)之后使用apply并使用生成的pd.DataFrame提取ndarray使用.values并执行必要的矩阵乘法。结果并非如此。这是我发现的:importpandasaspdimportnumpyasnpnp.random.seed([3,1415])df=pd.DataFrame(np.random.rand(5,2).round(2),columns=['A','B'])X=np.random.rand(2,1).round(2)物体是什么样子的