Time-series

python - Pandas Filter 函数返回了一个 Series，但需要一个标量 bool

我试图在pandas数据框上使用过滤器来过滤掉所有匹配重复值的行(当存在重复时需要删除所有行，而不仅仅是第一行或最后一行)。这就是我在编辑器中的工作方式:df=df.groupby("student_id").filter(lambdax:x.count()==1)但是当我用这段代码运行我的脚本时，我得到了错误:TypeError:filterfunctionreturnedaSeries,butexpectedascalarbool在尝试应用过滤器之前，我通过连接另外两个帧来创建数据帧。最佳答案应该是:In[32]:group

python - 在包含字符串列表的 Series 上使用 Pandas 字符串方法 'contains'

给定一个简单的PandasSeries，其中包含一些可以由多个句子组成的字符串:In:importpandasaspds=pd.Series(['Thisisalongtext.Ithasmultiplesentences.','Doyousee?Morethanonesentence!','Thisonehasonlyonesentencethough.'])Out:0Thisisalongtext.Ithasmultiplesentences.1Doyousee?Morethanonesentence!2Thisonehasonlyonesentencethough.dtype:o

amp contains code section pre python regex string pandas

python - 没有日期时间索引的 pandas dataframe 每天重新采样

我在以下形式的pandas中有一个数据框:timestampslight72004-02-2800:58:45150.88262004-02-2800:59:45143.52342004-02-2801:00:45150.88422004-02-2801:01:15150.88592004-02-2801:02:15150.88这里注意索引不是timestamps列。但我想重新采样(或以某种方式对数据进行分类)以反射(reflect)每分钟、每小时、每天等光柱的平均值。我研究了pandas提供的resample方法，它需要数据帧具有该方法工作的数据时间索引(除非我误解了这一点)。所以我

dataframe python section code 2004 pandas time-series

python - 为什么 Time.utc 在 OS X 上的 Ruby 中的 fork 进程中变慢(而不是在 Python 中)？

我看到了问题WhydoesProcess.forkmakestuffslowerinRubyonOSX?并且能够确定Process.fork确实不会通常使任务变慢。但是，它似乎确实使Time.utc尤其慢得多。require'benchmark'defdo_stuff50000.times{Time.utc(2016)}endputs"main:#{Benchmark.measure{do_stuff}}"Process.forkdoputs"fork:#{Benchmark.measure{do_stuff}}"end下面是一些结果:main:0.1000000.0000000.10

python code fork 0.100000 ruby performance

python - 来自趋势 python 的时间序列拟合值

我在名为price_data的数据框中有来自yahoofinance的每日股票价格数据。我想为此添加一列，它提供AdjClose列的时间序列趋势的拟合值。这是我使用的数据结构:In[41]:type(price_data)Out[41]:pandas.core.frame.DataFrameIn[42]:list(price_data.columns.values)Out[42]:['Open','High','Low','Close','Volume','AdjClose']In[45]:type(price_data.index)Out[45]:pandas.tseries.ind

python 来自 39 code section pandas time-series statsmodels trend

python - 如何在 x 轴上绘制带有日期时间的线性回归

我的DataFrame对象看起来像amountdate2014-01-0612014-01-0712014-01-0842014-01-0912014-01-141我想要一种散点图，x轴为时间，y轴为数量，数据中有一条线来引导观察者的视线。如果我使用pandasplotdf.plot(style="o")它不太正确，因为那条线不在那里。我想要类似示例的东西here. 最佳答案注意:这与IanThompson的回答有很多共同之处，但方法不同，足以将其作为一个单独的答案。我使用问题中提供的DataFrame格式并避免更改索引。Seab

何在 python section date code pandas matplotlib time-series linear-regression

python - Pandas 系列的多月平均值

我有一系列datetime对象和一系列跨越数年的数据。A可以创建一个Series对象并对其重新采样以按月对其进行分组:df=pd.Series(varv,index=dates)multiMmean=df.resample("M",how='mean')printmultiMmean然而，这会输出2005-10-31172.42005-11-3069.32005-12-31187.62006-01-31126.42006-02-28187.02006-03-31108.3...2014-01-3194.62014-02-2882.32014-03-31130.12014-04-3059

python Pandas code section 2014 time-series

Python statsmodels ARIMA 预测

我正在尝试使用pythonstatsmodels进行样本外预测。我不想只预测训练集末尾的下一个x个值，但我想一次预测一个值并在预测时考虑实际值。换句话说，我想做滚动1期预测，但我不想每次都重新校准模型。我能找到的最接近的帖子在这里:ARMAout-of-samplepredictionwithstatsmodels但是，这使用的是ARMA而不是ARIMA。我怎样才能用ARIMA实现这个或者有更好的方法吗？我知道我实际上可以提取系数并自己应用一个函数，但在我的代码中，我使用的ARIMA模型随着时间的推移是动态的，因此使用的系数和滞后值的数量不是恒定的。任何帮助将不胜感激。

statsmodels Python section original_series time-series forecasting

python - 如何使用fbProphet或其他模型在Python中执行包含多个组的时间序列分析？

全部，我的数据集如下所示。我正在尝试使用fbProphet或其他模型预测future6个月的“金额”。但我的问题是我想根据每个组预测数量，即接下来6个月的A、B、C、D。我不确定如何使用fbProphet或其他模型在python中做到这一点？我引用了officialpageoffbprophet，但我发现的唯一信息是“先知”只有两列，一个是“日期”，另一个是“金额”。我是python的新手，所以非常感谢任何有关代码解释的帮助!importpandasaspddata={'Date':['2017-01-01','2017-02-01','2017-03-01','2017-04-01'

fbProphet python 39 code 2017 pandas time-series facebook-prophet

python - 将 Python 序列(时间序列/数组)拆分为重叠的子序列

我需要提取给定窗口的时间序列/数组的所有子序列。例如:>>>ts=pd.Series([0,1,2,3,4,5,6,7,8,9])>>>window=3>>>subsequences(ts,window)array([[0,1,2],[1,2,3],[2,3,4],[3,4,5],[4,5,6],[5,6,7],[5,7,8],[6,8,9]])遍历序列的朴素方法当然是昂贵的，例如:defsubsequences(ts,window):res=[]foriinrange(ts.size-window+1):subts=ts[i:i+window]subts.reset_index(dr

为重 python code window strides performance numpy pandas time-series

78 79 808182 83 84