草庐IT

Time-series

全部标签

python - pandas.Series.unique() 是否保留顺序?

我还没有找到答案的简单问题:给定一个pandas系列,我认为Series.unique()给出的值的顺序是它们在系列中首次遇到的顺序,不是任何排序排序。IE。frompandasimportSeriess=Series(['b','b','b','a','a','b'])s.unique()>>>array(['b','a'],dtype=object)这是我希望我的应用程序的行为,但是有人可以告诉我是否可以保证获得此订单吗?文档不清楚。 最佳答案 是的,这通常是正确的。pandas对象有有序的索引,行不会重新排列,直到你告诉他们这

python - 无法使用 Series 内置函数在时间戳上应用方法

关于以下系列:01411161507178114111384360092141112373218031411167606146414111247801405141115933132761411131745474714111518314548141115248775891411137160544Name:my_series,dtype:int64此命令(转换为时间戳、本地化并转换为EST)有效:pd.to_datetime(my_series,unit='ms').apply(lambdax:x.tz_localize('UTC').tz_convert('US/Eastern'))但是

python - 无法使用 Series 内置函数在时间戳上应用方法

关于以下系列:01411161507178114111384360092141112373218031411167606146414111247801405141115933132761411131745474714111518314548141115248775891411137160544Name:my_series,dtype:int64此命令(转换为时间戳、本地化并转换为EST)有效:pd.to_datetime(my_series,unit='ms').apply(lambdax:x.tz_localize('UTC').tz_convert('US/Eastern'))但是

Python 时间增量 : can't I just get in whatever time unit I want the value of the entire difference?

自从在我的网站上发布了一篇文章后,我正在尝试设置一些巧妙的日期(“秒后、小时后、周后等。”)并且我正在使用datetime.timedeltautcnow和utcdated之间的差异存储在数据库中以供发布。看起来,根据文档,我必须使用days属性和seconds属性来获得我想要的精美日期字符串。我不能在任何我想要的时间单位内获取整个差值的值吗?我错过了什么吗?如果我能在几秒钟内得到全部差异,那就太完美了。 最佳答案 看来Python2.7引入了一个total_seconds()方法,这正是您要找的,我相信!

Python 时间增量 : can't I just get in whatever time unit I want the value of the entire difference?

自从在我的网站上发布了一篇文章后,我正在尝试设置一些巧妙的日期(“秒后、小时后、周后等。”)并且我正在使用datetime.timedeltautcnow和utcdated之间的差异存储在数据库中以供发布。看起来,根据文档,我必须使用days属性和seconds属性来获得我想要的精美日期字符串。我不能在任何我想要的时间单位内获取整个差值的值吗?我错过了什么吗?如果我能在几秒钟内得到全部差异,那就太完美了。 最佳答案 看来Python2.7引入了一个total_seconds()方法,这正是您要找的,我相信!

python - 为什么调用 time.sleep 或 subprocess.Popen 后 Python 操作会慢 30 倍?

考虑以下循环:foriinrange(20):ifi==10:subprocess.Popen(["echo"])#command1t_start=time.time()1+1#command2t_stop=time.time()print(t_stop-t_start)当“命令1”在它之前运行时,“命令2”命令系统地运行时间更长。下图显示了1+1的执行时间作为循环索引i的函数,平均超过100次运行。1+1的执行速度比subprocess.Popen慢30倍。它变得更奇怪了。有人可能认为只有subprocess.Popen()之后运行的第一个命令受到影响,但事实并非如此。以下循环显示当

python - 为什么调用 time.sleep 或 subprocess.Popen 后 Python 操作会慢 30 倍?

考虑以下循环:foriinrange(20):ifi==10:subprocess.Popen(["echo"])#command1t_start=time.time()1+1#command2t_stop=time.time()print(t_stop-t_start)当“命令1”在它之前运行时,“命令2”命令系统地运行时间更长。下图显示了1+1的执行时间作为循环索引i的函数,平均超过100次运行。1+1的执行速度比subprocess.Popen慢30倍。它变得更奇怪了。有人可能认为只有subprocess.Popen()之后运行的第一个命令受到影响,但事实并非如此。以下循环显示当

python - 将不规则的时间戳测量值转换为等间隔的时间加权平均值

我有一系列带有时间戳且间隔不规则的测量值。这些系列中的值始终代表测量的变化——即没有变化就没有新值。此类系列的一个简单示例是:23:00:00.1001023:00:01.200823:00:01.600023:00:06.3004我想要达到的是一系列等间隔的时间加权平均值。对于给定的示例,我可能会以基于秒的频率为目标,因此结果如下所示:23:00:01NaN(thefirst100msaremissing)23:00:025.2(10*0.2+8*0.4+0*0.4)23:00:03023:00:04023:00:05023:00:062.8(0*0.3+4*0.7)我正在寻找解决该

python - 将不规则的时间戳测量值转换为等间隔的时间加权平均值

我有一系列带有时间戳且间隔不规则的测量值。这些系列中的值始终代表测量的变化——即没有变化就没有新值。此类系列的一个简单示例是:23:00:00.1001023:00:01.200823:00:01.600023:00:06.3004我想要达到的是一系列等间隔的时间加权平均值。对于给定的示例,我可能会以基于秒的频率为目标,因此结果如下所示:23:00:01NaN(thefirst100msaremissing)23:00:025.2(10*0.2+8*0.4+0*0.4)23:00:03023:00:04023:00:05023:00:062.8(0*0.3+4*0.7)我正在寻找解决该

Python pandas 时间序列插值和正则化

我是第一次使用PythonPandas。我有5分钟的csv格式滞后流量数据:...2015-01-0408:29:05,2712382015-01-0408:34:05,3292852015-01-0408:39:05,-12015-01-0408:44:05,2602602015-01-0408:49:05,263711...有几个问题:对于某些时间戳,缺少数据(-1)缺少条目(也是连续2/3小时)观察的频率不是正好5分钟,但实际上偶尔会损失几秒我想获得一个规则的时间序列,因此每(恰好)5分钟输入一次(并且没有遗漏值)。我已经成功地使用以下代码对时间序列进行了插值,以使用此代码近似于