草庐IT

Time-series

全部标签

python - 将日期转换为 float 以对 Pandas 数据框进行线性回归

似乎要使OLS线性回归在Pandas中运行良好,参数必须是float。我从以下形式的csv(称为“gameAct.csv”)开始:date,city,players,sales2014-04-28,London,111,1091.282014-04-29,London,100,1100.442014-04-28,Paris,87,1001.33...我想对销售额如何依赖于日期执行线性回归(随着时间的推移,销售额如何变化?)。我下面的代码的问题似乎是日期不是浮点值。如果能帮助我解决Pandas中的这个索引问题,我将不胜感激。我当前的(非工作,但编译代码):importpandasaspd

python - 向 MultiIndex DataFrame/Series 添加一行

我想知道是否有一种等效的方法可以将行添加到带有MultiIndex的Series或DataFrame中,就像使用单个索引一样,即使用.ix或.loc?我认为自然的方式应该是这样的row_to_add=pd.MultiIndex.from_tuples()df.ix[row_to_add]=my_row但这会引发KeyError。我知道我可以使用.append(),但我会发现使用.ix[]或.loc[]更简洁。举个例子:>>>df=pd.DataFrame({'Time':[dt.datetime(2013,2,3,9,0,1),dt.datetime(2013,2,3,9,0,1)],

python - 使用时间戳列表选择由 DatetimeIndex 索引的 Pandas DataFrame 的子集

我有一只PandasDataFrameDatetimeIndex:3425100entries,2011-12-0100:00:00to2011-12-3123:59:59Datacolumns:sig_qual3425100non-nullvaluesheave3425100non-nullvaluesnorth3425099non-nullvalueswest3425097non-nullvaluesdtypes:float64(4)我选择了DataFrame的一个子集使用.ix[start_datetime:end_datetime]然后我将其传递给peakdetectfunct

python - "No module named time"

我使用以下代码从源代码编译了Python:wgethttp://python.org/ftp/python/2.6.6/Python-2.6.6.tar.bz2tarjxvfPython-2.6.6.tar.bz2cdPython-2.6.6./configuremakemakeinstallPython版本:as3:~#python-VPython2.6.6我也安装了pip安装程序,但是当我使用pipinstallxxx时,我总是得到以下错误:Traceback(mostrecentcalllast):File"/usr/local/bin/pip",line5,infrompkg_

python - 使用 ctypes 获取 `time_t` 的类型/大小

我正在使用python访问一个包含一些time_t字段的C结构ctypes模块。鉴于其不完全可移植的特性,我无法将这些字段静态定义为c_int或c_long类型。如何定义它们以使我的代码可移植?示例C结构定义:#import#importtypedefstructmy_struct{time_ttimestap;uint16_tcode;};各自的pythonctypes结构:fromctypesimport*c_time=?#WhatdoIhavetoputhere?classMyStruct(Structure):_fields_=[('timestamp',c_time),('c

python - 为什么我会收到 Keras LSTM RNN input_shape 错误?

我不断从以下代码中收到input_shape错误。fromkeras.modelsimportSequentialfromkeras.layers.coreimportDense,Activation,Dropoutfromkeras.layers.recurrentimportLSTMdef_load_data(data):"""datashouldbepd.DataFrame()"""n_prev=10docX,docY=[],[]foriinrange(len(data)-n_prev):docX.append(data.iloc[i:i+n_prev].as_matrix())

python - 在 Pandas 中找到最接近给定时间的 DataFrame 行

我有一个由DatetimeIndex索引的Pandas数据框:DatetimeIndex:53732entries,1993-01-0712:23:58to2012-12-0220:06:23Datacolumns:Date(dd-mm-yy)_Time(hh-mm-ss)53732non-nullvaluesJulian_Day53732non-nullvaluesAOT_87053732non-nullvalues440-870Angstrom53732non-nullvalues440-675Angstrom53732non-nullvalues500-870Angstrom53

Python平滑时间序列数据

我在python中有一些数据是unixtime,值:[(1301672429,274),(1301672430,302),(1301672431,288)...]时间不断地以一秒为单位。我如何减少此数据,以便时间戳是每秒,但值是周围10个值的平均值?更好的滚动平均值也不错,但此数据是图表化的,因此主要是为了平滑图表。跟进(TSQLRollingAverageofTimeGroupings在得出结论,尝试在SQL中执行此操作是一种痛苦的途径)。 最佳答案 使用http://www.scipy.org/Cookbook/SignalSm

python - Keras LSTM 自动编码器时间序列重建

我正在尝试使用LSTM自动编码器(Keras)重建时间序列数据。现在我想在少量样本上训练自动编码器(5个样本,每个样本有500个时间步长并且有1个维度)。我想确保该模型可以重建这5个样本,然后我将使用所有数据(6000个样本)。window_size=500features=1data=data.reshape(5,window_size,features)model=Sequential()model.add(LSTM(256,input_shape=(window_size,features),return_sequences=True))model.add(LSTM(128,in

python - pandas.Series.unique() 是否保留顺序?

我还没有找到答案的简单问题:给定一个pandas系列,我认为Series.unique()给出的值的顺序是它们在系列中首次遇到的顺序,不是任何排序排序。IE。frompandasimportSeriess=Series(['b','b','b','a','a','b'])s.unique()>>>array(['b','a'],dtype=object)这是我希望我的应用程序的行为,但是有人可以告诉我是否可以保证获得此订单吗?文档不清楚。 最佳答案 是的,这通常是正确的。pandas对象有有序的索引,行不会重新排列,直到你告诉他们这