草庐IT

original_series

全部标签

python - 计算Series的局部时间导数

我有从hdf5文件导入的数据。所以,它看起来像这样:importpandasaspdtmp=pd.Series([1.,3.,4.,3.,5.],['2016-06-2723:52:00','2016-06-2723:53:00','2016-06-2723:54:00','2016-06-2723:55:00','2016-06-2723:59:00'])tmp.index=pd.to_datetime(tmp.index)>>>tmp2016-06-2723:52:001.02016-06-2723:53:003.02016-06-2723:54:004.02016-06-2723

python - 如何使用 Pandas 将 Series 连接到 DataFrame 上?

如果我有一个DataFrame:students=pd.DataFrame([['Alex'],['Lauren'],])如何连接一个Series并创建一个新的DataFrame?例如,我想:>>>marks=pd.Series([.8,.75])>>>students.concat(marks).values[['Alex',.8],['Lauren',.75]]我知道我可以使用:students['marks']=marks但这会改变students。我试过:>>>pd.concat([students,marks])…AttributeError:'Series'objectha

python - 喀拉斯 LSTM : a time-series multi-step multi-features forecasting - poor results

我有一个包含全年数据的时间序列数据集(日期是索引)。每15分钟(全年)测量一次数据,这导致每天有96个时间步长。数据已经标准化。变量是相关的。除VAR外的所有变量都是天气指标。VAR在一天和一周内是季节性的(因为它在周末看起来有点不同,但每个周末都差不多)。VAR值是固定的。我想预测接下来两天(提前192步)和接下来7天(提前672步)的VAR值。这是数据集的样本:DateIdxVARdewpthumpresstemp2017-04-1700:00:000.3693970.1550390.3867920.1967210.2388892017-04-1700:15:000.3632140

python - 在 pandas Series 或 DataFrame 中查找最后一个真值的索引

我正在尝试查找pandasbool系列中最后一个True值的索引。我当前的代码如下所示。是否有更快或更清洁的方法来执行此操作?importnumpyasnpimportpandasaspdimportstringindex=np.random.choice(list(string.ascii_lowercase),size=1000)df=pd.DataFrame(np.random.randn(1000,2),index=index)s=pd.Series(np.random.choice([True,False],size=1000),index=index)last_true_i

python - 检查 pandas.Series.index 是否包含一个值

我(自认为)知道如何检查某个值是否包含在pandas系列的索引中,但我无法在下面的示例中使用它。也许这是一个错误?首先,我生成一些随机数:importnumpyasnpimportpandasaspdsome_numbers=np.random.randint(0,4,size=10)print(some_numbers)输出:[0223112232]然后,我用这些数字创建一个系列并计算它们的频率s=pd.Series(some_numbers)gb=s.groupby(s).size()/len(s)print(gb)输出:00.110.220.530.2dtype:float64到

python - 属性错误 : 'Series' object has no attribute 'searchsorted' pandas

我复现python书第38页数据分析的代码我写prop_cumsum=df.sort_index(by='prop',ascending=False).prop.cumsum()andprop_cumsum.searchsorted(0.5)然后有错误说:AttributeErrorTraceback(mostrecentcalllast)in()---->1prop_cumsum.searchsorted(0.5)C:\Users\xxx\AppData\Local\Enthought\Canopy32\User\lib\site-packages\pandas\core\gener

python - 将项目添加到 pandas.Series?

我想向我的pandas.Series添加一个整数这是我的代码:importpandasaspdinput=pd.Series([1,2,3,4,5])input.append(6)当我运行它时,出现以下错误:Traceback(mostrecentcalllast):File"",line1,inf.append(6)File"C:\Python33\lib\site-packages\pandas\core\series.py",line2047,inappendverify_integrity=verify_integrity)File"C:\Python33\lib\site-p

python - 在 pandas 数据框列(又名 pd.series)中查找数组元素位置

我有一个类似于这个的pandas框架:importpandasaspdimportnumpyasnpdata={'Col1':[4,5,6,7],'Col2':[10,20,30,40],'Col3':[100,50,-30,-50],'Col4':['AAA','BBB','AAA','CCC']}df=pd.DataFrame(data=data,index=['R1','R2','R3','R4'])Col1Col2Col3Col4R1410100AAAR252050BBBR3630-30AAAR4740-50CCC给定一个目标数组:target_array=np.array([

python - Pb 将 pandas.Series 列表转换为 pandas.Series 的 numpy 数组

我想将pandas.Series列表转换为pandas.Series的numpy数组。但是当我调用数组构造函数时,它也会转换我的系列。>>>l=[Series([1,2,3]),Series([4,5,6])]>>>np.array(l)array([[1,2,3],[4,5,6]],dtype=int64)我的列表很小(约10个元素),所以对于performancesissues我想避免创建pandas.DataFrame。有简单的解决方法吗?提前致谢 最佳答案 你应该在赋值时设置数组的dtype:l=[pd.Series([1,

python - sklearn : User defined cross validation for time series data

我正在尝试解决机器学习问题。我有一个包含时间序列元素的特定数据集。对于这个问题,我使用了著名的python库-sklearn。这个库中有很多交叉验证迭代器。还有几个迭代器用于自己定义交叉验证。问题是我真的不知道如何为时间序列定义简单的交叉验证。这是我想要获得的一个很好的例子:假设我们有几个时期(年),我们想将我们的数据集分成几个block,如下所示:data=[1,2,3,4,5,6,7]train:[1]test:[2](ortest:[2,3,4,5,6,7])train:[1,2]test:[3](ortest:[3,4,5,6,7])train:[1,2,3]test:[4](