草庐IT

datetime_column

全部标签

python - 将 pandas 时间序列从 object dtype 重新索引为 datetime dtype

我有一个不被识别为DatetimeIndex的时间序列,尽管它被具有有效日期的标准YYYY-MM-DD字符串索引。将它们强制为有效的DatetimeIndex似乎不够优雅,让我觉得我做错了什么。我读入(其他人的惰性格式)包含无效日期时间值的数据并删除了这些无效观察结果。In[1]:df=pd.read_csv('data.csv',index_col=0)In[2]:printdf['2008-02-27':'2008-03-02']Out[2]:count2008-02-27202008-02-2802008-02-29272008-02-3002008-02-3102008-03-

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数,对于DataFrame的每一行,我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如,假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能,但例如只需引用scipy.stats.mstats.mquan

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数,对于DataFrame的每一行,我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如,假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能,但例如只需引用scipy.stats.mstats.mquan

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程,我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程,我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

python - 在 DataFrame 中将 Pandas 系列转换为 DateTime

我有一个如下所示的PandasDataFrameReviewIDIDTypeTimeReviewed2057603293051936827ReportID2015-01-1500:05:27.5130002327603293051936854ReportID2015-01-1500:06:46.7030002337603293051936855ReportID2015-01-1500:06:56.7070004137603293051937035ReportID2015-01-1500:14:24.9570005657603293051937188ReportID2015-01-150

python - 在 DataFrame 中将 Pandas 系列转换为 DateTime

我有一个如下所示的PandasDataFrameReviewIDIDTypeTimeReviewed2057603293051936827ReportID2015-01-1500:05:27.5130002327603293051936854ReportID2015-01-1500:06:46.7030002337603293051936855ReportID2015-01-1500:06:56.7070004137603293051937035ReportID2015-01-1500:14:24.9570005657603293051937188ReportID2015-01-150

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件,但它不适用于第三个条件,因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件,但它不适用于第三个条件,因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

python - 如何从对象为 datetime.time 类型的 Pandas DataFrame.Index 中添加/减去时间(小时、分钟等)?

我有一个索引只是datetime.time的DataFrame,并且DataFrame.Index和datetime.time中没有方法可以改变时间。datetime.time已替换,但仅适用于系列的个别项目?下面是使用的索引示例:In[526]:dfa.index[:5]Out[526]:Index([21:12:19,21:12:20,21:12:21,21:12:21,21:12:22],dtype='object')In[527]:type(dfa.index[0])Out[527]:datetime.time 最佳答案 L