datetime_column

python - 将 pandas 时间序列从 object dtype 重新索引为 datetime dtype

我有一个不被识别为DatetimeIndex的时间序列，尽管它被具有有效日期的标准YYYY-MM-DD字符串索引。将它们强制为有效的DatetimeIndex似乎不够优雅，让我觉得我做错了什么。我读入(其他人的惰性格式)包含无效日期时间值的数据并删除了这些无效观察结果。In[1]:df=pd.read_csv('data.csv',index_col=0)In[2]:printdf['2008-02-27':'2008-03-02']Out[2]:count2008-02-27202008-02-2802008-02-29272008-02-3002008-02-3102008-03-

dtype datetime 2008 39 code python python-2.7 pandas

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数，对于DataFrame的每一行，我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如，假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能，但例如只需引用scipy.stats.mstats.mquan

operation transform code section NaN python group-by dataframe pandas

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数，对于DataFrame的每一行，我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如，假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能，但例如只需引用scipy.stats.mstats.mquan

operation transform code section NaN python group-by dataframe pandas

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程，我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

indexing multiple section gt pandas python dataframe

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程，我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

indexing multiple section gt pandas python dataframe

python - 在 DataFrame 中将 Pandas 系列转换为 DateTime

我有一个如下所示的PandasDataFrameReviewIDIDTypeTimeReviewed2057603293051936827ReportID2015-01-1500:05:27.5130002327603293051936854ReportID2015-01-1500:06:46.7030002337603293051936855ReportID2015-01-1500:06:56.7070004137603293051937035ReportID2015-01-1500:14:24.9570005657603293051937188ReportID2015-01-150

DataFrame DateTime 76032930 TimeReviewed 2015 python pandas

python - 在 DataFrame 中将 Pandas 系列转换为 DateTime

我有一个如下所示的PandasDataFrameReviewIDIDTypeTimeReviewed2057603293051936827ReportID2015-01-1500:05:27.5130002327603293051936854ReportID2015-01-1500:06:46.7030002337603293051936855ReportID2015-01-1500:06:56.7070004137603293051937035ReportID2015-01-1500:14:24.9570005657603293051937188ReportID2015-01-150

DataFrame DateTime 76032930 TimeReviewed 2015 python pandas

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件，但它不适用于第三个条件，因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

condition columns 39 code section python pandas dataframe conditional-statements

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件，但它不适用于第三个条件，因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

condition columns 39 code section python pandas dataframe conditional-statements

python - 如何从对象为 datetime.time 类型的 Pandas DataFrame.Index 中添加/减去时间(小时、分钟等)？

我有一个索引只是datetime.time的DataFrame，并且DataFrame.Index和datetime.time中没有方法可以改变时间。datetime.time已替换，但仅适用于系列的个别项目？下面是使用的索引示例:In[526]:dfa.index[:5]Out[526]:Index([21:12:19,21:12:20,21:12:21,21:12:21,21:12:22],dtype='object')In[527]:type(dfa.index[0])Out[527]:datetime.time 最佳答案 L

DataFrame datetime section pandas python time