dataframe_草庐IT

python - 获取 DataFrame 的 Datetime 列的工作日/星期几

我有一个DataFramedf，如下所示(摘录，'Timestamp'是索引):TimestampValue2012-06-0100:00:001002012-06-0100:15:001502012-06-0100:30:001202012-06-0101:00:002202012-06-0101:15:0080...andsoon.我需要一个新列df['weekday']与相应的时间戳记的工作日/星期几。我怎样才能得到这个？最佳答案使用新的dt.dayofweek属性:In[2]:df['weekday']=df['Time

python - 计算 Pandas Dataframe 索引之间的时间差

我正在尝试将一列deltaT添加到数据帧中，其中deltaT是连续行之间的时间差(在时间序列中索引)。timevalue2012-03-1623:50:0012012-03-1623:56:0022012-03-1700:08:0032012-03-1700:10:0042012-03-1700:12:0052012-03-1700:20:0062012-03-2000:43:007想要的结果如下所示(deltaT单位以分钟为单位):timevaluedeltaT2012-03-1623:50:00102012-03-1623:56:00262012-03-1700:08:003122

Dataframe python 00 2012 03 pandas

python - 计算 Pandas Dataframe 索引之间的时间差

我正在尝试将一列deltaT添加到数据帧中，其中deltaT是连续行之间的时间差(在时间序列中索引)。timevalue2012-03-1623:50:0012012-03-1623:56:0022012-03-1700:08:0032012-03-1700:10:0042012-03-1700:12:0052012-03-1700:20:0062012-03-2000:43:007想要的结果如下所示(deltaT单位以分钟为单位):timevaluedeltaT2012-03-1623:50:00102012-03-1623:56:00262012-03-1700:08:003122

Dataframe python 00 2012 03 pandas

python - 在不知道索引的情况下获取 Series 的第一个元素

这个问题在这里已经有了答案:Getfirstrowvalueofagivencolumn(10个回答)关闭4年前。有没有办法在不知道索引的情况下访问Series的第一个元素？假设我有以下系列:importpandasaspdkey='MCS096'SUBJECTS=pd.DataFrame({"ID":pd.Series([146],index=[145]),"study":pd.Series(["MCS"],index=[145]),"center":pd.Series(["Mag"],index=[145]),"initials":pd.Series(["MCS096"],inde

不知 python section Series code pandas dataframe head

python - 在不知道索引的情况下获取 Series 的第一个元素

这个问题在这里已经有了答案:Getfirstrowvalueofagivencolumn(10个回答)关闭4年前。有没有办法在不知道索引的情况下访问Series的第一个元素？假设我有以下系列:importpandasaspdkey='MCS096'SUBJECTS=pd.DataFrame({"ID":pd.Series([146],index=[145]),"study":pd.Series(["MCS"],index=[145]),"center":pd.Series(["Mag"],index=[145]),"initials":pd.Series(["MCS096"],inde

不知 python section Series code pandas dataframe head

python - 查找列中的唯一值，然后对它们进行排序

我有一个Pandas数据框。我想按升序打印其中一列的唯一值。我就是这样做的:importpandasaspddf=pd.DataFrame({'A':[1,1,3,2,6,2,8]})a=df['A'].unique()printa.sort()问题是我得到一个None的输出。最佳答案 sorted(iterable):从iterable中的项目返回一个新的排序列表。代码importpandasaspddf=pd.DataFrame({'A':[1,1,3,2,6,2,8]})a=df['A'].unique()print(sor

python 查找 section code strong pandas sorting dataframe unique

python - 查找列中的唯一值，然后对它们进行排序

我有一个Pandas数据框。我想按升序打印其中一列的唯一值。我就是这样做的:importpandasaspddf=pd.DataFrame({'A':[1,1,3,2,6,2,8]})a=df['A'].unique()printa.sort()问题是我得到一个None的输出。最佳答案 sorted(iterable):从iterable中的项目返回一个新的排序列表。代码importpandasaspddf=pd.DataFrame({'A':[1,1,3,2,6,2,8]})a=df['A'].unique()print(sor

python 查找 section code strong pandas sorting dataframe unique

python - 在python中计算DataFrame每一列中的非零值

我有一个python-pandas-DataFrame，其中第一列是"user_id"其余列是标签("Tag_0"到"Tag_122").我有以下格式的数据:UserIdTag_0Tag_178676880578676880378676883078676883.53.578676884478676883.50我的目标是为每个user_id实现Sum(Tag)/Count(NonZero(Tags))df.groupby('user_id').sum()，给了我sum(tag)，但是我对计算非零值一无所知是否可以在一个命令中实现Sum(Tag)/Count(NonZero(Tags))？

python 中计 code section 7867688 pandas dataframe pandas-groupby

python - 在python中计算DataFrame每一列中的非零值

我有一个python-pandas-DataFrame，其中第一列是"user_id"其余列是标签("Tag_0"到"Tag_122").我有以下格式的数据:UserIdTag_0Tag_178676880578676880378676883078676883.53.578676884478676883.50我的目标是为每个user_id实现Sum(Tag)/Count(NonZero(Tags))df.groupby('user_id').sum()，给了我sum(tag)，但是我对计算非零值一无所知是否可以在一个命令中实现Sum(Tag)/Count(NonZero(Tags))？

python 中计 code section 7867688 pandas dataframe pandas-groupby

python - 剥离/修剪数据帧的所有字符串

在python/pandas中清理多类型数据框的值，我想修剪字符串。我目前正在按照两个说明进行操作:importpandasaspddf=pd.DataFrame([['a',10],['c',5]])df.replace('^\s+','',regex=True,inplace=True)#frontdf.replace('\s+$','',regex=True,inplace=True)#enddf.values这很慢，我有什么可以改进的？最佳答案您可以使用DataFrame.select_dtypes选择string列，然

python 剥离 code pandas section regex dataframe trim