草庐IT

sample_dataframe

全部标签

python - 将列总计附加到 Pandas DataFrame

我有一个带有数值的DataFrame。追加表示每列总和的行(具有给定索引值)的最简单方法是什么? 最佳答案 要添加一个Total列,该列是该行的总和:df['Total']=df.sum(axis=1) 关于python-将列总计附加到PandasDataFrame,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/20804673/

python - 在 Pandas DataFrame 中定位第一个和最后一个非 NaN 值

我有一个按日期索引的PandasDataFrame。有许多列,但许多列仅填充时间序列的一部分。我想找到第一个和最后一个值非NaN值的位置,以便我可以提取日期并查看特定列的时间序列有多长。有人能指出我如何去做这样的事情吗?提前致谢。 最佳答案 @behzad.nouri的解决方案完美地使用Series.first_valid_index返回第一个和最后一个非NaN值和Series.last_valid_index,分别。 关于python-在PandasDataFrame中定位第一个和最后

python - 在 Pandas DataFrame 中定位第一个和最后一个非 NaN 值

我有一个按日期索引的PandasDataFrame。有许多列,但许多列仅填充时间序列的一部分。我想找到第一个和最后一个值非NaN值的位置,以便我可以提取日期并查看特定列的时间序列有多长。有人能指出我如何去做这样的事情吗?提前致谢。 最佳答案 @behzad.nouri的解决方案完美地使用Series.first_valid_index返回第一个和最后一个非NaN值和Series.last_valid_index,分别。 关于python-在PandasDataFrame中定位第一个和最后

python - 获取 DataFrame 的 Datetime 列的工作日/星期几

我有一个DataFramedf,如下所示(摘录,'Timestamp'是索引):TimestampValue2012-06-0100:00:001002012-06-0100:15:001502012-06-0100:30:001202012-06-0101:00:002202012-06-0101:15:0080...andsoon.我需要一个新列df['weekday']与相应的时间戳记的工作日/星期几。我怎样才能得到这个? 最佳答案 使用新的dt.dayofweek属性:In[2]:df['weekday']=df['Time

python - 获取 DataFrame 的 Datetime 列的工作日/星期几

我有一个DataFramedf,如下所示(摘录,'Timestamp'是索引):TimestampValue2012-06-0100:00:001002012-06-0100:15:001502012-06-0100:30:001202012-06-0101:00:002202012-06-0101:15:0080...andsoon.我需要一个新列df['weekday']与相应的时间戳记的工作日/星期几。我怎样才能得到这个? 最佳答案 使用新的dt.dayofweek属性:In[2]:df['weekday']=df['Time

python - 计算 Pandas Dataframe 索引之间的时间差

我正在尝试将一列deltaT添加到数据帧中,其中deltaT是连续行之间的时间差(在时间序列中索引)。timevalue2012-03-1623:50:0012012-03-1623:56:0022012-03-1700:08:0032012-03-1700:10:0042012-03-1700:12:0052012-03-1700:20:0062012-03-2000:43:007想要的结果如下所示(deltaT单位以分钟为单位):timevaluedeltaT2012-03-1623:50:00102012-03-1623:56:00262012-03-1700:08:003122

python - 计算 Pandas Dataframe 索引之间的时间差

我正在尝试将一列deltaT添加到数据帧中,其中deltaT是连续行之间的时间差(在时间序列中索引)。timevalue2012-03-1623:50:0012012-03-1623:56:0022012-03-1700:08:0032012-03-1700:10:0042012-03-1700:12:0052012-03-1700:20:0062012-03-2000:43:007想要的结果如下所示(deltaT单位以分钟为单位):timevaluedeltaT2012-03-1623:50:00102012-03-1623:56:00262012-03-1700:08:003122

python - 在python中计算DataFrame每一列中的非零值

我有一个python-pandas-DataFrame,其中第一列是"user_id"其余列是标签("Tag_0"到"Tag_122").我有以下格式的数据:UserIdTag_0Tag_178676880578676880378676883078676883.53.578676884478676883.50我的目标是为每个user_id实现Sum(Tag)/Count(NonZero(Tags))df.groupby('user_id').sum(),给了我sum(tag),但是我对计算非零值一无所知是否可以在一个命令中实现Sum(Tag)/Count(NonZero(Tags))?

python - 在python中计算DataFrame每一列中的非零值

我有一个python-pandas-DataFrame,其中第一列是"user_id"其余列是标签("Tag_0"到"Tag_122").我有以下格式的数据:UserIdTag_0Tag_178676880578676880378676883078676883.53.578676884478676883.50我的目标是为每个user_id实现Sum(Tag)/Count(NonZero(Tags))df.groupby('user_id').sum(),给了我sum(tag),但是我对计算非零值一无所知是否可以在一个命令中实现Sum(Tag)/Count(NonZero(Tags))?

python - 将函数应用于 DataFrame 中的每个单元格

我有一个可能如下所示的数据框:ABCfoobarfoobarbarfoofoobar我想查看每一行的每个元素(或每一列的每个元素)并应用以下函数来获取后续的DF:deffoo_bar(x):returnx.replace('foo','wow')ABCwowbarwowbarbarwowwowbar是否有一个简单的单行程序可以将函数应用于每个单元格?这是一个简单的示例,因此除了应用函数之外,可能还有一种更简单的方法来执行此特定示例,但我真正要问的是如何在数据框中的每个单元格中应用函数。 最佳答案 您可以使用applymap()这对你