pandas-loc_草庐IT

python - pandas 获得 groupby 的平均值

我试图找到每个user_id的平均每月费用，但我只能获得每个用户的平均费用或每个用户的每月费用。因为我按用户和月份分组，所以无法获得第二个分组依据(月份)的平均值，除非我将分组依据输出转换为其他内容。这是我的df:df={'id':pd.Series([1,1,1,1,2,2,2,2]),'cost':pd.Series([10,20,30,40,50,60,70,80]),'mth':pd.Series([3,3,4,5,3,4,4,5])}costidmth0101312013230143401545023560246702478025我可以获得每月总和，但我想要每个user_id

groupby python code 39 section pandas dataframe group-by

python - 从 Pandas 数据框中过滤只有零的列

我有一个Pandas数据框，我想在其中过滤掉所有仅包含零的列。例如，在下面的数据框中，我想删除第2列:0123400.3810.7940.0000.9640.30410.5380.0290.0000.3270.92820.0410.3120.0000.2080.28430.4060.7860.0000.3340.11840.5110.1660.0000.1810.980我该怎么做？我一直在尝试这样的事情:df.filter(lambdax:x==0) 最佳答案以下对我有用。它给出了一个系列，其中列名现在是索引，索引的值是True/

python Pandas section code pre

python - 合并 Pandas 中的 2 个数据帧 : join on some columns, 总结其他

我想合并特定列(key1,key2)上的两个数据框，并求和另一列(value)的值。>>>df1=pd.DataFrame({'key1':range(4),'key2':range(4),'value':range(4)})key1key2value0000111122223333>>>df2=pd.DataFrame({'key1':range(2,6),'key2':range(2,6),'noise':range(2,6),'value':range(10,14)})key1key2noisevalue022210133311244412355513我想要这样的结果:key1k

columns python 39 key value pandas

python - Pandas 按数据框上的操作分组

我有一个如下所示的Pandas数据框。UsrIdJobNos141562232552412537812531我根据UsrId按数据框分组。分组数据框在概念上如下所示。UsrIdJobNos1[4,56,25]2[23,55,41,5]3[78,1]现在，我正在寻找一个内置API，它将为我提供具有最大作业数的UsrId。对于上面的示例，UsrId-2具有最大计数。更新:我想要的不是具有最大作业数的UsrID，而是具有最大作业数的nUserIds。对于上面的示例，如果n=2则输出为[2,1]。这能做到吗？最佳答案像df.groupb

python Pandas code UsrId JobNos

python - Pandas:将多个时间序列 DataFrame 绘制成一个图

我有以下Pandas数据框:timeGroupblocks01A412A723A1234A1745A2156A2667A3378A3989A48910A59............3635A231371B1382B1.5393B3404B5415B6............91135Z349这是一个包含多个时间序列问题数据的数据框，从min=1到max=35。每个Group都有一个这样的时间序列。我想根据1到35的x轴绘制每个单独的时间序列A到Z。y轴将是每次的block。我正在考虑使用类似AndrewsCurvesplot的东西,这会将每个系列相互绘制。每个“色调”将被设置为不同的组

制成 DataFrame code section image python pandas matplotlib pandas-groupby

python - 用于在窗口中打印元素的 Pandas 滚动计算

我想以滑动窗口方式从pandasdataframe的一列中的值制作一个系列。例如，如果这是我的数据框state01112131405060718491对于say3的窗口大小，我想得到一个列表[111,111,110,100,000...]我正在寻找一种有效的方法来执行此操作(当然，我可以简单地将state转换为列表，然后滑动列表索引)。有没有办法在这里使用Pandas滚动计算？我能以某种方式在滚动窗口中打印元素吗？最佳答案 a=np.array([100,10,1])s.rolling(3).apply(a.dot).apply(

口中 python section code stackoverflow pandas dataframe

python - Pandas:有没有办法使用类似 'droplevel' 的东西，并在处理过程中使用丢弃的级别标签作为前缀/后缀重命名其他级别？

以下查询的屏幕截图:有没有一种方法可以轻松地删除上层列索引，并有一个带有标签的单一级别，例如points_prev_amax、points_prev_amin、gf_prev_amax、gf_prev_amin等等？最佳答案使用listcomprehension设置新的列名:df.columns=df.columns.map('_'.join)Or:df.columns=['_'.join(col)forcolindf.columns]示例:df=pd.DataFrame({'A':[1,2,2,1],'B':[4,5,6,4]

级别丢弃 code columns 39 python pandas rename multiple-columns multi-index

python - Pandas 数据框 : add & remove prefix/suffix from all cell values of entire dataframe

要为数据框添加前缀/后缀，我通常会执行以下操作。比如添加后缀'@',df=df.astype(str)+'@'这基本上为所有单元格值附加了一个'@'。我想知道如何去掉这个后缀。pandas.DataFrame类是否有直接从整个DataFrame中删除特定前缀/后缀字符的方法？我试过在使用rstrip('@')时遍历行(作为系列)，如下所示:forindexinrange(df.shape[0]):row=df.iloc[index]row=row.str.rstrip('@')现在，为了从这个系列中制作数据框，new_df=pd.DataFrame(columns=list(df))n

amp dataframe code section pre python string pandas suffix

python - Pandas Dataframe 到嵌套 JSON

我正在尝试将PandasDataframe转换为JSON对象。我的数据框包含以下格式的数据:studentdategradecourse0Student_12017-06-2593ENGLISH1Student_22017-06-2583ENGLISH2Student_12017-06-2593MATH3Student_22017-06-2583MATH4Student_12017-06-2690MATH5Student_22017-06-2685MATH6Student_12017-06-2696ENGLISH7Student_22017-06-2699ENGLISH我想将其转换为以

Dataframe python 39 Student 2017 json pandas

python - 我需要从 pandas DataFrame 对象中创建一个 python 列表对象或任何对象，将来自不同行的值片段分组

我的DataFrame在第一列有一个字符串，在第二列有一个数字:GEOSTRINGIDactivity9wydm2p01uk0fd2z210wydm86pg6r3jyrg211wydm2p01uk0fd2z212wydm80xfxm9j22v239wydm9w92j538xze440wydm8km72gbyuvf441wydm86pg6r3jyrg442wydm8mzt874p1v5443wydm8mzmpz5gkt8544wydm86pg6r3jyrg545wydm8w1q8bjfpcj546wydm8w1q8bjfpcj5我想做的是操纵这个DataFrame以获得一个包含字符串的列

建一中创 code pandas wydm python list dataframe