pandas-explode

python - Pandas 数据框 : how to aggregate a subset of rows based on value of a column

我有一个结构如下的Pandas数据框:valuelabA50B35C8D5E1F1这只是一个例子，实际数据帧更大，但遵循相同的结构。示例数据框是用这两行创建的:df=pd.DataFrame({'lab':['A','B','C','D','E','F'],'value':[50,35,8,5,1,1]})df=df.set_index('lab')我想聚合值小于给定阈值的行:所有这些行都应替换为单个行，该行的值是替换行的总和。例如，如果我选择一个阈值=6，那么预期的结果应该是这样的:valuelabA50B35C8X7#sumofD,E,F我该怎么做？我想用groupby(),但我看

aggregate python code 39 section pandas dataframe

python - 使用 Bokeh 显示 Pandas 数据框

有没有一种用Bokeh显示数据框的好方法？我有一堆基于表格的文本，我想与一些图表一起显示和动态更新，但我还没有找到执行此操作的好方法。最佳答案你应该看看bokeh.models.widgets.DataTablehttp://docs.bokeh.org/en/latest/docs/user_guide/interaction.html#data-table例子:fromdatetimeimportdatefromrandomimportrandintfrombokeh.modelsimportColumnDataSource

python Pandas section 34 TableColumn bokeh

python - 将 uuid 添加到 pandas DataFrame 中的新列

我想为pandasDataFrame中单个新列中的每一行添加一个uuid。这显然用相同的uuid填充了列:importuuidimportpandasaspdimportnumpyasnpdf=pd.DataFrame(np.random.randn(4,3),columns=list('abc'),index=['apple','banana','cherry','date'])df['uuid']=uuid.uuid4()print(df)abcuuidapple0.687601-1.332904-0.16601834115445-c4b8-4e64-bc96-e120abda16

DataFrame python uuid section 39 python-3.x pandas

python - 在 Pandas 中的 groupby 之后查找与最大日期关联的行

我有一个包含PERSON_ID、MOVING_DATE和PLACE的3列的pandasDataFrame，如下所示:df=pandas.DataFrame([[1,datetime.datetime(2018,1,1),'NewYork'],[1,datetime.datetime(2018,1,20),'RiodeJaneiro'],[1,datetime.datetime(2018,2,13),'London'],[2,datetime.datetime(2017,6,12),'Seatle'],[2,datetime.datetime(2016,10,10),'NewMexico

groupby python datetime 39 code pandas pandas-groupby

python - pandas:通过拆分所有行(一列)中的字符串值和聚合函数进行分组

如果我有这样的数据集:idperson_namesalary0[alexander,william,smith]450001[smith,robert,gates]650002[bob,alexander]560003[robert,william]800004[alexander,gates]70000如果我们对薪水列求和，那么我们将得到316000我真的很想知道如果我们将这个数据集(包含相同的字符串值)中的拆分名称的所有薪水相加，那么名字为“alexander、smith等”(不同)的人的薪水是多少。输出:groupsum_salaryalexander171000#sumfrom

python pandas 39 code person_name numpy

python - 如何检查列表中的所有元素是否都存在于 pandas 列中

我有一个数据框和一个列表:df=pd.DataFrame({'id':[1,2,3,4,5,6,7,8],'char':[['a','b'],['a','b','c'],['a','c'],['b','c'],[],['c','a','d'],['c','d'],['a']]})names=['a','c']只有a和c都出现在char列中时，我才想获取行。(这里的顺序无关紧要)预期输出:charid1[a,b,c]22[a,c]35[c,a,d]6我的努力true_indices=[]foridx,rowindf.iterrows():ifall(nameinrow['char']fo

python pandas 39 code section python-3.x

python - 如何根据条件为 Pandas 数据框中的行组分配唯一值？

我的数据框是这样的:importpandasaspdexample=[{'A':3},{'A':5},{'A':0},{'A':2},{'A':6},{'A':9},{'A':0},{'A':3},{'A':4}]df=pd.DataFrame(example)print(df)输出:df350269034一个新的“簇”出现在df中出现0之后。我想给这些集群中的每一个一个唯一的值，就像这样:df3A5A0-2B6B9B0-3C4C我尝试过使用enumerate和itertools，但由于我是Python的新手，所以我一直在努力了解这些选项的正确用法和语法。

python Pandas code 39 section dataframe

python - 将 pandas'to_html' 保存为文件

我有一个DateFrame'tsod'，现在我将它转换为html:tsod.to_html()如何将其保存为文件？最好另存为“.html”文件。最佳答案 withopen('my_file.html','w')asfo:fo.write(tsod.to_html())或者使用Pandastsod.to_html(open('my_file.html','w'))或再次(感谢@andy-hayden)withopen('my_file.html','w')asfo:tsod.to_html(fo)

amp to_html section html code python pandas

python - 同一数据框中的 Pandas 和 sum 和 cum sum

我使用下面的代码创建总和和cumsum。但它们位于两个独立的数据框中。我想要一应俱全asp=np.array(np.array([0,0,1]))asq=np.array(np.array([10,10,20]))columns=['asp']df=pd.DataFrame(asp,index=None,columns=columns)df['asq']=asqdf=df.groupby(by=['asp']).sum()dfcum=df.cumsum()如何在同一个数据框中同时拥有总和和cumsum。完全不清楚如何做到这一点。下面是我想要的asqsumcumsumasp0202012

sum python section cumsum code pandas

python - 如何获取 pandas .plot(kind ='kde') 的输出？

当我绘制我使用的Pandas系列的密度分布时.plot(kind='kde')是否可以获取该图的输出值？如果是，该怎么做？我需要绘制的值。最佳答案 .plot(kind='kde')没有输出值，它返回一个axes对象。可以通过绘图中matplotlib.lines.Line2D对象的_x和_y方法访问原始值In[266]:ser=pd.Series(np.random.randn(1000))ax=ser.plot(kind='kde')In[265]:ax.get_children()#itisthe3ndobjectOut[2

amp python matplotlib code section pandas

45 46 474849 50 51