groupby-apply

python - Matplotlib imshow : how to apply a mask on the matrix

我正在尝试以图形方式分析二维数据。matplotlib.imshow在这方面非常有用，但我觉得如果我可以从我的矩阵中排除一些单元格，我可以更多地利用它，这些单元格的值超出了感兴趣的范围。我的问题是这些值在我感兴趣的范围内“拉平”了颜色图。排除这些值后，我可以获得更高的颜色分辨率。我知道如何在我的矩阵上应用掩码来排除这些值，但它在应用掩码后返回一个一维对象:mask=(myMatrix>lowerBound)&(myMatrix有没有办法将掩码传递给imshowhowtoreconstructa2darray? 最佳答案您可以使用n

python - 使用 resample 和 groupby - pandas 计算时间序列的百分位数/四分位数

我有一个每小时值的时间序列，我正在尝试每周/每月得出一些基本统计数据。如果我们使用以下抽象数据框，每一列都是时间序列:rng=pd.date_range('1/1/2016',periods=2400,freq='H')df=pd.DataFrame(np.random.randn(len(rng),4),columns=list('ABCD'),index=rng)printdf[:5]返回:ABCD2016-01-0100:00:001.5215810.1023350.7962710.3170462016-01-0101:00:00-0.369221-0.179821-1.3401

resample groupby 2016 code pandas python group-by resampling quantile

python - pandas 中的新列 - 通过应用列表 groupby 将系列添加到数据框

给出以下dfIdotherconcat0Az11Ay22Bx33Bw44Bv55Bu6我想要新列的结果，分组值作为列表Idotherconcatnew0Az1[1,2]1Ay2[1,2]2Bx3[3,4,5,6]3Bw4[3,4,5,6]4Bv5[3,4,5,6]5Bu6[3,4,5,6]这类似于这些问题:groupingrowsinlistinpandasgroupbyReplicatingGROUP_CONCATforpandas.DataFrame但是，它会应用您从df.groupby('Id')['concat'].apply(list)获得的分组，这是一个Series小于数据

groupby python 39 code concat pandas dataframe group-concat pandas-groupby

python - 将具有多个参数的函数传递给 DataFrame.apply

假设我有一个这样的数据框:df=pd.DataFrame([['foo','x'],['bar','y']],columns=['A','B'])AB0foox1bary当涉及到数据帧时，我知道如何将单个参数函数与Apply一起使用，如下所示:defsome_func(row):return'{0}-{1}'.format(row['A'],row['B'])df['C']=df.apply(some_func,axis=1)dfABC0fooxfoo-x1barybar-y当涉及多个输入参数时，如何在数据帧上应用？这是我想要的示例:defsome_func(row,var1):ret

数传递给 code 39 section python function pandas multiple-arguments

python - Pandas groupby 到 to_csv

想要将Pandasgroupby数据帧输出到CSV。尝试了各种StackOverflow解决方案，但没有奏效。Python3.6.1，Pandas0.20.1groupby结果如下:idmonthyearcountweek09066823214289517679843011274928368126421878723110381023416597648815117341227675109791635022512526872614238159996755686326143582想要一个看起来像的csvweekcount089517492872397647675125269967582当前代

groupby python week_grouped grouped week pandas csv pandas-groupby

python - 如何在 Pandas 中将 argmin 与 groupby 一起使用

假设我有一个像这样的pandas数据框:catval0a11a62a123b24b55b116c47c22而且我想知道，对于每个类别('cat'的每个值)，值最接近给定值的位置是什么，比如5.5。我可以减去我的目标值并取绝对值，给我这样的东西:catvalval_delt0a14.51a60.52a126.53b23.54b50.55b115.56c41.57c2216.5但我不知道下一步该去哪里。我的第一个想法是将argmin()与groupby()结合使用，但这会产生错误:In[375]:df.groupby('cat').val_delt.argmin()------------

何在 groupby section code pre python pandas

python - Pandas 数据框 groupby 的峰度不起作用

当我在pandas数据名上应用峰度函数时，我总是会收到以下错误:AttributeError:Cannotaccesscallableattribute'kurt'of'DataFrameGroupBy'objects,tryusingthe'apply'method以下示例代码适用于所有其他统计函数(mean()、skew()等)，但不适用于峰度。df=pd.DataFrame([[0,1,1,0,0,1],[0,1,2,4,5]]).Tdf.columns=['a','b']df.groupby('a').kurt()知道如何在groupby之后应用峰度吗？谢谢!

groupby python code section pandas

python - Pandas 系列的groupby不起作用

我无法对Pandas系列对象进行分组。DataFrames很好，但我似乎无法对Series进行分组。有没有人能够让这个工作？>>>importpandasaspd>>>a=pd.Series([1,2,3,4],index=[4,3,2,1])>>>a41322314dtype:int64>>>a.groupby()Traceback(mostrecentcalllast):File"",line1,inFile"/share/apps/install/anaconda/lib/python2.7/site-packages/pandas/core/generic.py",line15

groupby python pandas section

python - 用两列的 groupby 的第一行构建新列 - Pandas

我正在尝试构建一个新列，如果它是列“type”的元素第一次具有列“xx”的特定值，则该列的值为1，并在中给出0的值任何其他情况。我正在使用的原始数据框(df)是:idx=[np.array(['Jan-18','Jan-18','Feb-18','Mar-18','Mar-18','Mar-18','Apr-18','Apr-18','May-18','Jun-18','Jun-18','Jun-18','Jul-18','Aug-18','Aug-18','Sep-18','Sep-18','Oct-18','Oct-18','Oct-18','Nov-18','Dec-18','D

groupby python 39 2018 1000 pandas dataframe

python - 当键值在iterable的元素中时，如何使用itertools.groupby？

为了说明，我从一个二元组列表开始:importitertoolsimportoperatorraw=[(1,"one"),(2,"two"),(1,"one"),(3,"three"),(2,"two")]forkey,grpinitertools.groupby(raw,key=lambdaitem:item[0]):printkey,list(grp).pop()[1]产量:1one2two1one3three2two试图调查原因:forkey,grpinitertools.groupby(raw,key=lambdaitem:item[0]):printkey,list(grp)

中时 itertools code section 39 python group-by python-itertools

24 25 262728 29 30