草庐IT

我尝试排序后,熊猫行被移动

我有这个数据框,其头部看起来像这样:Out[8]:DateValue02016-06-30481100.012016-05-31493800.022015-12-31514000.032015-10-31510700.0我想将日期列用作索引,然后根据日期的顺序对行进行排序。当我尝试根据第一列对其进行排序时:df.set_index('Date',inplace=True)然后头部看起来像这样:ValueDate2016-06-30481100.02016-05-31493800.02015-12-31514000.02015-10-31510700.0不仅不是根据日期订购的数据框,而且标题被弄

小组在熊猫中运营

我正在使用Python读取熊猫中的小熊猫函数。这里提到的作者如下。In[13]:df=DataFrame({'key1':['a','a','b','b','a'],....:'key2':['one','two','one','two','one'],....:'data1':np.random.randn(5),....:'data2':np.random.randn(5)})In[14]:dfOut[14]:data1data2key1key20-0.2047081.393406aone10.4789430.092908atwo2-0.5194390.281746bone3-0.5557

管道合并python中的多个熊猫数据框

假设我生成了三个我想合并的熊猫数据框:importpandasaspdimportnumpyasnpdf1=pd.DataFrame(np.random.randn(10,2),columns=['a','b'])df2=df1.assign(b=np.random.randn(10)).rename(columns={'a':'z','b':'d'})df3=df2.assign(d=np.random.randn(10)).rename(columns={'z':'f','d':'e'})这产生以下三个数据范围:df1:ab01.9197991.06747710.7193391.69572

参考下一个行值使用熊猫

我正在编写一个脚本来填写表单,并想从Excel电子表格(一列)中引用数据以填写重新出现的字段。importpandasaspdfile='FilePathHere'xl=pd.ExcelFile(file)df=pd.read_excel(file,'Sheet1',index_col=None)num=1li=[(df.iloc[0,0])]defnext_app():fornum,eleminenumerate(li):thiselem=elemnextelem=li[(num+1)%len(li)]print(nextelem)next_app()显然印刷1个值,但我不确定如何在我需要时

类型“非型”的参数不是峰顶的熊猫

我有两个功能:#Toupdatethelabel1ifwordispresentwithis_namedefupdate(data,word_lists,is_name):forwlistinword_lists:ifcheck_keywords(data,wlist):returnis_namereturn''#TocheckifWordsarepresentinmyShort_descriptionfield.defcheck_keywords(data,words):cnt=0forwordinwords:ifwordindata:cnt+=1returncnt==len(words)以

熊猫的数据框架前填充到当前季度

我正在寻找直到当今四分之一的数据框架的前填充。我有以下数据框:QuarterNameValue2016Q4A22017Q1B32017Q2C1需要输出:QuarterNameValue2016Q4A22017Q1B32017Q2C12017Q3C1请注意,2017Q3是当前季度,这是需要填写的。任何帮助都将受到赞赏。谢谢看答案确保这件事Quarter是一列df.Quarter=pd.PeriodIndex(df.Quarter,freq='Q')利用pd.period_range然后建立一个新索引reindexidx=pd.period_range(df.Quarter.min(),pd.da

将行与参考行熊猫进行比较

我有一个示例数据集:importpandasaspddf={'rank1':[1,2,3,4,5,6,7,8],'rank12':[1,2,3,4,8,9,37,15],'rank13':[1,2,3,4,12,6,24,14],'N':['','','','','','','',''],'code#':[1945,13060,610,402,1067,180,411,93],'score1':[100,97,95,92,87,85,80,79],'score2':['yes','yes','no','no','yes','yes','no','yes'],'score3':[10,9,10,

如何将值排除在熊猫中的groupby函数中计数

我有一个数据框:AIDTypeCo-AIDCo-Type1A10A1A11B1A12B1A13C1A14D2X15A2X16A2X17X2X18B2X19X2X20X我想找到与它不同的每种类型的共同类型的百分比。因此结果将是AIDTypePercentDiff1A0.82X0.50.8是因为4/5Co-Type不是TypeA0.5是因为3/6Co-Type不是TypeX我知道我可以根据Type和Co-Type并获得每个人的数量,但是如何排除类似类似的类型?看答案您可以使用以下方式:df.assign(PercentDiff=df['Type'].ne(df['Co-Type']))\.grou

使用熊猫的数据框架主导统计分析

我有一个具有多个列的数据框。其中一列中的值是一个最多总和1的百分比。例如A列A。我想在另一列B列B中打印值,以便这些值对应于A列中最大值,总和最高为0.95。例如:ColumnAColumnBA10.2A20.5A30.25A40.01A50.03A60.01结果应该是A1A2A3作为B列中这些值的相应值,总和最高为0.95看答案让我们使用cumsum使用布尔索引使用.loc:df.loc[df['ColumnB'].cumsum()编辑:正如Hausdork指出的那样,如果我们想以最大的值进行操作,那么我们可以sort_values:df.loc[df.sort_values(by='Col

熊猫:通过钥匙进行第一次出现分组

如果我有以下数据框|id|timestamp|code|id2|10|2017-07-1213:37:00|206|a1|10|2017-07-1213:40:00|206|a1|10|2017-07-1213:55:00|206|a1|10|2017-07-1219:00:00|206|a2|11|2017-07-1213:37:00|206|a1...我需要分组id,id2列,首次出现timestamp值,例如为了id=10,id2=a1,timestamp=2017-07-1213:37:00.我搜索了它,发现了一些可能的解决方案,但无法弄清楚如何正确实现它们。这可能应该是:df.gro