panda_草庐IT

python - 在 Pandas value_counts() 中提取值

假设我们使用了pandasdataframe[column].value_counts()输出:apple5sausage2banana2cheese1如何按照上面显示的从最大值到最小值的顺序提取值？例如:[苹果、香肠、香蕉、奶酪] 最佳答案试试这个:dataframe[column].value_counts().index.tolist()['apple','sausage','banana','cheese'] 关于python-在Pandasvalue_counts()中提取值

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame？我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

DataFrame python NaN code section pandas

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame？我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

DataFrame python NaN code section pandas

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因，当我运行此代码时，Value列下的所有行都是正数，而某些行应该是负数。在DataFrame的Action列下，有七行带有'Sell'字符串，七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

相乘并将 code orders_df section python python-2.7 pandas

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因，当我运行此代码时，Value列下的所有行都是正数，而某些行应该是负数。在DataFrame的Action列下，有七行带有'Sell'字符串，七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

相乘并将 code orders_df section python python-2.7 pandas

python - Pandas Left Outer Join 导致表大于左表

根据我对左外连接的理解，结果表的行数不应超过左表...如果有误请告诉我...我的左表是192572行8列。我的右表是42160行5列。我的左表有一个名为“id”的字段，它与我右表中名为“key”的列匹配。因此我将它们合并为:combined=pd.merge(a,b,how='left',left_on='id',right_on='key')但是组合后的形状是236569。我误会了什么？最佳答案如果键与另一个DataFrame中的多行匹配，您可以预期这会增加:In[11]:df=pd.DataFrame([[1,3],[2,4

python Pandas section 39 duplicates

python - Pandas Left Outer Join 导致表大于左表

根据我对左外连接的理解，结果表的行数不应超过左表...如果有误请告诉我...我的左表是192572行8列。我的右表是42160行5列。我的左表有一个名为“id”的字段，它与我右表中名为“key”的列匹配。因此我将它们合并为:combined=pd.merge(a,b,how='left',left_on='id',right_on='key')但是组合后的形状是236569。我误会了什么？最佳答案如果键与另一个DataFrame中的多行匹配，您可以预期这会增加:In[11]:df=pd.DataFrame([[1,3],[2,4

python Pandas section 39 duplicates

python - Pandas:按标签获取唯一的 MultiIndex 级别值

假设你有这个MultiIndex-edDataFrame:df=pd.DataFrame({'country':['DE','DE','FR','FR'],'biome':['Lake','Forest','Lake','Forest'],'area':[10,20,30,40],'count':[7,5,2,3]})df=df.set_index(['country','biome'])看起来像这样:areacountcountrybiomeDELake107Forest205FRLake302Forest403我想检索每个索引级别的唯一值。这可以使用来完成>>>df.index.l

MultiIndex 级别 39 code section python pandas

python - Pandas:按标签获取唯一的 MultiIndex 级别值

假设你有这个MultiIndex-edDataFrame:df=pd.DataFrame({'country':['DE','DE','FR','FR'],'biome':['Lake','Forest','Lake','Forest'],'area':[10,20,30,40],'count':[7,5,2,3]})df=df.set_index(['country','biome'])看起来像这样:areacountcountrybiomeDELake107Forest205FRLake302Forest403我想检索每个索引级别的唯一值。这可以使用来完成>>>df.index.l

MultiIndex 级别 39 code section python pandas

python - Pandas :在每组中平均填充缺失值

这应该很简单，但我发现最接近的是这篇文章:pandas:Fillingmissingvalueswithinagroup，我还是解决不了我的问题....假设我有以下数据框df=pd.DataFrame({'value':[1,np.nan,np.nan,2,3,1,3,np.nan,3],'name':['A','A','B','B','B','B','C','C','C']})namevalue0A11ANaN2BNaN3B24B35B16C37CNaN8C3我想在每个“名称”组中用平均值填写“NaN”，即namevalue0A11A12B23B24B35B16C37C38C3我不知

缺失 python 39 section code pandas pandas-groupby imputation fillna