草庐IT

dataframe

全部标签

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame?我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案 您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame?我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案 您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因,当我运行此代码时,Value列下的所有行都是正数,而某些行应该是负数。在DataFrame的Action列下,有七行带有'Sell'字符串,七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因,当我运行此代码时,Value列下的所有行都是正数,而某些行应该是负数。在DataFrame的Action列下,有七行带有'Sell'字符串,七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

Python:根据 Pandas 数据框中某些行出现的两列(变量)获取频率计数

您好,我有以下数据框。GroupSizeShortSmallShortSmallModerateMediumModerateSmallTallLarge我想计算同一行在数据框中出现的频率。GroupSizeTimeShortSmall2ModerateMedium1ModerateSmall1TallLarge1 最佳答案 您可以使用groupby的size:In[11]:df.groupby(["Group","Size"]).size()Out[11]:GroupSizeModerateMedium1Small1ShortSma

Python:根据 Pandas 数据框中某些行出现的两列(变量)获取频率计数

您好,我有以下数据框。GroupSizeShortSmallShortSmallModerateMediumModerateSmallTallLarge我想计算同一行在数据框中出现的频率。GroupSizeTimeShortSmall2ModerateMedium1ModerateSmall1TallLarge1 最佳答案 您可以使用groupby的size:In[11]:df.groupby(["Group","Size"]).size()Out[11]:GroupSizeModerateMedium1Small1ShortSma

python - 子集 Python DataFrame

我正在从R过渡到Python。我刚开始使用Pandas。我有一个很好的子集的R代码:k1现在,我想在Python中做类似的事情。这是我到目前为止所得到的:importpandasaspddata=pd.read_csv("../data/monthly_prod_sales.csv")#first,indexthedatasetbyProduct.And,getallthatmatchesagiven'p.id'andtime.data.set_index('Product')k=data.ix[[p.id,'Time']]#then,indexthissubsetwithTimean

python - 子集 Python DataFrame

我正在从R过渡到Python。我刚开始使用Pandas。我有一个很好的子集的R代码:k1现在,我想在Python中做类似的事情。这是我到目前为止所得到的:importpandasaspddata=pd.read_csv("../data/monthly_prod_sales.csv")#first,indexthedatasetbyProduct.And,getallthatmatchesagiven'p.id'andtime.data.set_index('Product')k=data.ix[[p.id,'Time']]#then,indexthissubsetwithTimean

python - 如何将 PySpark 中的表数据框导出到 csv?

我使用的是Spark1.3.1(PySpark),并且我使用SQL查询生成了一个表。我现在有一个对象是DataFrame。我想将这个DataFrame对象(我称之为“表”)导出到一个csv文件,以便我可以操作它并绘制列。如何将DataFrame“表”导出到csv文件?谢谢! 最佳答案 如果数据帧适合驱动程序内存并且您想保存到本地文件系统,您可以转换SparkDataFrame本地PandasDataFrame使用toPandas方法,然后简单地使用to_csv:df.toPandas().to_csv('mycsv.csv')否则你

python - 如何将 PySpark 中的表数据框导出到 csv?

我使用的是Spark1.3.1(PySpark),并且我使用SQL查询生成了一个表。我现在有一个对象是DataFrame。我想将这个DataFrame对象(我称之为“表”)导出到一个csv文件,以便我可以操作它并绘制列。如何将DataFrame“表”导出到csv文件?谢谢! 最佳答案 如果数据帧适合驱动程序内存并且您想保存到本地文件系统,您可以转换SparkDataFrame本地PandasDataFrame使用toPandas方法,然后简单地使用to_csv:df.toPandas().to_csv('mycsv.csv')否则你