dataframe_草庐IT

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame？我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

python - 向 pandas DataFrame 添加多个空列

如何将多个空列添加到列表中的DataFrame？我能做到:df["B"]=Nonedf["C"]=Nonedf["D"]=None但我做不到:df[["B","C","D"]]=NoneKeyError:"['B''C''D']notinindex" 最佳答案您可以使用df.reindex添加新列:In[18]:df=pd.DataFrame(np.random.randint(10,size=(5,1)),columns=['A'])In[19]:dfOut[19]:A0417203746In[20]:df.reindex(co

DataFrame python NaN code section pandas

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因，当我运行此代码时，Value列下的所有行都是正数，而某些行应该是负数。在DataFrame的Action列下，有七行带有'Sell'字符串，七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

相乘并将 code orders_df section python python-2.7 pandas

python - 我想将 pandas DataFrame 中的两列相乘并将结果添加到新列中

我正在尝试将pandasDataframe(orders_df)中的两个现有列相乘:Prices(股票收盘价)和Amount(库存数量)并将计算添加到名为Value的新列中。出于某种原因，当我运行此代码时，Value列下的所有行都是正数，而某些行应该是负数。在DataFrame的Action列下，有七行带有'Sell'字符串，七行带有'Buy'字符串。foriinorders_df.Action:ifi=='Sell':orders_df['Value']=orders_df.Prices*orders_df.Amountelifi=='Buy':orders_df['Value']=

相乘并将 code orders_df section python python-2.7 pandas

Python:根据 Pandas 数据框中某些行出现的两列(变量)获取频率计数

您好，我有以下数据框。GroupSizeShortSmallShortSmallModerateMediumModerateSmallTallLarge我想计算同一行在数据框中出现的频率。GroupSizeTimeShortSmall2ModerateMedium1ModerateSmall1TallLarge1 最佳答案您可以使用groupby的size:In[11]:df.groupby(["Group","Size"]).size()Out[11]:GroupSizeModerateMedium1Small1ShortSma

Python Pandas section Moderate Small group-by dataframe

Python:根据 Pandas 数据框中某些行出现的两列(变量)获取频率计数

您好，我有以下数据框。GroupSizeShortSmallShortSmallModerateMediumModerateSmallTallLarge我想计算同一行在数据框中出现的频率。GroupSizeTimeShortSmall2ModerateMedium1ModerateSmall1TallLarge1 最佳答案您可以使用groupby的size:In[11]:df.groupby(["Group","Size"]).size()Out[11]:GroupSizeModerateMedium1Small1ShortSma

Python Pandas section Moderate Small group-by dataframe

python - 子集 Python DataFrame

我正在从R过渡到Python。我刚开始使用Pandas。我有一个很好的子集的R代码:k1现在，我想在Python中做类似的事情。这是我到目前为止所得到的:importpandasaspddata=pd.read_csv("../data/monthly_prod_sales.csv")#first,indexthedatasetbyProduct.And,getallthatmatchesagiven'p.id'andtime.data.set_index('Product')k=data.ix[[p.id,'Time']]#then,indexthissubsetwithTimean

DataFrame python code Product 运算符 pandas subset

python - 子集 Python DataFrame

我正在从R过渡到Python。我刚开始使用Pandas。我有一个很好的子集的R代码:k1现在，我想在Python中做类似的事情。这是我到目前为止所得到的:importpandasaspddata=pd.read_csv("../data/monthly_prod_sales.csv")#first,indexthedatasetbyProduct.And,getallthatmatchesagiven'p.id'andtime.data.set_index('Product')k=data.ix[[p.id,'Time']]#then,indexthissubsetwithTimean

DataFrame python code Product 运算符 pandas subset

python - 如何将 PySpark 中的表数据框导出到 csv？

我使用的是Spark1.3.1(PySpark)，并且我使用SQL查询生成了一个表。我现在有一个对象是DataFrame。我想将这个DataFrame对象(我称之为“表”)导出到一个csv文件，以便我可以操作它并绘制列。如何将DataFrame“表”导出到csv文件？谢谢! 最佳答案如果数据帧适合驱动程序内存并且您想保存到本地文件系统，您可以转换SparkDataFrame本地PandasDataFrame使用toPandas方法，然后简单地使用to_csv:df.toPandas().to_csv('mycsv.csv')否则你

PySpark python code csv section apache-spark dataframe apache-spark-sql export-to-csv

python - 如何将 PySpark 中的表数据框导出到 csv？

我使用的是Spark1.3.1(PySpark)，并且我使用SQL查询生成了一个表。我现在有一个对象是DataFrame。我想将这个DataFrame对象(我称之为“表”)导出到一个csv文件，以便我可以操作它并绘制列。如何将DataFrame“表”导出到csv文件？谢谢! 最佳答案如果数据帧适合驱动程序内存并且您想保存到本地文件系统，您可以转换SparkDataFrame本地PandasDataFrame使用toPandas方法，然后简单地使用to_csv:df.toPandas().to_csv('mycsv.csv')否则你

PySpark python code csv section apache-spark dataframe apache-spark-sql export-to-csv