草庐IT

Dataframe

全部标签

python - 将 CSV 加载到 Pandas MultiIndex DataFrame

我有一个719mb的CSV文件,看起来像:from,to,dep,freq,arr,code,mode(headerrow)RGBOXFD,RGBPADTON,127,0,27,99999,2RGBOXFD,RGBPADTON,127,0,33,99999,2RGBOXFD,RGBRDLEY,127,0,1425,99999,2RGBOXFD,RGBCHOLSEY,127,0,52,99999,2RGBOXFD,RGBMDNHEAD,127,0,91,99999,2RGBDIDCOTP,RGBPADTON,127,0,46,99999,2RGBDIDCOTP,RGBPADTON,127

python - 将 CSV 加载到 Pandas MultiIndex DataFrame

我有一个719mb的CSV文件,看起来像:from,to,dep,freq,arr,code,mode(headerrow)RGBOXFD,RGBPADTON,127,0,27,99999,2RGBOXFD,RGBPADTON,127,0,33,99999,2RGBOXFD,RGBRDLEY,127,0,1425,99999,2RGBOXFD,RGBCHOLSEY,127,0,52,99999,2RGBOXFD,RGBMDNHEAD,127,0,91,99999,2RGBDIDCOTP,RGBPADTON,127,0,46,99999,2RGBDIDCOTP,RGBPADTON,127

python - 按绝对值排序而不更改数据

我正在寻找一种简单的方法来按特定列的绝对值对pandas数据帧进行排序,但实际上不会更改数据帧中的值。类似于sorted(df,key=abs)的东西。所以如果我有一个像这样的数据框:ab01-312523-134245-9在“b”上排序时得到的排序数据如下所示:ab23-134201-312545-9 最佳答案 更新自从0.17.0order和sort已被弃用(感谢@RuggeroTurra),您现在可以使用sort_values来实现:In[16]:df.reindex(df.b.abs().sort_values().inde

python - 按绝对值排序而不更改数据

我正在寻找一种简单的方法来按特定列的绝对值对pandas数据帧进行排序,但实际上不会更改数据帧中的值。类似于sorted(df,key=abs)的东西。所以如果我有一个像这样的数据框:ab01-312523-134245-9在“b”上排序时得到的排序数据如下所示:ab23-134201-312545-9 最佳答案 更新自从0.17.0order和sort已被弃用(感谢@RuggeroTurra),您现在可以使用sort_values来实现:In[16]:df.reindex(df.b.abs().sort_values().inde

Python - 根据列值将数据框拆分为多个数据框并用这些值命名它们

这个问题在这里已经有了答案:Splittingdataframeintomultipledataframes(13个回答)关闭6年前。我有一个大型数据集,列出了在全国不同地区销售的竞争对手产品。我希望通过使用这些新数据帧名称中的列值的迭代过程,根据区域将该数据帧拆分为其他几个数据帧,以便我可以单独处理每个数据帧-例如按价格对每个地区的信息进行分类,以了解每个地区的市场情况。我给出了以下数据的简化版本:CompetitorRegionProductAProductBComp1A£10£15Comp1B£11£16Comp1C£11£15Comp2A£9£16Comp2B£12£14Com

Python - 根据列值将数据框拆分为多个数据框并用这些值命名它们

这个问题在这里已经有了答案:Splittingdataframeintomultipledataframes(13个回答)关闭6年前。我有一个大型数据集,列出了在全国不同地区销售的竞争对手产品。我希望通过使用这些新数据帧名称中的列值的迭代过程,根据区域将该数据帧拆分为其他几个数据帧,以便我可以单独处理每个数据帧-例如按价格对每个地区的信息进行分类,以了解每个地区的市场情况。我给出了以下数据的简化版本:CompetitorRegionProductAProductBComp1A£10£15Comp1B£11£16Comp1C£11£15Comp2A£9£16Comp2B£12£14Com

python - 总结每天 Pandas 的出现次数

我在pandas数据框中有这样的数据集:scoretimestamp2013-06-2900:52:28+00:00-0.4200702013-06-2900:51:53+00:00-0.4457202013-06-2816:40:43+00:000.5081612013-06-2815:10:30+00:000.9214742013-06-2815:10:17+00:000.876710我需要计算发生的测量次数,所以我正在寻找这样的东西:counttimestamp2013-06-2922013-06-283我不关心情绪列,我想要每天出现的次数。 最佳答案

python - 总结每天 Pandas 的出现次数

我在pandas数据框中有这样的数据集:scoretimestamp2013-06-2900:52:28+00:00-0.4200702013-06-2900:51:53+00:00-0.4457202013-06-2816:40:43+00:000.5081612013-06-2815:10:30+00:000.9214742013-06-2815:10:17+00:000.876710我需要计算发生的测量次数,所以我正在寻找这样的东西:counttimestamp2013-06-2922013-06-283我不关心情绪列,我想要每天出现的次数。 最佳答案

python - 操作系统错误 : Initializing from file failed on csv in Pandas

到目前为止,pandas读取了我所有的CSV文件没有任何问题,但是现在似乎有问题..做的时候:df=pd.read_csv(r'pathtofile',sep=';')我明白了:OSErrorTraceback(mostrecentcalllast)in()---->1df=pd.read_csv(r'pathÜbersicht\Input\test\test.csv',sep=';')c:\programfiles\python36\lib\site-packages\pandas\io\parsers.pyinparser_f(filepath_or_buffer,sep,deli

python - 操作系统错误 : Initializing from file failed on csv in Pandas

到目前为止,pandas读取了我所有的CSV文件没有任何问题,但是现在似乎有问题..做的时候:df=pd.read_csv(r'pathtofile',sep=';')我明白了:OSErrorTraceback(mostrecentcalllast)in()---->1df=pd.read_csv(r'pathÜbersicht\Input\test\test.csv',sep=';')c:\programfiles\python36\lib\site-packages\pandas\io\parsers.pyinparser_f(filepath_or_buffer,sep,deli