尝试来自documentation的这个例子writer=ExcelWriter('output.xlsx')df1.to_excel(writer,'Sheet1')df2.to_excel(writer,'Sheet2')writer.save()我发现我无法写入错误的excel文件TypeError:copy()gotanunexpectedkeywordargument'font'我在Macpro上使用Panda0.16。编辑:写入xls文件工作得很好。我并不坚持要有一个xlsx文件,只是想知道为什么它不起作用。 最佳答案
我有一个通过df.pivot创建的数据框:typestartendF_Typeto_dateA20150908143000345316B20150908140300NaN48020150908140600NaN12020150908143000107438803C20150908140100NaN171520150908140200NaN106220150908141000NaN14520150908141500418NaN20150908141800NaN4502015090814290019731499201509081430001952216659D201509081430004
我有数据框,其中包含例如:"vendora::ProductA""vendorb::ProductA""vendora::Productb"我需要删除所有内容(包括)这两个::以便我最终得到:"vendora""vendorb""vendora"我尝试了str.trim(似乎不存在)和str.split,但没有成功。完成此任务的最简单方法是什么? 最佳答案 您可以像正常使用split一样使用pandas.Series.str.split。只需拆分字符串'::',并索引从split方法创建的列表:>>>df=pd.DataFrame(
假设以下DataFrame:key.0key.1key.2topic1abcdefghi82xabxcdxef9如何将所有key.*列的值组合成一个“key”列,该列与对应于key.*列的主题值相关联?这是我想要的结果:topickey18abc28def38ghi49xab59xcd69xef请注意,key.N列的数量在某些外部N上是可变的。 最佳答案 你可以融化你的数据框:>>>keys=[cforcindfifc.startswith('key.')]>>>pd.melt(df,id_vars='topic',value_va
我在df中有几个名称相同的列。我需要重命名它们,但问题是df.rename方法以相同的方式重命名它们。如何将以下blah(s)重命名为blah1、blah4、blah5?df=pd.DataFrame(np.arange(2*5).reshape(2,5))df.columns=['blah','blah2','blah3','blah','blah']df#blahblah2blah3blahblah#001234#156789这是使用df.rename方法时发生的情况:df.rename(columns={'blah':'blah1'})#blah1blah2blah3blah1b
如果我像这样创建一个数据框:importpandasaspd,numpyasnpdf=pd.DataFrame(np.random.randint(0,100,size=(100,2)),columns=list('AB'))例如,如何将A列中的条目更改为第0-15行中的数字16?换句话说,如何完全根据索引替换单元格? 最佳答案 使用loc:df.loc[0:15,'A']=16print(df)AB0164511652169731658416265168761651716178163991673101694111669121657
有没有办法根据分箱到预定义区间的连续数据创建条形图?例如,In[1]:dfOut[1]:00.72963010.69962020.71052630.00000040.83132550.94531260.66542870.87184580.84814890.262500100.694030110.503759120.985437130.576271140.819742150.957627160.814394170.944649180.911111190.113333200.585821210.930131220.347222230.000000240.987805250.95057026
我看过很多关于如何使用日期字符串进行操作的帖子,但我正在为数据框列尝试一些操作,但到目前为止还没有成功。我目前的方法是:从“myday”获取工作日,然后偏移以获得星期一。df['myday']iscolumnofdates.mydays=pd.DatetimeIndex(df['myday']).weekdaydf['week_start']=pd.DatetimeIndex(df['myday'])-pd.DateOffset(days=mydays)但是我明白了类型错误:timedeltadays组件不支持的类型:numpy.ndarray如何从df列中获取周开始日期?
我有一个带有timedeltas列的DataFrame(实际上经过检查dtype是timedelta64[ns]或),我想做一个拆分-组合-应用,但是timedelta列被删除了:importpandasaspdimportnumpyasnppd.__version__Out[3]:'0.13.0rc1'np.__version__Out[4]:'1.8.0'data=pd.DataFrame(np.random.rand(10,3),columns=['f1','f2','td'])data['td']*=10000000data['td']=pd.Series(data['td']
我有一个pandas数据框,其中一列上有一个datetime64对象。timevolumecompletecloseBidcloseAskopenBidopenAskhighBidhighAsklowBidlowAskcloseMid02016-08-0721:00:00+00:009True0.847340.848420.847060.848140.847340.848420.847060.848140.8478812016-08-0721:05:00+00:0010True0.847350.848410.847520.848320.847520.848460.847120.8482