panda_草庐IT

python - Pandas :无法写入 excel 文件

尝试来自documentation的这个例子writer=ExcelWriter('output.xlsx')df1.to_excel(writer,'Sheet1')df2.to_excel(writer,'Sheet2')writer.save()我发现我无法写入错误的excel文件TypeError:copy()gotanunexpectedkeywordargument'font'我在Macpro上使用Panda0.16。编辑:写入xls文件工作得很好。我并不坚持要有一个xlsx文件，只是想知道为什么它不起作用。最佳答案

Python Pandas Dataframe 按组中的最大值选择行

我有一个通过df.pivot创建的数据框:typestartendF_Typeto_dateA20150908143000345316B20150908140300NaN48020150908140600NaN12020150908143000107438803C20150908140100NaN171520150908140200NaN106220150908141000NaN14520150908141500418NaN20150908141800NaN4502015090814290019731499201509081430001952216659D201509081430004

Dataframe Python 20150908143000 code idxmax pandas

python Pandas : remove everything after a delimiter in a string

我有数据框，其中包含例如:"vendora::ProductA""vendorb::ProductA""vendora::Productb"我需要删除所有内容(包括)这两个::以便我最终得到:"vendora""vendorb""vendora"我尝试了str.trim(似乎不存在)和str.split，但没有成功。完成此任务的最简单方法是什么？最佳答案您可以像正常使用split一样使用pandas.Series.str.split。只需拆分字符串'::'，并索引从split方法创建的列表:>>>df=pd.DataFrame(

everything delimiter vendor ProductA code python python-3.x pandas

python - Pandas DataFrame 将多个列值堆叠到单个列中

假设以下DataFrame:key.0key.1key.2topic1abcdefghi82xabxcdxef9如何将所有key.*列的值组合成一个“key”列，该列与对应于key.*列的主题值相关联？这是我想要的结果:topickey18abc28def38ghi49xab59xcd69xef请注意，key.N列的数量在某些外部N上是可变的。最佳答案你可以融化你的数据框:>>>keys=[cforcindfifc.startswith('key.')]>>>pd.melt(df,id_vars='topic',value_va

堆叠 DataFrame key code section python pandas melt

python - Panda 的 DataFrame - 重命名多个同名列

我在df中有几个名称相同的列。我需要重命名它们，但问题是df.rename方法以相同的方式重命名它们。如何将以下blah(s)重命名为blah1、blah4、blah5？df=pd.DataFrame(np.arange(2*5).reshape(2,5))df.columns=['blah','blah2','blah3','blah','blah']df#blahblah2blah3blahblah#001234#156789这是使用df.rename方法时发生的情况:df.rename(columns={'blah':'blah1'})#blah1blah2blah3blah1b

名列 DataFrame blah names code python pandas

python - Pandas - 根据索引替换值

如果我像这样创建一个数据框:importpandasaspd,numpyasnpdf=pd.DataFrame(np.random.randint(0,100,size=(100,2)),columns=list('AB'))例如，如何将A列中的条目更改为第0-15行中的数字16？换句话说，如何完全根据索引替换单元格？最佳答案使用loc:df.loc[0:15,'A']=16print(df)AB0164511652169731658416265168761651716178163991673101694111669121657

python Pandas section 16 code numpy replace dataframe

python - 具有分级范围的 Pandas 条形图

有没有办法根据分箱到预定义区间的连续数据创建条形图？例如，In[1]:dfOut[1]:00.72963010.69962020.71052630.00000040.83132550.94531260.66542870.87184580.84814890.262500100.694030110.503759120.985437130.576271140.819742150.957627160.814394170.944649180.911111190.113333200.585821210.930131220.347222230.000000240.987805250.95057026

条形 python code section pandas histogram bar-chart

python - 从 Python (pandas) 的日期列中获取周开始日期(星期一)？

我看过很多关于如何使用日期字符串进行操作的帖子，但我正在为数据框列尝试一些操作，但到目前为止还没有成功。我目前的方法是:从“myday”获取工作日，然后偏移以获得星期一。df['myday']iscolumnofdates.mydays=pd.DatetimeIndex(df['myday']).weekdaydf['week_start']=pd.DatetimeIndex(df['myday'])-pd.DateOffset(days=mydays)但是我明白了类型错误:timedeltadays组件不支持的类型:numpy.ndarray如何从df列中获取周开始日期？

星期一 python section 39 myday date numpy pandas

python - 在 pandas timedelta 列上拆分应用组合

我有一个带有timedeltas列的DataFrame(实际上经过检查dtype是timedelta64[ns]或)，我想做一个拆分-组合-应用，但是timedelta列被删除了:importpandasaspdimportnumpyasnppd.__version__Out[3]:'0.13.0rc1'np.__version__Out[4]:'1.8.0'data=pd.DataFrame(np.random.rand(10,3),columns=['f1','f2','td'])data['td']*=10000000data['td']=pd.Series(data['td']

timedelta python 39 00 code pandas

python - Pandas 的性能问题和日期时间列的过滤

我有一个pandas数据框，其中一列上有一个datetime64对象。timevolumecompletecloseBidcloseAskopenBidopenAskhighBidhighAsklowBidlowAskcloseMid02016-08-0721:00:00+00:009True0.847340.848420.847060.848140.847340.848420.847060.848140.8478812016-08-0721:05:00+00:0010True0.847350.848410.847520.848320.847520.848460.847120.8482

python Pandas 00 2016 code numpy dataframe