草庐IT

Dataframe

全部标签

python - 如何将具有 dtype 的列作为对象转换为 Pandas Dataframe 中的字符串

这个问题在这里已经有了答案:Pandas:changedatatypeofSeriestoString(11个回答)关闭3年前.当我将csv文件读取到pandas数据框时,每列都会转换为自己的数据类型。我有一列已转换为对象。我想为此列执行字符串操作,例如拆分值和创建列表。但是这样的操作是不可能的,因为它的dtype是object。谁能告诉我如何将列的所有项目转换为字符串而不是对象?我尝试了几种方法,但都没有奏效。我使用了astype、str()、to_string等。a=lambdax:str(x).split(',')df['column'].apply(a)或df['column'

python - Pandas 'Freq' 标签中的有效值是什么?

我是Pandas的新手,正在尝试使用date_range。我遇到了freq的各种好东西,例如BME和BMS,我希望能够快速查找正确的字符串得到我想要的。昨天我在文档的某个地方找到了一个格式很好的表格,但是表格的标题太迟钝了,我今天无法使用搜索再次找到它。什么值在Pandas'Freq'标签中是有效的? 最佳答案 你可以找到它叫OffsetAliases:Anumberofstringaliasesaregiventousefulcommontimeseriesfrequencies.Wewillrefertothesealiases

python - Pandas 'Freq' 标签中的有效值是什么?

我是Pandas的新手,正在尝试使用date_range。我遇到了freq的各种好东西,例如BME和BMS,我希望能够快速查找正确的字符串得到我想要的。昨天我在文档的某个地方找到了一个格式很好的表格,但是表格的标题太迟钝了,我今天无法使用搜索再次找到它。什么值在Pandas'Freq'标签中是有效的? 最佳答案 你可以找到它叫OffsetAliases:Anumberofstringaliasesaregiventousefulcommontimeseriesfrequencies.Wewillrefertothesealiases

python - 将 DataFrame 列表保存到多表 Excel 电子表格

如何将DataFrame列表导出到一个Excel电子表格中?to_excel的文档状态:NotesIfpassinganexistingExcelWriterobject,thenthesheetwillbeaddedtotheexistingworkbook.ThiscanbeusedtosavedifferentDataFramestooneworkbookwriter=ExcelWriter('output.xlsx')df1.to_excel(writer,'sheet1')df2.to_excel(writer,'sheet2')writer.save()在此之后,我想我可以

python - 将 DataFrame 列表保存到多表 Excel 电子表格

如何将DataFrame列表导出到一个Excel电子表格中?to_excel的文档状态:NotesIfpassinganexistingExcelWriterobject,thenthesheetwillbeaddedtotheexistingworkbook.ThiscanbeusedtosavedifferentDataFramestooneworkbookwriter=ExcelWriter('output.xlsx')df1.to_excel(writer,'sheet1')df2.to_excel(writer,'sheet2')writer.save()在此之后,我想我可以

python - 如何在pandas DataFrame中选择名称以X开头的所有列

我有一个数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'foo.aa':[1,2.1,np.nan,4.7,5.6,6.8],'foo.fighters':[0,1,np.nan,0,0,0],'foo.bars':[0,0,0,0,0,1],'bar.baz':[5,5,6,5,5.6,6.8],'foo.fox':[2,4,1,0,0,5],'nas.foo':['NA',0,1,0,0,0],'foo.manchu':['NA',0,0,0,0,0],})我想在以foo.开头的列中选择值1。除了:之外,还有没有更好的方法来

python - 如何在pandas DataFrame中选择名称以X开头的所有列

我有一个数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'foo.aa':[1,2.1,np.nan,4.7,5.6,6.8],'foo.fighters':[0,1,np.nan,0,0,0],'foo.bars':[0,0,0,0,0,1],'bar.baz':[5,5,6,5,5.6,6.8],'foo.fox':[2,4,1,0,0,5],'nas.foo':['NA',0,1,0,0,0],'foo.manchu':['NA',0,0,0,0,0],})我想在以foo.开头的列中选择值1。除了:之外,还有没有更好的方法来

python - 如何在非唯一列中按日期对 Pandas DataFrame 条目进行分组

PandasDataFrame包含名为"date"的列,其中包含非唯一的datetime值。我可以使用以下方法对该框架中的行进行分组:data.groupby(data['date'])但是,这会按datetime值拆分数据。我想按存储在“日期”列中的年份对这些数据进行分组。Thispage展示了在时间戳用作索引的情况下如何按年份分组,这在我的情况下不正确。如何实现这种分组? 最佳答案 我正在使用Pandas0.16.2。这在我的大型数据集上具有更好的性能:data.groupby(data.date.dt.year)使用dt选项并

python - 如何在非唯一列中按日期对 Pandas DataFrame 条目进行分组

PandasDataFrame包含名为"date"的列,其中包含非唯一的datetime值。我可以使用以下方法对该框架中的行进行分组:data.groupby(data['date'])但是,这会按datetime值拆分数据。我想按存储在“日期”列中的年份对这些数据进行分组。Thispage展示了在时间戳用作索引的情况下如何按年份分组,这在我的情况下不正确。如何实现这种分组? 最佳答案 我正在使用Pandas0.16.2。这在我的大型数据集上具有更好的性能:data.groupby(data.date.dt.year)使用dt选项并

python - 将 spark DataFrame 列转换为 python 列表

我处理具有两列mvv和count的数据框。+---+-----+|mvv|count|+---+-----+|1|5||2|9||3|3||4|1|我想获得两个包含mvv值和计数值的列表。类似的东西mvv=[1,2,3,4]count=[5,9,3,1]所以,我尝试了以下代码:第一行应该返回一个python行列表。我想查看第一个值:mvv_list=mvv_count_df.select('mvv').collect()firstvalue=mvv_list[0].getInt(0)但我收到第二行的错误消息:AttributeError:getInt 最佳答