草庐IT

pyspark-dataframes

全部标签

python - 在 DataFrame pandas 中添加日期之间的天数列

我想从'B'中的日期中减去'A'中的日期,然后添加一个带有差异的新列。dfABone2014-01-012014-02-28two2014-02-032014-03-01我尝试了以下方法,但是当我尝试将其包含在for循环中时出现错误...importdatetimedate1=df['A'][0]date2=df['B'][0]mdate1=datetime.datetime.strptime(date1,"%Y-%m-%d").date()rdate1=datetime.datetime.strptime(date2,"%Y-%m-%d").date()delta=(mdate1-r

python - 在 DataFrame pandas 中添加日期之间的天数列

我想从'B'中的日期中减去'A'中的日期,然后添加一个带有差异的新列。dfABone2014-01-012014-02-28two2014-02-032014-03-01我尝试了以下方法,但是当我尝试将其包含在for循环中时出现错误...importdatetimedate1=df['A'][0]date2=df['B'][0]mdate1=datetime.datetime.strptime(date1,"%Y-%m-%d").date()rdate1=datetime.datetime.strptime(date2,"%Y-%m-%d").date()delta=(mdate1-r

python - 如何将 DataFrame 写入 postgres 表

有DataFrame.to_sql方法,但它只适用于mysql、sqlite和oracle数据库。我无法将这种方法传递给postgres连接或sqlalchemy引擎。 最佳答案 从pandas0.14(2014年5月末发布)开始,支持postgresql。sql模块现在使用sqlalchemy来支持不同的数据库风格。您可以为postgresql数据库传递sqlalchemy引擎(参见docs)。例如:fromsqlalchemyimportcreate_engineengine=create_engine('postgresql:

python - 如何将 DataFrame 写入 postgres 表

有DataFrame.to_sql方法,但它只适用于mysql、sqlite和oracle数据库。我无法将这种方法传递给postgres连接或sqlalchemy引擎。 最佳答案 从pandas0.14(2014年5月末发布)开始,支持postgresql。sql模块现在使用sqlalchemy来支持不同的数据库风格。您可以为postgresql数据库传递sqlalchemy引擎(参见docs)。例如:fromsqlalchemyimportcreate_engineengine=create_engine('postgresql:

python - 如何将具有 dtype 的列作为对象转换为 Pandas Dataframe 中的字符串

这个问题在这里已经有了答案:Pandas:changedatatypeofSeriestoString(11个回答)关闭3年前.当我将csv文件读取到pandas数据框时,每列都会转换为自己的数据类型。我有一列已转换为对象。我想为此列执行字符串操作,例如拆分值和创建列表。但是这样的操作是不可能的,因为它的dtype是object。谁能告诉我如何将列的所有项目转换为字符串而不是对象?我尝试了几种方法,但都没有奏效。我使用了astype、str()、to_string等。a=lambdax:str(x).split(',')df['column'].apply(a)或df['column'

python - 如何将具有 dtype 的列作为对象转换为 Pandas Dataframe 中的字符串

这个问题在这里已经有了答案:Pandas:changedatatypeofSeriestoString(11个回答)关闭3年前.当我将csv文件读取到pandas数据框时,每列都会转换为自己的数据类型。我有一列已转换为对象。我想为此列执行字符串操作,例如拆分值和创建列表。但是这样的操作是不可能的,因为它的dtype是object。谁能告诉我如何将列的所有项目转换为字符串而不是对象?我尝试了几种方法,但都没有奏效。我使用了astype、str()、to_string等。a=lambdax:str(x).split(',')df['column'].apply(a)或df['column'

python - 将 DataFrame 列表保存到多表 Excel 电子表格

如何将DataFrame列表导出到一个Excel电子表格中?to_excel的文档状态:NotesIfpassinganexistingExcelWriterobject,thenthesheetwillbeaddedtotheexistingworkbook.ThiscanbeusedtosavedifferentDataFramestooneworkbookwriter=ExcelWriter('output.xlsx')df1.to_excel(writer,'sheet1')df2.to_excel(writer,'sheet2')writer.save()在此之后,我想我可以

python - 将 DataFrame 列表保存到多表 Excel 电子表格

如何将DataFrame列表导出到一个Excel电子表格中?to_excel的文档状态:NotesIfpassinganexistingExcelWriterobject,thenthesheetwillbeaddedtotheexistingworkbook.ThiscanbeusedtosavedifferentDataFramestooneworkbookwriter=ExcelWriter('output.xlsx')df1.to_excel(writer,'sheet1')df2.to_excel(writer,'sheet2')writer.save()在此之后,我想我可以

python - 如何在pandas DataFrame中选择名称以X开头的所有列

我有一个数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'foo.aa':[1,2.1,np.nan,4.7,5.6,6.8],'foo.fighters':[0,1,np.nan,0,0,0],'foo.bars':[0,0,0,0,0,1],'bar.baz':[5,5,6,5,5.6,6.8],'foo.fox':[2,4,1,0,0,5],'nas.foo':['NA',0,1,0,0,0],'foo.manchu':['NA',0,0,0,0,0],})我想在以foo.开头的列中选择值1。除了:之外,还有没有更好的方法来

python - 如何在pandas DataFrame中选择名称以X开头的所有列

我有一个数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'foo.aa':[1,2.1,np.nan,4.7,5.6,6.8],'foo.fighters':[0,1,np.nan,0,0,0],'foo.bars':[0,0,0,0,0,1],'bar.baz':[5,5,6,5,5.6,6.8],'foo.fox':[2,4,1,0,0,5],'nas.foo':['NA',0,1,0,0,0],'foo.manchu':['NA',0,0,0,0,0],})我想在以foo.开头的列中选择值1。除了:之外,还有没有更好的方法来