草庐IT

datetime_column

全部标签

python - TypeError: must be string, not datetime.datetime 使用strptime时

我正在尝试在Python2.7中编写一个函数,将一系列数字转换为有效日期。到目前为止,这一切都与转换无关。相关代码如下:importdatetimedefconvert_date(x,y,z):orig_date=datetime.datetime(x,y,z)d=datetime.datetime.strptime(str(orig_date),'%Y-%m-%d%H:%M:%S')result=d.strftime('%m-%d-%Y')returnorig_datea=convert_date(13,11,12)printa每当我运行它时,我都会得到:>Traceback(mos

python - Pandas to_datetime 解析错误的年份

我遇到了一些几乎可以肯定是我的愚蠢错误的事情,但我似乎无法弄清楚发生了什么。本质上,我有一系列日期作为字符串,格式为"%d-%b-%y",例如26-Sep-05。当我将它们转换为日期时间时,年份有时是正确的,但有时不是。例如:dates=['26-Sep-05','26-Sep-05','15-Jun-70','5-Dec-94','9-Jan-61','8-Feb-55']pd.to_datetime(dates,format="%d-%b-%y")DatetimeIndex(['2005-09-26','2005-09-26','1970-06-15','1994-12-05','

python - datetime.datetime 不是 JSON 可序列化的

这个问题在这里已经有了答案:Howtoovercome"datetime.datetimenotJSONserializable"?(34个答案)关闭6年前。我有一个Python类,用于检索表中的所有列并返回包含此数据的JSON。问题是这些列中至少有一个是日期时间,我似乎无法理解如何序列化这些列以便生成有效的JSON。我的类如下:classGetTodos(Resource):defget(self):con=cx_Oracle.connect('brunojs/bdpf5@127.0.0.1/orcl')cur=con.cursor()cur.execute("select*from

python - 更改 pandas datetime64 列的时间组件

我有一个可以简化为的数据框:dateid002/04/201502:341106/04/201512:342209/04/201523:033312/04/201501:004415/04/201507:125521/04/201512:596629/04/201517:337704/05/201510:448806/05/201511:129910/05/201508:52101012/05/201514:19111119/05/201519:22121227/05/201522:31131301/06/201511:09141404/06/201512:57151510/06/20

python - 如何强制使用指定时区的 python 打印 numpy datetime64?

我想按我指定的时区查看numpydatetime64对象。>>>importnumpyasnp>>>np.datetime64('2013-03-10T01:30:54')numpy.datetime64('2013-03-10T01:30:54+0400')>>>np.datetime64('2013-03-10T01:30:54+0300')numpy.datetime64('2013-03-10T02:30:54+0400')Python始终以UTC+0400(这是我的本地时区)打印日期时间对象,即使我指定了另一个时区>>>np.datetime64('2013-03-10T01

python - Pandas 数据框 : Group by two columns and then average over another column

假设我有一个具有以下值的数据框:df:col1col2value123121231我想首先根据前两列(col1和col2)对我的数据框进行分组,然后对第三列(值)的值进行平均。所以所需的输出将如下所示:col1col2avg-value122231我正在使用以下代码:columns=['col1','col2','avg']df=pd.DataFrame(columns=columns)df.loc[0]=[1,2,3]df.loc[1]=[1,3,3]print(df[['col1','col2','avg']].groupby('col1','col2').mean())出现以下错

python - Pandas 多索引 : Divide all columns by one column

我有一个数据框results的形式TOTEXPPQTOTEXPCQFINLWT21yearquarter1319.183392e+095.459961e+091271559.39822.907887e+091.834126e+09481169.672我试图将所有(前两列)除以最后一列。我的尝试是weights=results.pop('FINLWT21')results/weights但是我明白了ValueError:cannotjoinwithnolevelspecifiedandnooverlappingnames我不明白:索引中有重叠的名称:weights.head()yearq

python - numpy 中的 "Got 1 columns instead of ..."错误

我正在编写以下代码,用于对训练集和测试集执行随机森林分类;fromsklearn.ensembleimportRandomForestClassifierfromnumpyimportgenfromtxt,savetxtdefmain():dataset=genfromtxt(open('filepath','r'),delimiter='',dtype='f8')target=[x[0]forxindataset]train=[x[1:]forxindataset]test=genfromtxt(open('filepath','r'),delimiter='',dtype='f8'

python - 断言错误 : col should be Column

如何在PySpark中创建一个新列并用今天的日期填充此列?这是我尝试过的:importdatetimenow=datetime.datetime.now()df=df.withColumn("date",str(now)[:10])我收到这个错误:AssertionError:colshouldbeColumn 最佳答案 HowtocreateanewcolumninPySparkandfillthiscolumnwiththedateoftoday?已经有这个功能了:frompyspark.sql.functionsimportc

python - dask 数据框如何将列转换为 to_datetime

我正在尝试将我的数据框的一列转换为日期时间。在此处进行讨论https://github.com/dask/dask/issues/863我尝试了以下代码:importdask.dataframeasdddf['time'].map_partitions(pd.to_datetime,columns='time').compute()但是我收到以下错误信息ValueError:Metadatainferencefailed,pleaseprovide`meta`keyword我到底应该把什么放在meta下?我应该将所有列的字典放在df中还是只放在“时间”列中?我应该放什么类型的?我已经尝