草庐IT

OpenCSVSerde

全部标签

java - 使用 aws athena 解析 CSV

我正在使用来自Java代码的AWSathena解析csv文件。csv中有些列是日期类型,其中一列的值有逗号。如果雅典娜表是用行格式SERDE'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'那么就无法正确解析带逗号的列但是如果我使用它会正确解析行格式SERDE'org.apache.hadoop.hive.serde2.OpenCSVSerde'但是OpenCSVSerde的问题是它要求所有列都是字符串数据类型,我需要在查询中执行日期操作,所以不能使用OpenCSVSerde.还有其他解决方案吗?请帮忙!

hadoop - 当我在 Hive 中使用 OpenCSVSerde 时,为什么所有列都创建为字符串?

我正在尝试使用OpenCSVSerde和一些整数和日期列创建一个表。但是列被转换为字符串。这是预期的结果吗?作为一种解决方法,我在此步骤之后进行了显式类型转换(这使得整个运行速度变慢)hive>createexternaltableifnotexistsresponse(response_idint,lead_idint,creat_datedate)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSerde'WITHSERDEPROPERTIES('quoteChar'='"','separatorChar'='\,','ser