草庐IT

convert_encoding

全部标签

oracle - Sqoop 导入失败 : Cannot convert SQL type 2005 when trying to import Oracle table

尝试将Oracle数据库中的表作为parquet文件导入时出现以下错误。ERRORtool.ImportTool:ImportedFailed:CannotconvertSQLtype2005这个问题已经有人提出了here,但建议的解决方案对我没有帮助。我正在尝试使用以下命令从命令行导入一个表,中的参数用相应的值填充:sqoopimport--connectjdbc:oracle:thin:@:/--username--password--hive-import--query'SELECT*FROM.WHERE$CONDITIONS'--split-by--hive-database-

hadoop - AWS 上的 hive : convert S3 JSON to Columnar preserving partitions

我在S3中有包含多行JSON(以换行符分隔)的文件。我想将这些文件转换为柱状格式以供AWSAthena使用我正在关注ConvertingtoColumnarFormatsguide要做到这一点,但是当转换为ORC时,S3中的分区约定将丢失。在这个例子中,如何在转换为parquets3的文件夹结构中保留dt分区?当我运行示例时,它只输出s3://myBucket/pq/000000_0而不是s3://myBucket/pq/dt=2009-04-14-04-05/000000_0这是设置接口(interface)以将JSON导入Hive表的HQL:CREATEEXTERNALTABLEi

datetime - Pig - 无法将 org.apache.pig.piggybank.evaluation.datetime.convert.ISOToUnix 的匹配函数推断为多个或都不适合

我只是想将pig的日期时间格式转换为纪元时间,这样我就可以用时间进行其他计算。下面是我的(部分)脚本:DEFINEISOToUnixorg.apache.pig.piggybank.evaluation.datetime.convert.ISOToUnix();A=LOAD's3://hearstlogfiles/google/NetworkBackfillImpressions_271283/2014/09/24/NetworkBackfillImpressions_271283_20140924_00.gz'USINGPigStorage(',');B=LIMITA10;C=FOR

encoding - 在 Hive 中使用 Icelandic Thorn 字符作为分隔符

我目前正在尝试将一些DoubleClick广告日志导入Hadoop。这些日志存储在一个gzip分隔文件中,该文件使用第1252页(Windows-ANSI?)进行编码,并使用IcelandicThorn字符作为分隔符。我可以愉快地将这些日志导入到一个列中,但我似乎找不到让Hive理解Thorn字符的方法-我想可能是因为它不理解1252编码?我查看了创建表文档-http://hive.apache.org/docs/r0.9.0/language_manual/data-manipulation-statements.html-但似乎无法找到任何方法来使此编码/分隔符正常工作。我还从ht

datetime - 转换日期时间字符串 (3/24/2017 10 :00:00 PM) to (3-24-2017 22:00:00) hive i. e convert from 12 hour to 24 hour format

我在配置单元表中有一个数据类型为字符串的日期时间字段。看起来如下:datetime3/24/201710:00:00PM尝试将其转换为hive所需的正确格式,还尝试将AM/PM删除为24小时格式,但无济于事。selectfrom_unixtime(unix_timestamp(datetime,'mm-dd-yyyyHH:MM:SS'))fromtest_table 最佳答案 您可以使用以下命令实现此目的:selectfrom_unixtime(unix_timestamp(datetime,'MM/dd/yyyyhh:mm:ssa

hadoop - Hive:当插入分区表时,在大多数行中,hive double url-encode partition key column

我创建了一个分区表:createtablet1(amountdouble)partitionedby(events_partition_keystring)storedaspaquet;向tmp_table添加了一些数据,其中'events_partition_key'列包含以下格式的时间戳(字符串类型):“2018-02-2500:00:00”然后我向分区表中插入一些数据。insertintotablet1partition(events_partition_key)selectamount,events_partition_keyfromtmp_table当从新的分区表t1中选择时

hadoop - java.io.IOException : Invalid int encoding 异常

我正在编写一个mapReduce作业来读取和处理Avrofile。输入文件是Avro输出格式为Avro当我执行Mapreduce作业时,我在reducer阶段遇到以下异常。当reducer抛出IOException时,我无法在reducer中捕获和消退它。Hue中的错误堆栈跟踪看起来java.io.IOException:Invalidintencodingatorg.apache.avro.io.DirectBinaryDecoder.readInt(DirectBinaryDecoder.java:113)atorg.apache.avro.io.ValidatingDecoder

php - base_convert 和负数

base_convert()函数似乎没有保留符号。例如:var_dump(base_convert('-100',10,10));这个的输出是100有没有办法在不丢失符号的情况下转换碱基? 最佳答案 我没有看到这样做的PHP标准函数,但是您可以编写自己的函数。functionsigned_base_convert($number,$src_base,$dest_base){$sign=(intval($number,$src_base)>=0?'':'-');return$sign.base_convert($number,$src

php - json_encode 在处理多字节子字符串时返回 false

我几乎使用最新版本的php(5.5.11),这就是问题所在。当我使用字符串部分的json_encode时,它返回false。一开始我使用的是substr,但后来我意识到在处理非英文字符串时这是完全错误的。但即使在我使用mb_substr之后,我仍然看到json_encode返回false:$s="に搭載されるようになると、その手軽さからJは急速に普及していく。、通信に関する標準を策定する国際団体インターナショナル";$a=mb_substr($s,0,10);如你所见,var_dump(json_encode(['d'=>$a]));返回false,并且var_dump(json_en

php - php 的 json_encode() 是否总是使用双引号作为字符串分隔符?

我有一个包含字符串作为值的php关联数组,我将其编码为JSON并将其存储在html-data属性中。那是由一些JS读取的。到目前为止一切顺利。现在,我需要对数据属性使用单引号,否则上下文会切换。问题是,我是否可以依靠php的json_encode()函数对字符串进行编码,始终使用双引号?令人惊讶的是,我似乎无法找到这方面的信息。我只找到那些对数组值中的引号有疑问的人的文章。提前致谢。 最佳答案 是的,正如JSON规范中定义的那样,分隔符将始终是"。但是,值可能包含'字符,这会破坏您的HTML。保留它很简单,不用担心什么可能会或不会引