null_ok_草庐IT

json - Hive:json SerDe 文件在外部表中返回 "NULL"

我在亚马逊上有一个DynamoDB，其中包含一堆带有相关数据(用户、位置等)的推文。我通过管道导出了它并得到了一个json文件。将其导出为csv不是一个好主意，因为许多推文在文本字段中包含逗号。作为Hive的新手，我至少知道要加载json文件，我需要某种SerDe。这就是我创建表格的方式:createexternaltabletablename(idstring,created_atstring,followers_countstring,geostring,locationstring,polaritystring,screen_namestring,sentimentstring,

json amp NULL 34 string hadoop hive amazon-dynamodb

hadoop - Hive 在多列上对 null 的奇怪处理？

这个查询:SELECTcount(distinctfield1,field2,field3,field4)FROMSOME_TABLE返回与此查询不同(更小)的计数:SELECTcount(distinctcoalesce(field1,"null"),coalesce(field2,"null"),coalesce(field3,"null"),coalesce(field4,"null"))FROMSOME_TABLE我希望结果是相同的。对此有解释吗？最佳答案您看到不同结果的原因有两点:COUNT(DISTINCT(...)

多列 hadoop code field section hive hiveql

hadoop - 我如何避免 Hive 表的第一个 "NULL"中的 "Field Name"

首先，我使用以下命令在Hive中创建了表“emp”:createtableemp(idINT,nameSTRING,addressSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t';然后通过以下命令将数据加载到这个“emp”表中:LOADDATALOCALINPATH'\home\cloudera\Desktop\emp.txt'覆盖到表emp;当我从“emp”表中选择数据时:它显示了表Null的第一个字段像这样: 最佳答案您的文件中有一个标题行，第一个值id无法转换为INT，因此被替换

amp 34 code section emp hadoop hive bigdata

hadoop DistributedCache 返回 null

我正在使用hadoopDistributedCache，但我遇到了一些麻烦。我的hadoop处于伪分布式模式。fromherewecanseeinpseudo-distributedmodeweuseDistributedCache.getLocalCache(xx)toretrivecachedfile.首先我将我的文件放入DistributedCache:DistributedCache.addCacheFile(newPath("hdfs://localhost:8022/user/administrator/myfile").toUri(),job.getConfigurati

DistributedCache hadoop code getConfiguration nullpointerexception distributed-cache

hadoop - 在配置单元中添加列后显示 NULL 值

我使用的是hive-version1.2.1。我是hive的新手。我在TABLE_2中添加了一列并显示NULL值。我想将DATE部分从时间戳列放到新创建的列中。我尝试了以下查询:ALTERTABLEtable_2ADDCOLUMNS(DATE_COLstring);INSERTINTOtable_2(DATE_COL)ASSELECTSUBSTRING(TIMESTAMP_COL,-19,10)FROMtable_1;这是有效的，但它仍然在新创建的DATE_COL中显示NULL值。我只想在DATE_COL中约会。table_1有13列，table_2有14列(13+DATE_COL)。

配置单 hadoop section DATE_COL DATE hive

hadoop - NULL 在将 Hive 查询结果写入文本文件时显示为 '\N'

我正在尝试使用Hive的“写入目录”功能下载Hive查询的结果。对于某些列，我的查询返回了NULL值，但在生成的文件中我可以看到它被替换为\N。这是Hive的预期行为吗？我必须将生成的文件上传到Bigquery表。有什么方法可以为空值生成NULL而不是\N因为在文件中收到\N之后我必须执行中间处理(将\N替换为NULL或空字符串)。请提出建议。最佳答案您可以使用NULLDEFINEDAS定义如何序列化NULL:INSERTOVERWRITEDIRECTORY"/path/to/your/dir"ROWFORMATDELIMITE

时显 amp code section NULL hadoop hive hiveql

windows - Hadoop 二进制文件中的 java.io.IOException : Could not locate executable null\bin\winutils. exe

$bin/start-hbase.sh2015-07-0119:21:34,971ERROR[main]util.Shell:Failedtolocatethewinutilsbinaryinthehadoopbinarypathjava.io.IOException:Couldnotlocateexecutablenull\bin\winutils.exeintheHadoopbinaries.atorg.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:355)atorg.apache.hadoop.util.Shell

IOException executable hadoop section apache windows cygwin hbase

java - 信息 : Transport Used for JDBC connection: null + Apache Hive

我正在尝试通过JDBC连接ApacheHive和eclipse，但出现以下错误。以下是版本信息:ApacheHadoop:2.7.1，Hive:1.2.1和EclipseKepler。****Error:****Dec29,20156:04:00PMorg.apache.hive.jdbc.UtilsparseURLINFO:Suppliedauthorities:localhost:10000Dec29,20156:04:00PMorg.apache.hive.jdbc.UtilsparseURLINFO:Resolvedauthority:localhost:10000Dec29,

connection Transport java 34 apache eclipse hadoop jdbc

hadoop - 运行时异常 : Error in configuring object with null pointer exception while running my UDAF?

我一直在尝试编写一个UDAF来计算加权平均值。我用类似于现有UDAF的方式编写它来计算平均值，但它似乎只适用于我的本地机器。我不确定出了什么问题....有人遇到过类似的问题吗以下是生成的错误:java.lang.RuntimeException:Errorinconfiguringobjectatorg.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)atorg.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)

configuring exception java hadoop apache hive

java - 无法从 Eclipse 运行 Hadoop，说 Eclipse 中的 Hadoop 位置(错误 :NULL)

我已经从Yahoo站点下载了HadoopVM，并通过VMwareplayer启动了HadoopVM。我没有看到任何问题。正如Yahoo中提到的，我使用EclipseEuropa(v3.3.1)并下载了一个jar文件(hadoop-0.18.3-eclipse-plugin)来在eclipse中制作MapReduce插件。我用hadoop启动了linuxVM，并在eclipse中创建了新的DFS位置(输入我的VM的IP，Map/Reduce主端口9001，DFS端口9000。但是在节点中我收到错误“Error:null”。我做错了什么？此外，在eclipse中配置Hadoop变量时，我在

Eclipse Hadoop section java eclipse-plugin hadoop-plugins