HIVE2

hadoop - Hive 外部表的最大列数

我正在尝试在Amazon的EMR上设置Hive，以从DynamoDB表中提取数据并将其转储到S3。我已按照找到的说明进行操作here，并在我们的大多数table上取得了成功。然而，对于一个DynamoDB表，我收到一个错误(如下所示)。有问题的表有很多列(>100)，将映射减少到它们的一个子集允许脚本运行，所以我假设这是问题，但我找不到关于此的任何文档。我可以定义的列数是否有某种硬性限制？还是我可能会在这里遇到其他限制？有办法解决这个问题吗？我得到的错误看起来像:FAILED:Errorinmetadata:javax.jdo.JDODataStoreException:Putrequ

hadoop - Hadoop 和 Hive 的基本知识

我最近开始使用Hadoop。我通过Hive访问名为Checkout的表。下面是数据进入HDFS和其他信息的路径。那么，如果我必须阅读以下三行，我可以获得什么信息？PathSizeRecordCountDateLoaded/sys/edw/dw_checkout_trans/snapshot/2012/07/04/001.13TB9,294,245,8002012-07-0507:26/sys/edw/dw_checkout_trans/snapshot/2012/07/03/001.13TB9,290,477,9632012-07-0409:37/sys/edw/dw_checkout

基本知识 hadoop section Hive dw_checkout_trans

hadoop - hive 表丢失

我在配置单元中创建了几个表。我对他们提出了一些疑问。然后退出hive，之后关闭hadoopmapred和dfs。然后第二天回来才发现table不见了!!我的配置单元使用本地元存储。经过大量搜索后，我只看到有人发布了一个这样的问题。答案中建议如果使用metastore，则本地应从同一位置启动配置单元。我也这样做了。我只从主人那里运行hive，甚至从未登录过奴隶。Metastore文件夹仍然存在。那么一定是出了什么问题呢？我检查了hadoop和hivemetastore日志的数据节点日志。却一无所获。我在哪里可以找到哪里出了问题？请帮我解决一下这个。还有什么可以避免这样的事情？

hadoop hive section 配置单 metastore

hadoop - Hive - 对分区的查询不返回任何内容

我有一个按特定开始日期(ds)分区的表。我可以查询最新的分区(前一天的数据)，它会很好地使用分区。hive>selectcount(1)fromvtc4whereds='2012-11-01';...garbage...MapReduceJobsLaunched:Job0:Map:1Reduce:1CumulativeCPU:6.43secHDFSRead:46281957HDFSWrite:7SUCCESSTotalMapReduceCPUTimeSpent:6seconds430msecOK151225Timetaken:35.007seconds但是，当我尝试查询较早的分区时，h

hadoop Hive code

java - 用Sqoop导出Hive表，有些行没有分隔

我有一个使用Hive生成的表(在AmazonElasticMapReduceJobFlow上)。我可以看到数据位于hdfs:///mnt/hive_081/warehouse/[tablename]。我把Sqoop打包成一个jar(没有做任何改动)，上传到master节点进行测试。我这样运行我的sqoopjar:/usr/lib/jvm/java-6-sun/bin/java-cp/home/hadoop/conf:/usr/lib/jvm/java-6-sun/lib/tools.jar:/home/hadoop:/home/hadoop/hadoop-tools-1.0.3.j

Sqoop java hadoop 231 home hive amazon-emr

sql - Hive 中 SQL Server UPDATE 命令的最佳等价物

Hive中SQLServerUPDATESET命令的最佳(更便宜)等价物是什么？例如，考虑我要转换以下查询的情况:UPDATETABLEemployeeSETvisaEligibility='YES'WHEREexperienceMonths>36等效于Hive查询。最佳答案我假设您有一个没有分区的表，在这种情况下您应该能够执行以下命令:INSERTOVERWRITETABLEemployeeSELECTemployeeId,employeeName,experienceMonths,salary,CASEWHENexperie

等价物 Server section code experienceMonths sql sql-server hadoop hive

hadoop - Hive 使用的默认 JOIN 类型？

Hive使用的默认JOIN类型是什么？我知道Pig默认执行哈希连接。最佳答案 Hive默认支持equi连接。您可以根据表的大小和排序顺序使用Map-sideJoin或MergeJoin来优化您的连接。查看此帖子了解更多详情:Hadoop'sMap-sidejoinimplementsHashjoin?更多详情:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins 关于hadoop-Hive使用的默认J

hadoop Hive section https stackoverflow bigdata apache-pig

hadoop - 使用参数化位置的 Hive CREATE EXTERNAL TABLE

这按预期工作:DROPTABLEmytable;CREATEEXTERNALTABLEmytable(Dim1STRING,Dim2STRING,Dim3STRING)LOCATION'hdfs:///user/myuser/data';但这不是:setrootpath='hdfs:///user/myuser/data';DROPTABLEmytable;CREATEEXTERNALTABLEmytable(Dim1STRING,Dim2STRING,Dim3STRING)LOCATION'${hiveconf:rootpath}';失败并出现以下错误(Hive0.9.0):FAIL

EXTERNAL hadoop section STRING code hive hiveql

hadoop - Sqoop 导出分区的 Hive 表

我在尝试导出分区的Hive表时遇到了一些问题。这是否得到完全支持(我尝试用谷歌搜索并找到了一张JIRA票)？sqoopexport--connectjdbc:mysql://localhost/testdb--tablesales--export-dir/user/hive/warehouse/sales--direct这是我得到的:00000_2,Status:FAILEDjava.io.FileNotFoundException:Filedoesnotexist:/user/hive/warehouse/sales/day=2013-04-01运行hadoopfs-ls/user/

hadoop Sqoop section code pre hive

hadoop - 无法使用 SERDE 创建 JSON 格式的 HIVE 表

我们对Hadoop和Hive还很陌生。我们创建了普通的Hive表并加载了数据。但是当我们使用JSON格式在Hive中创建表时，我们遇到了问题。我也添加了serdejar。我们收到以下错误:createtableairline_tables(Airlinestring,Airlineidstring,Sourceairportstring,Sourceairportidstring,Destinationairportstring,`Destinationairportidstring,Codesharestring,Stopstring,EquipmentString)`ROWFORM

hadoop SERDE section string hive

56 57 585960 61 62