草庐IT

scala - 来自 Spark 的 Hive 查询 - 解析失败

我正在尝试在spark-shell中执行此操作:valhiveCtx=neworg.apache.spark.sql.hive.HiveContext(sc)vallistTables=hiveCtx.hql("showtables")第二行执行失败并显示此消息:warning:therewere1deprecationwarning(s);re-runwith-deprecationfordetailsorg.apache.spark.sql.hive.HiveQl$ParseException:Failedtoparse:showtablesatorg.apache.spark.s

c# - 使用 Microsoft.Hadoop.Client 的 LINQ to HDInsight Hive 表

根据ThisCodeplexpage在AzureHDInsight中可以将LINQ应用于配置单元表。但是HiveConnection和HiveRow这两种类型(如上述示例所示)在Microsoft.Hadoop.Client中不可用。核包。我是否需要从github源安装sdk才能将LINQ应用到Hive? 最佳答案 这是我从高级支持人员那里得到的回复:HiveRowandHiveConnectionareunavailableinhttps://www.nuget.org/packages/Microsoft.Hadoop.Clie

java - Hive Java API 注册 jar

我正在使用Cloudera5.3.1并使用相应的HiveAPI我能够通过Java进行一些查询。但是,我的一些查询需要一些UDF,我为其添加了jars。我已经从.hiverc添加了jar,hive命令行很好地使用了它。但是,Java在从JavaAPI调用时不使用jars。我在以下类路径中添加了jars但没有用:-/opt/cloudera/parcels/CDH/lib/hive/lib/看起来hive没有将上面的作为类路径。现在我正在执行Hiveql查询来为每个语句单独添加jars:-stmt.execute("addjarhdfs:///user/hive/aux_jars/open

hadoop - 如何从 Hive 加载数据到 Phoenix?

Hive有一个HBaseintegration.鉴于此,是否可以从配置单元插入Phoenix表?(作为批量加​​载/插入覆盖)复合主键怎么样?我们可以在Hive中生成它们吗? 最佳答案 不,很遗憾,HiveHBase集成无法将数据加载到Phoenix表中。此外,(根据我的经验)对HBase集成的复合行键的支持并不全面。例如:Hive不支持包含Integer、String、BigDecimal的组合键。您可以使用Phoenix-mr集成或Phoenix-Pig一体化。Phoenix也有一个csv批量加载器。

java - 面对 java.lang.UnsupportedClassVersionError : com/facebook/fb303/FacebookService$Iface error while starting hive

我已经启动了Hadoop并尝试启动hive,这是我遇到的错误。我刚刚开始学习Hadoop和hive,请帮助..hduser@Venkat:/usr/lib/hive/apache-hive-1.1.0-bin$bin/hiveLogginginitializedusingconfigurationinjar:file:/usr/lib/hive/apache-hive-1.1.0-bin/lib/hive-common-1.1.0.jar!/hive-log4j.propertiesSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:F

hadoop - 针对特定场景的 Hive 查询

我有一个场景,我想为其编写一个Hive查询。场景在这里:数据如下:现在,我期望的输出是:要忽略的空值。本质上,我想要列col1、col2、col3和col4中的值的总和并对这些值进行分组。“id”列在这里无关紧要,只是为了说明。为这种情况编写HiveQL查询的任何帮助都会有所帮助。谢谢。 最佳答案 selectval,count(1)fromtest_tablelateralviewexplode(array(col1,col2,col3,col4))tasvalwherevalisnotnullgroupbyval解释:test_

hadoop - Hive 查询从边缘节点运行

从边缘节点运行hiveinsert查询与从oozie工作流运行相比有什么缺点吗?Oozie文档说通过oozie运行会将工作负载分配给可用的数据节点。但我在想通过边缘节点运行仍然应该调用作业跟踪器并在集群上运行? 最佳答案 当您从边缘节点运行Hive命令时,它会获取该命令,创建机器生成的MapReduce代码(在大多数情况下),并将其发送到集群,在集群中它被视为使用尽可能多的任何MapReduce作业数据节点根据需要。Oozie也会做同样的事情。无论哪种方式。所以你的假设是正确的。 关于h

hadoop - Hive JDBC 中的无效 URL

WheninHive关于通过JDBCHive连接Exceptioninthread"main"java.sql.SQLException:InvalidURL:jdbc:hive2://192.168.14.52:10000/reportatorg.apache.hadoop.hive.jdbc.HiveConnection.(HiveConnection.java:85)atorg.apache.hadoop.hive.jdbc.HiveDriver.connect(HiveDriver.java:104)atjava.sql.DriverManager.getConnection(

hadoop - HBase hive 集成

我通过提及默认版本5创建了一个HBase创建'表名',{NAME=>'cf',VERSIONS=>5}并插入两行(row1和row2)put'tablename','row1','cf:id','row1id'put'tablename','row1','cf:name','row1name'put'tablename','row2','cf:id','row2id'put'tablename','row2','cf:name','row2name'put'tablename','row2','cf:name','row2nameupdate'put'tablename','row2'

hadoop - hive 。加载带有动态列标题的 CSV

如果文件具有动态列数,我可以将带有标题的CSV文件加载到配置单元表中吗?例如;我创建了外部表创建外部表art_stat(艺术字符串,rate1字符串,rate2字符串,prop1字符串,prop2字符串)...我有带标题的CSV文件File1(只有三列):ART,RATE1,PROP2apple,109,redapple,90,greengrape,10,red......File2(只有props列):ART,PROP1,PROP2candy,109,blackcooky,90,browngrape,10,red......如何使用标准配置单元工具将这些文件加载​​到我的表中?我有一