草庐IT

java - 如何允许 apache hive 处理多个客户端查询

我已经通过hive从hbase创建了一个外部表。当有人登录到shell并部署一些查询时,没有其他人可以运行任何查询。当有人尝试运行查询时,会出现以下错误。失败:元数据错误:java.lang.RuntimeException:无法实例化org.apache.hadoop.hive.metastore.HiveMetaStoreClient失败:执行错误,从org.apache.hadoop.hive.ql.exec.DDLTask返回代码1当第一个shell退出时,查询可以很容易地运行。所以这意味着我的配置单元a无法处理多个客户端。如何使其能够处理多个客户端

hadoop - 如何在 hive 中删除一周中给定日期的分区

能够通过对值进行硬编码来删除一周中给定日期(即星期四)的分区。ALTERTABLElogsDROPIFEXISTSPARTITION(date=2014-10-30);如何在没有硬编码日期值的情况下删除上周四(date=2014-10-30)的分区? 最佳答案 将日期动态传递给hiveql语句的一种方法是使用配置单元变量,假设我们有名为alter.hql的配置单元脚本,其内容是:改变.hqlALTERTABLElogsDROPIFEXISTSPARTITION(date='${hiveconf:date}');您可以通过将日期变量传

hadoop - Hive 显示的行数少于 HBase

我在HBase数据源上创建了一个Hive表,并将数据(CSV文件)从S3导入到该表中。这是在AWSEMR上运行的。我已经用几行验证了这一点,没问题。但是,当我导入一个合理的数据集(1000万行)时,我发现Hive给我的计数与HBase给我的计数不一致。如果我在HBase中进行计数,我会得到1000万的结果。如果我在Hive中进行计数,我得到的结果是9,932,183。我已经编写了一个查询来暴力比较导入的数据与源S3数据,但是即使在中等规模的集群上执行也需要大量时间。与此同时,寻找可能导致这种差异的可能性和想法。我应该指出,我会把自己归类为这个部门的菜鸟。 最

hadoop - Sqoop 从 Hive 导出到 Teradata 时间戳格式必须是 yyyy-mm-dd hh :mm:ss[. ffffffff]

我正在尝试将数据从HadoopHive导出到Teradata。我的数据包含可以为NULL的时间戳。当我进行导出时,对于具有NULL时间戳的行,我收到以下错误:“时间戳格式必须是yyyy-mm-ddhh:mm:Ss[.fffffffff]”在我的sqoop导出中,我确实添加了两个选项--input-null-string'\N'和--input-null-non-string'\N'。你知道解决这个问题的方法吗?谢谢。 最佳答案 Teradata中数据类型为timestamp的列需要具有以下格式的值yyyy-mm-ddhh:mm:Ss

hadoop - 从 GZIP 读取的 Hive 表包含元信息,例如第一行中的文件名

我在hive中创建了一个指向gzip文件的外部表createexternaltableIFNOTEXISTSraw_CN(column1string,column2string,column3string,column4string,column5string,column6string,column7string,column8string,column9string,column10string)PARTITIONEDBY(day_idstring,file_typestring)以“|”结尾的行格式分隔字段存储为文本文件;添加分区:Altertableraw_CNaddparti

regex - Hive:反斜杠的正则表达式

我需要查询中间有反斜杠字符的所有行。这是我写的查询:select*fromtablewhereA='2014-10-30'andBrlike'.asterisk\.asterisk'(必须手动输入星号。查询本身就有符号)无论B列是否有反斜杠,它都会返回整个表格。'.\\.'未返回任何行,即使在某些行中B具有反斜杠字符也是如此。样本B-你好可以帮你查一下详情/ 最佳答案 selectregexp_replace(datecolumn,'-','\\')asdtfromtablename;

hadoop - SQL-HIVE-PIG-Mapreduce

每行有5列,这5列通常用逗号分隔1columnisname2ndcolumnisdate_of_purchase3rdcolumnisproduct4thcolumnismodeofpayment5thcolumnistotal_amount希望你明白它包含什么数据surender,2014-03-09,TV,OFFLINE,20000surender,2014-01-01,Mobile,ONLINE,18000Raja,2014-09-21,Laptop,ONLINE,30000Surender,2014-10-12,Laptop,ONLINE,40000Raja,2014-FEB-

hadoop - HBase-0.98.8-hadoop2 中的 Hive-0.14.0 集成问题

我有hive0.14.1hbase0.98.8和hadoop2.5.0我正在尝试将hive与hbase集成并从HBase中放入zookeeper-3.4.6.jar,hbase-common-0.98.8-hadoop2.jar文件/lib到Hive/lib。遵循的步骤如下:1.hive--auxpath$HIVE_HOME/lib/hive-hbase-handler-0.14.1.jar,$HIVE_HOME/lib/hbase-common-0.98.8-hadoop2.jar,$HIVE_HOME/lib/zookeeper-3.4.6.jar,$HIVE_HOME/lib/g

hadoop - Pig Hive Hbase 之间有何不同

我是hadoop技术的新手。我想弄清楚这些PigHive和Hbase用于哪种类型的数据(结构化、非结构化、semo结构化)?在哪种情况下使用哪种工具最有效? 最佳答案 您应该从阅读最基本的Hadoop文档开始:http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F然后,您可以在每个项目站点上找到最佳解释:ApachePig是一个用于分析大型数据集的平台,由用于表达数据分析程序的高级语言以及用于评估这些程序的基础架构组成。Pig程序的显着特性是它们的结构适合大量并行化,这反过来又使它们能够

hadoop - 如果我只想将 HCatalog 与 Pig 和 MR 一起使用,是否需要安装 Hive?

想要使用HDP2.2发行版,但计划仅将Pig+MR用于我的ETL作业。希望使用HCatalog记录模式,但希望避免必须设置Hive。我需要它来拥有HCatalog吗? 最佳答案 由于HCatalog是Hive的一部分,是的,您需要安装Hive才能使用HCatalog。(引用https://hive.apache.org/javadocs/r1.0.0/api/hcatalog/core/index.html) 关于hadoop-如果我只想将HCatalog与Pig和MR一起使用,是否需要