$hive

hadoop - 由于缺少 jar，无法配置 hive.exec Hook

我正在尝试使用Hive并使用“usedb”命令切换数据库。我的设置是Hadoop2.4.0和Hive0.13.1。我将以下3个属性添加到.settings文件sethive.exec.failure.hooks=org.apache.hadoop.hive.ql.hooks.ATSHook;sethive.exec.post.hooks=org.apache.hadoop.hive.ql.hooks.ATSHook;sethive.exec.pre.hooks=org.apache.hadoop.hive.ql.hooks.ATSHook;然后我打开hive命令行，通过“hive-im

mysql - 截断命令(Hive 与 SQL)

我期待SQL和HIVE中的截断行为相同。但它不同。我想确认一下我是不是理解错了1)在SQL中，以下命令删除表并重新创建。如果存在，则删除所有分区mysql>truncatetablet1;2)在HIVE中，下面的命令只是从表中删除数据。它不会删除现有分区。我们需要手动删除它。hive>truncatetablet1;我发现了另一个问题，如果我们通过更改将列添加到分区表中。那么往表中insertoverwrite数据就会出现问题。解决方法是删除表中的所有现有分区。这是HIVE(版本0.13)中的问题吗？对HIVE和SQL使用truncate的其他区别是什么？

mysql Hive section code truncate sql hadoop hiveql

hadoop - 如何在 Hive 中启用时间戳

登录到hive后，我得到以下信息。sudo-uhdfshive[warningsandinformationaboutdeprecatedconfigurations]Logginginitializedusingconfigurationinjar:file:/opt/cloudera/parcels/CDH-5.0.0-1.cdh5.0.0.p0.47/lib/hive/lib/hive-common-0.12.0-cdh5.0.0.jar!/hive-log4j.properties当我在Hive中创建一个具有时间戳数据类型的表时，我得到以下信息。hive>createtable

何在 hadoop string section hive timestamp cloudera create-table

sql - Hive 和 Pig 中的不平等加入

我正在开始一个项目，我需要做一些不平等的加入。现在，我读到Pig和Hive都不支持不等式Join。我还读到Pig可以通过使用CROSS和FILTER来支持它。我也可以在Hive中使用WHERE子句来做到这一点吗？是否存在不可能的情况？最后，假设我可以在Pig和Hive中都做到这一点，哪个性能更好？最佳答案我记得Hive只能用一个reducer做“CROSS”。Pig使用一种智能的方法来实现“CROSS”并并行运行它，它通常比Hive具有更好的性能。顺便说一句，我已经一年没有更新关于Hive和Pig的知识了。我不确定Hive在过去

平等 Hive section Pig sql join hadoop apache-pig

sql - ParseException - 子查询源中的输入不匹配 - Hive 中的错误

我正在Hive中运行下一个查询:SELECTCOUNT(*)FROM(SELECT*FROM(SELECTid,COUNT(*)AScount_p_idFROMpalladionGROUPBYid)a,(SELECTcid,COUNT(*)AScount_q_cidFROMoperationsGROUPBYcid)bWHEREa.id=b.cid)WHEREcount_p_id我一直收到这样的错误ParseExceptionline1:103mismatchedinput','expecting)near'a'insubquerysource代码有什么问题？我什么也看不到。

ParseException Hive SELECT section FROM sql hadoop

hadoop - Hive/Impala 中的多维分析

我有一个非规范化的表说Sales看起来像:销售键，SalesOfParts、SalesOfEquipments、CostOfSales作为一些数字度量行业、国家、州、销售区域、设备ID、客户ID、销售年份、销售月份和一些更相似的维度。(共12个维度)我需要支持对销售的聚合查询，例如一年、一个月的销售总数……它们的总成本等。此外，还需要过滤这些聚合，例如2013年的总销售额，04属于XYZ客户的制造行业。我在hive/impala中有这些维度表和事实。我不认为我可以在所有维度上制作一个立方体。我阅读了一篇论文，了解如何在多个维度上执行OLAP:http://www.vldb.org/co

多维 hadoop section noreferrer hive olap olap-cube impala

hadoop - PIG 和 HIVE 连接到运行大量 map 的 Datastax Cassandra

我正在使用DSE3.2.4我创建了三个表，其中一个表有1000万行，另一个表有50k行，其他表只有10行当我对这些表运行一个简单的PIG或Hive查询时，它会为这两个表运行相同数量的映射器。在Pig中，默认情况下pig.splitCombination是true其中它只运行一个map如果我将其设置为false，它现在运行513张map。在Hive中默认运行513个映射我尝试设置以下属性mapred.min.split.size=134217728in`mapred-site.xml`nowrunning513mapsforall在pigshell中设置pig.splitCombinat

Cassandra Datastax code section 射器 hadoop mapreduce hive datastax-enterprise

hadoop - 在 Hive 查询中获取字符串中的值

我在Hive中有一个表，其中一列是字符串。该列中的值类似于“x=1,y=2,z=3”。我需要编写一个查询，为所有行在此列中添加x的值。如何提取x的值并将它们相加？最佳答案您需要一个UDF来进行此转换:importorg.apache.hadoop.hive.ql.exec.Description;importorg.apache.hadoop.hive.ql.exec.UDF;importorg.apache.hadoop.io.Text;classSplitColumnextendsUDF{publicIntegerevalu

hadoop Hive section SplitColumn code mapreduce

hadoop - Hive histogram_numeric 函数输出无效字符

我正在使用配置单元的histogram_numeric函数，我想将我的选择查询输出到文件。但是我在文件中得到了无效的字符，我不能用它来绘制数据。这是我的代码:INSERTOVERWRITELOCALDIRECTORY'/home/cloudera/queries/histograms/q1'ROWFORMATDELIMITEDFIELDSTERMINATEDBY','selectexplode(histogram_numeric(operationTime,30))fromtransaction;结果我得到:3.1968591661070107"someInvalidCharacter

histogram_numeric histogram section code someInvalidCharacter hadoop hive bigdata hiveql

json - 更改 Hive 中的 Derby Metastore 以允许具有 >4000B 定义的结构

我们正在创建一个Hive模式来读取大量JSON文件。我们的JSON模式相当大，我们发现Hive的默认Metastore模式不能按原样为我们工作。具体来说，我们架构中的一个字段中有大约17KiB的嵌套结构。不幸的是，对于存储结果定义的字段，Hive似乎有varchar(4000)的限制(在此处查看Derby模式def~v0.10):CREATETABLE"COLUMNS_V2"("CD_ID"bigintNOTNULL,"COMMENT"varchar(4000),"COLUMN_NAME"varchar(128)NOTNULL,"TYPE_NAME"varchar(4000),"INT

Metastore Derby section 34 code json hadoop amazon-web-services hive

180 181 182183184 185 186