HIVE-QL

database - Hive 的 Bucket Map Join

我有一个Hadoop集群，我使用Hive进行查询，我想连接两个大表，其中一个有小桶，从我读到的内容来看，如果我将两个表都存储在连接键上，那会帮助性能。所以我的设置是:将连接键上的两个表分桶到相同数量的桶中，较小表的桶适合内存，设置hive.optimize.bucketmapjoin=true;运行以下查询:SELECT/*+MAPJOIN(a)*/count(*)FROMaJOINBONa.join_key=b.join_key;问题1:以上设置是否足以触发bucketmapjoin？问题2:我对bucketmapjoin的理解是它启动一个本地任务，为每个bucket创建哈希表，然后

database Bucket 射器 strong join hadoop hive

unix - Hive 变量替换在 hive -e 命令中不起作用

我正在尝试使用Hive变量。如果我登录Hive并使用:hive>seta=test_table;hive>describe${hiveconf:a};但是如果从Shell尝试相同的命令，它会给出:ParseError1:1cannotrecognizeinputnear...$>hive-e"seta=test_table;describe${hiveconf:a};"ParseError1:1cannotrecognizeinputnear 最佳答案 ParameterExpansionThe`$'characterintrodu

unix Hive parameter section code hadoop

exception - 将数据加载到 Hive 时出错

我正在尝试使用以下命令将本地计算机上的csv文件中的数据加载到在Hive上创建的测试数据库LOADDATALOCALINPATH'bdata/tx/TX_2012.csv'INTOTABLEtestdbPARTITION(dt='08-09-2012');但是，我不断收到以下错误:Copyingfile:file:/root/business-data/sc_sd_tn_tx_ut/TX_6_17_2012.csvFailedwithexceptionjava.io.IOException:File/tmp/hive-root/hive_2012-08-09_13-21-49_208_

时出 exception hadoop java apache hive

mysql - 使用 Hive 查询 Sqoop 到 MySQL

我想将Hive表中的数据sqoop到MySQL表中。两者具有相同的列集，但它们的顺序不同。有没有办法使用具有属于mysql表的列顺序的Hive查询将数据sqoop到mysql表？最佳答案 Sqoop目前不支持Hive查询的“导出”操作。支持的解决方法是运行Hive查询，该查询将更改Hive中的列顺序并将其结果作为临时表存储在Hive中。然后，您可以使用Sqoop导出此临时表。关于mysql-使用Hive查询Sqoop到MySQL，我们在StackOverflow上找到一个类似的问题：

mysql Sqoop section Hive stackoverflow hadoop bigdata

hadoop - Hive 从客户端机器加载数据

我正在尝试编写一个独立的java文件，以在Windows机器中使用HiveJDBC连接到hadoopdb，并从本地csv文件加载表数据。我收到错误“语义分析错误:第1:23行无效路径'd:/Sample2.txt':仅接受"file"或“hdfs”文件系统。我正在尝试的是对还是错？我们可以为hadoopdb从客户端windows机器加载数据吗？最佳答案我认为你需要使用类似的东西:file:d:/Sample2.txt 关于hadoop-Hive从客户端机器加载数据，我们在StackO

hadoop Hive section code

hadoop - Map 任务写入 Hive 临时文件夹时权限被拒绝

我在UbuntuPrecise12.04x64机器上使用ClouderaCDH4.1。我使用ClouderaManager免费版进行了顺利安装(在我自己安装时遇到了一些困难)。但是，我仍然无法让Hive工作。现在我可以向它发出HiveQL命令来创建表，并加载本地数据(示例中的原始表)。但是当我尝试将数据插入另一个表(具有适当的serde和存储的表)时，由于本地文件夹权限而失败。org.apache.hadoop.hive.ql.metadata.HiveException:java.io.IOException:Mkdirsfailedtocreatefile:/home/yaboul

hadoop Hive apache java cloudera

hadoop - hive 。不能在 where 子句中引用分区

我创建了一个按日期分区的表。但是不能在where子句中使用partition。这是过程第一步:CREATETABLEnew_table(astring,bstring)PARTITIONEDBY(dtstring);第二步:Insertoverwritetablenew_tablepartition(dt=$date)Selecta,bfrommy_tablewheredt='$date表已创建。Describenew_table;astringbstringdtstring问题:select*fromnew_tablewheredt='$date'返回空集。鉴于select*from

hadoop where code section new_table hql hive

Hadoop 与 hive

我们想要使用Hadoop开发一个简单的JavaEEWeb应用程序，并进行日志文件分析。以下是开发应用程序的方法。但是我们无法通过该方法。日志文件将使用sftp/ftp从客户端计算机上传到Hadoop服务器。调用HadoopJob获取日志文件并将日志文件处理到HDFS文件系统中。在处理日志文件时，内容将存储到HIVE数据库中。从客户端Web应用程序使用HIVEJDBC连接搜索日志内容我们浏览了如此多的示例以完整填写一些步骤。但是我们没有任何具体的样本不可用。请建议上述方法是否正确，并获取用Java开发的示例应用程序的链接。最佳答案

Hadoop hive section 并将

hadoop - Hive 与 hbase-0.95.0 的集成

我正在使用Hadoop-1.2.0、HBase-0.95.0-Hadoop1并尝试将Hive-0.11.0集成到其中。Hadoop和HBase正在运行。我能够连接到Hive并在Hive中独立执行语句。但是当我尝试通过Hive在HBase中创建表时，出现以下异常:kanmani@kanmani-VirtualBox:~/hadoop$jps6695HRegionServer2640DataNode7301Jps2969JobTracker6404HMaster3192TaskTracker2861SecondaryNameNode2413NameNode6508Main6368HQuor

hadoop hbase java hive

linux - 如何通过 hive 表向 hbase 中插入数据？

我可以用这个查询创建一个Hive表CREATETABLEhbtable(keyint,valuestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf1:val")TBLPROPERTIES("hbase.table.name"="xyz");我使用此查询将数据插入表中，但它不起作用，insertoverwritetablehbtableselect*fromhbtableswheres:hivefiels=

linux hbase hive section ubuntu hadoop

40 41 424344 45 46