test_hive

hadoop - Map 任务写入 Hive 临时文件夹时权限被拒绝

我在UbuntuPrecise12.04x64机器上使用ClouderaCDH4.1。我使用ClouderaManager免费版进行了顺利安装(在我自己安装时遇到了一些困难)。但是，我仍然无法让Hive工作。现在我可以向它发出HiveQL命令来创建表，并加载本地数据(示例中的原始表)。但是当我尝试将数据插入另一个表(具有适当的serde和存储的表)时，由于本地文件夹权限而失败。org.apache.hadoop.hive.ql.metadata.HiveException:java.io.IOException:Mkdirsfailedtocreatefile:/home/yaboul

hadoop - hive 。不能在 where 子句中引用分区

我创建了一个按日期分区的表。但是不能在where子句中使用partition。这是过程第一步:CREATETABLEnew_table(astring,bstring)PARTITIONEDBY(dtstring);第二步:Insertoverwritetablenew_tablepartition(dt=$date)Selecta,bfrommy_tablewheredt='$date表已创建。Describenew_table;astringbstringdtstring问题:select*fromnew_tablewheredt='$date'返回空集。鉴于select*from

hadoop where code section new_table hql hive

Hadoop 与 hive

我们想要使用Hadoop开发一个简单的JavaEEWeb应用程序，并进行日志文件分析。以下是开发应用程序的方法。但是我们无法通过该方法。日志文件将使用sftp/ftp从客户端计算机上传到Hadoop服务器。调用HadoopJob获取日志文件并将日志文件处理到HDFS文件系统中。在处理日志文件时，内容将存储到HIVE数据库中。从客户端Web应用程序使用HIVEJDBC连接搜索日志内容我们浏览了如此多的示例以完整填写一些步骤。但是我们没有任何具体的样本不可用。请建议上述方法是否正确，并获取用Java开发的示例应用程序的链接。最佳答案

Hadoop hive section 并将

linux - 克服 HDFS-2556 : unit tests directory and permissions

我正在尝试在hadoop上进行JUnit测试，我使用MiniDFSCluster、MiniMRCluster和JUnit编写了一个在本地mini-hadoop环境中运行的测试用例。但是我收到了这个错误:WARNING:Metricssystemnotstarted:Cannotlocateconfiguration:triedhadoop-metrics2-datanode.properties,hadoop-metrics2.propertiesDec18,20124:42:29PMorg.apache.hadoop.hdfs.server.datanode.DataNodemake

permissions directory hadoop data section linux hdfs

hadoop - Hive 与 hbase-0.95.0 的集成

我正在使用Hadoop-1.2.0、HBase-0.95.0-Hadoop1并尝试将Hive-0.11.0集成到其中。Hadoop和HBase正在运行。我能够连接到Hive并在Hive中独立执行语句。但是当我尝试通过Hive在HBase中创建表时，出现以下异常:kanmani@kanmani-VirtualBox:~/hadoop$jps6695HRegionServer2640DataNode7301Jps2969JobTracker6404HMaster3192TaskTracker2861SecondaryNameNode2413NameNode6508Main6368HQuor

hadoop hbase java hive

linux - 如何通过 hive 表向 hbase 中插入数据？

我可以用这个查询创建一个Hive表CREATETABLEhbtable(keyint,valuestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf1:val")TBLPROPERTIES("hbase.table.name"="xyz");我使用此查询将数据插入表中，但它不起作用，insertoverwritetablehbtableselect*fromhbtableswheres:hivefiels=

linux hbase hive section ubuntu hadoop

mysql - 使用 Sqoop 从 MySQL 导入到 Hive

我必须通过Sqoop将MySQL表(具有复合主键)中的>4亿行导入到分区的Hive表Hive中。该表有两年的数据，一列出发日期从20120605到20140605，一天有几千条记录。我需要根据出发日期对数据进行分区。版本:ApacheHadoop-1.0.4Apachehive-0.9.0ApacheSqoop-sqoop-1.4.2.bin__hadoop-1.0.0据我所知，有3种方法:MySQL->未分区Hive表->从未分区Hive表插入已分区Hive表MySQL->分区Hive表MySQL->非分区Hive表->ALTER非分区Hive表以添加PARTITION是我正在关注的

mysql Sqoop section Hive hadoop hiveql

jdbc - Hive JDBC 客户端抛出 SQLException

我正在使用JDBC客户端代码连接到配置单元安装。我创建了一个包含两列(column1，column2)的测试表，它们都是字符串类型。当我尝试执行像“select*fromtest”这样的简单查询时，我在Java程序中得到了结果，但是使用where子句和其他复杂查询的查询会抛出以下异常。“查询返回非零代码:1，原因:失败:执行错误，从org.apache.hadoop.hive.ql.exec.MapRedTask返回代码1”我已经尝试更改存在文件的hdfs目录的权限，/tmp在本地目录上，但这没有用。这是我的连接代码Connectioncon=DriverManager.getConn

SQLException jdbc hadoop apache java client hive

sql - Hive是否支持Select中的Select？

Hive中的以下代码是否可能，并进行一些更改？:insertintotablewebmapselecta.resreference,b.resresource,(selectcount(ip)fromweblogwhereresource=a.resandreferer=b.res)weightfromtoprefresajointoprefresb;我在hive-0.10.0-cdh4.5.0中运行它并得到错误:FAILED:ParseExceptionline3:1cannotrecognizeinputnear'select''count''('inexpressionspeci

Select Hive section weblog sql hadoop hql

hadoop - 减少许多 hive -e 调用的 hive 启动时间

我以这种方式从命令行调用hive-e数百次:cathive_script.hql|parallel--gnuhive-e'{}'hive_script.hql中的每一行都可以以任意顺序独立运行。有没有--hiveconf参数可以减少启动时间？Apache网页似乎暗示可能在https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VariableSubstitution"ThisisfrustratingasHivebecomescloselycoupledwithscriptinglanguages.TheHives

hive 许多 section https hadoop amazon-web-services amazon-emr emr

90 91 929394 95 96