HIVE2

database - 创建 Hive Metastore 数据库表错误

我正在运行ClouderaManager(免费版)，我到达了向导创建HiveMetastore数据库的地步。显示此错误并停止配置过程。使用/var/run/cloudera-scm-agent/process/40-hive-metastore-create-tables/hadoop-conf作为HADOOP_CONF_DIR我似乎找不到任何可能导致此问题的信息？到目前为止，一切都已正确配置，安装的一切以及用户名和密码都是正确的。有人以前见过这个错误吗？想法？错误日志:atsun.reflect.DelegatingConstructorAccessorImpl.newInstanc

windows-7 - Hive 和 PIG/Grunt shell 卡在 cygwin 上

我在我的Windows7机器(32位)上以本地模式运行Hadoop。我已经把HIVE/PIG/Hadoop/Java6都安装在C盘了。我使用的是Cygwin版本:2.819。我已经在cygwin上安装了C:。我能够从cygwin终端运行hadoop命令，例如:fs-ls等。我还可以启动grunt和hiveshell。但真正的问题是:我在gruntshell上输入的任何命令(例如:fs-ls或records=LOAD.....)我没有看到任何输出，它有点挂起。与配置单元提示类似，如果我将命令作为showtables给出；我没有看到任何输出，只是光标一直在闪烁!任何键盘输入并没有给出任何结

windows cygwin export section HOME windows-7 hadoop hive apache-pig

sql - 如何在 Hive 中使用 between 实现连接？

我有一个Hive表，其中包含IP地址的数字版本。我有另一个包含开始、结束、位置的表，其中开始和结束定义了与位置关联的一系列数字IP。ExampleNumeric:29start|end|location----------------------1|11|66612|30|77731|40|888Output:29-777我需要使用表1中的IP来查找表2中的位置。我是Hive的新手，发现我不能在连接语句中使用BETWEEN或。我一直在尝试找出使用HiveSQL实现此目的的某种方法，但无法弄清楚。有办法吗？如果需要其中一个，我也有点熟悉UDF。我愿意接受这样的想法，即这在Hive中是不可

何在 between section Hive code sql hadoop

sql - 在 HIVE 中，分区列不是底层保存数据的一部分？

我有一些日志数据，有字段id,tdate,信息我创建了一个动态分区表CREATETABLElog_partitioned(idSTRING,infoSTRING)PARTITIONEDBY(tdateSTRING)然后我正在加载数据FROMlogslgINSERTOVERWRITETABLElog_partitionedPARTITION(tdate)SELECTlg.id,lg.info,lg.tdateDISTRIBUTEBYtdate;正在通过动态分区成功加载数据。但是当我试图查看数据时hdfsdfs-cat/user/hive/warehouse/log_partitioned

底层 HIVE tdate code log_partitioned sql hadoop bigdata

hadoop - HIVE 抛出错误中的简单表创建

HIVE中的简单表创建无法正常工作并抛出以下错误请帮忙。hive>CREATETABLEpokes(fooINT,barSTRING);FAILED:Errorinmetadata:java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.metastore.HiveMetaStoreClientFAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask 最佳答案

hadoop HIVE section strong metastore bigdata

hadoop - 最简单的 Hive 查询不起作用

当我尝试获取查询时SELECT*FROMA我得到了所有信息，但是当尝试获取存在列名(或连接)的查询时SELECTaFROMA它返回一些异常:TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatororg.apache.hadoop.ipc.RemoteException:java.io.IOException:File/tmp/hive-merza/hive_2014-06-25_09-12-19_567_6884805431385202274/-mr-1

hadoop Hive java apache mapreduce hbase

csv - 使用逗号分隔值和 .csv 或 .txt 文件格式将 Hive 输出到 s3。使用 sqoop 从 hive 导出到 s3 的替代方法也可以使用

我一直在尝试使用hive输出到s3。我在这方面取得了成功，但结果输出不是逗号分隔的，而是有一个分隔符，例如^A我想。我还致力于使用sqoop将数据从s3导入和导出到psql，但我无法在hive上执行此操作，即使我得到了解决方案也可以。我试过的是sethive.io.output.fileformat=CSVTextFile;INSERTOVERWRITEDIRECTORY"s3n://akshayhazari/results"select*frombooks;这是工作:Totaljobs=3LaunchingJob1outof3Numberofreducetasksissetto0si

csv sqoop code table pre hadoop amazon-s3 hive

mongodb - 动态模式的 Hive 表创建

我们正在研究Hive是否允许我们运行一些类似SQL的查询mongo风格的动态模式作为我们map-reduce作业的先驱。数据以几个TiB的BSON文件的形式出现；每个文件包含JSON“样本”。示例示例如下:{"_id":"SomeGUID","SomeScanner":{"B64LR":22,"Version":192565886128245},"Parser":{"Size":73728,"Headers":[{"VAddr":4096,"VSize":7924....etc....作为动态模式，只有少数字段保证存在。我们希望能够针对可能是某物的输入集运行查询喜欢SomeScanne

mongodb Hive code 34 hadoop bson hiveql

hadoop - 更改 HIVE 中的目标目录

我正在将一张表从NETEZZA导入HIVE。我在SQOOP命令中明确提到了我的目标目录，但它始终采用默认路径:/user/hive/warehouse如何更改这个默认路径？？最佳答案在$HIVE_CONF/conf/hive-site.xml你必须把这个:hive.metastore.warehouse.diryour/directory/in/hdfs然后重启hive。关于hadoop-更改HIVE中的目标目录，我们在StackOverflow上找到一个类似的问题：

hadoop HIVE section strong bigdata sqoop hiveql

regex - 使用 RegexSerDe 在 Hive 中创建 DDL 时出错

我有分隔符为“,|”的数据。我按如下方式创建了配置单元DDL:CREATETABLEplayer_profile(player_idBIGINTCOMMENT'PlayerProfileIdentifier',change_tsSTRINGCOMMENT'ChangeDatetime',child_birth_yearINTCOMMENT'ChildBirthYear',countrySTRINGCOMMENT'CountryCode',)ROWFORMATSERDE'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'WITHSERDEP

时出中创 section apache RegexSerDe regex hadoop hive

57 58 596061 62 63