$hive

hadoop - Pyspark:远程Hive仓库位置

我需要从Pyspark读取/写入存储在远程HiveServer中的表。关于这个远程Hive，我只知道它运行在Docker下。从HadoopHue中，我找到了一个iris表的两个url，我尝试从中选择一些数据:我有一个表元存储url:http://xxx.yyy.net:8888/metastore/table/mytest/iris和表格位置url:hdfs://quickstart.cloudera:8020/user/hive/warehouse/mytest.db/iris我不知道为什么最后一个url包含quickstart.cloudera:8020。也许这是因为Hive在Do

hadoop - Hive 与 Hbase 集成 null

大家。我尝试使用hbase集成但遇到了问题。hive的时间戳字段查询为空。我的sql是:CREATEEXTERNALTABLEhbase_data(nidstring,dillegaldatetimestamp,coffensestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,0:DILLEGALTIMESTAMP,0:COFFENSE")TBLPROPERTIES("hbase.table.name"="I

hadoop Hbase section DILLEGALTIMESTAMP hive

hadoop - 使用 Tez 执行引擎将文件系统添加到 Hive

在使用Tez执行引擎针对外部ORC表执行查询时，我收到以下错误:Vertexfailed,vertexName=Map6,vertexId=vertex_1504790331090_0008_1_01,diagnostics=[Vertexvertex_1504790331090_0008_1_01[Map6]killed/faileddueto:ROOT_INPUT_INIT_FAILURE,VertexInput:iteminitializerfailed,vertex=vertex_1504790331090_0008_1_01[Map6],java.lang.RuntimeEx

hadoop Hive FileSystem section azure-hdinsight tez

hadoop - Hive 无法设置暂存目录的权限

即使我在运行作业之前设置了exec目录和暂存目录，我的配置单元作业也失败并出现以下错误，我不确定为什么没有更新默认属性。SEThive.exec.scratchdir=/domain/usecase/warehouse/hive_scratch_tmp;SEThive.exec.stagingdir=/domain/usecase/warehouse/.staging;异常(exception):17/09/1311:30:42[Thread-126]:ERRORmr.ExecDriver:yarnjava.io.IOException:Couldnotsetpermissionfor

存目 hadoop section staging apache-spark hive apache-spark-sql

hadoop - 与表锁定相关的 Spark Hive 插入

只是一个简单的问题。我正在尝试执行一个版本为1.6.0的Spark程序，该程序在Hive表上使用并发加载。在hiveContext.sql("insert...")中使用insert语句是一种方法，因为我想确保在写入过程中锁定表，因为从什么我在Spark文档中看到，当对DataFrame使用Saving操作时，无法确保表锁定和原子性。"SaveoperationscanoptionallytakeaSaveMode,thatspecifieshowtohandleexistingdataifpresent.Itisimportanttorealizethatthesesavemodes

hadoop Spark section strong code apache-spark hive

hadoop - 无法启动 Hive CLI Hadoop(MapR)

我正在尝试访问HiveCLI。但是，由于以下AccessControl问题无法启动。奇怪的是，我能够在没有AccessControl问题的情况下从Hue查询配置单元数据。但是，配置单元CLI不工作。我在MapR集群上。非常感谢任何帮助。[@~]$hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/opt/mapr/hive/hive-2.1/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.clas

hadoop hive apache mapr

hadoop - Hive 存档分区(动态)失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1

我正在尝试从我的表中归档一些旧数据。使用ALTERTABLETABLE_NAMEARCHIVEPARTITION(part_col)查询。Hadoopversion-2.7.3Hiveversion-1.2.1表结构如下，hive>descclicks_fact;OKtimetimestampuser_idvarchar(32)advertiser_idintbuy_idintad_idintcreative_idintcreative_versionsmallintcreative_sizevarchar(10)site_idintpage_idintkeywordvarchar(4

hadoop Execution java apache hive hiveql hadoop2 hadoop-archive

mysql - 执行 concat_ws 和 collect_list 后，Hive Coalesce 函数未返回预期结果

我需要在表服务中转换列服务名称，然后合并值。services:useridservicename1A2B2C3B1C45C我正在尝试的查询是SELECTuserid,COALESCE(a,b,c)ASservicenameFROM(SELECTuserid,concat_ws('',a)ASa,concat_ws('',b)ASb,concat_ws('',c)AScFROM(SELECTuserid,collect_list(a.group_map['A'])ASa,collect_list(a.group_map['B'])ASb,collect_list(a.group_map[

collect_list concat_ws code servicename userid mysql hadoop hive coalesce

hadoop - 如何配置 HUE 连接到远程 Hive 服务器？

我正在尝试使用HUEBeeswax连接我公司的Hive数据库。首先，是否可以使用安装在我的mac上的HUE与远程Hive服务器连接？如果是这样，我应该如何找到在我们的私有(private)服务器上运行的Hive服务器的地址？我唯一能做的就是输入“hive”并在hiveshell中放入一些sql查询。我已经安装了HUE，但不知道如何将它连接到远程Hive服务器。任何提示将不胜感激。最佳答案如果您只需要一个到Hive的桌面连接，您只需要一个JDBC客户端，而不需要像Hue这样的完整Web应用程序。无论如何，HiveCLIisdepr

hadoop Hive section code hue

hadoop - 在 Spark 中计算行时将行插入 Hive

假设我想构建一个Spark应用程序，我希望它能够在中途终止。我仍然想保留成功完成的分区中的数据。我试图通过将它插入Hive表来实现。在(PySpark)伪代码中:defmyExpensiveProcess(x):...udfDoExpensiveThing=udf(myExpensiveProcess,StringType())myDataFrame\.repartition(100)\.withColumn("HardEarnedContent",udfDoExpensiveThing("InputColumn"))\.write.insertInto("SomeExistingHi

行时中计 section code udfDoExpensiveThing hadoop apache-spark hive

202 203 204205206 207 208