HIVE2

hadoop - Spark 在 yarn-cluster 上提交 - Hive 错误

我正在使用使用spark1.6的HDP2.4发行版，我正在尝试在yarn-cluster上提交spark作业。当我在yarn-client和本地提交作业时，它正在运行。但是当使用yarn-cluster提交作业时会出现以下错误。java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClientCausedby:java.lang.NoClassDefFoundError:Couldnotinitializeclassorg.apache.d

hadoop - Hive 不在 HDFS 中存储仓库

我已经在我的本地系统上下载了hive安装并将hive-site.xml复制到Sparkconf目录中。我尝试使用sparkshell在Hive上下文中创建一个托管表。我在hive-site.xml中放置了以下属性(存在于spark的conf目录中):hive.metastore.warehouse.dir/user/hive/warehouse此外，我已将HADOOP_HOME放入spark-env.sh中:exportHADOOP_CONF_DIR=/opt/hadoop/conf根据Hive文档，Hive仓库应该存储在HDFS中，但仓库存储在本地驱动器(/user/hive/war

hadoop Hive section code warehouse hdfs

hadoop - 插入覆盖目录的 Hive Case 语句

当尝试使用以下逻辑运行HQL脚本时，我收到错误:ParseExceptionline4:0cannotrecognizeinputnear'CASE''WHEN''mytable'inserdepropertiesspecification脚本逻辑INSERTOVERWRITEDIRECTORY'/example/path'ROWFORMATDELIMITEDFIELDSTERMINATEDBY','CASEWHEN${hiveconf:tbl_name}='mytable'THENSELECT*FROM${hiveconf:tbl_name}LEFTOUTERJOIN...;WHEN

hadoop Hive tbl_name 39 hiveconf parameters case hiveql

解决Hive在DataGrip 中注释乱码问题

注释属于元数据的一部分，同样存储在mysql的metastore库中，如果metastore库的字符集不支持中文，就会导致中文显示乱码。不建议修改Hive元数据库的编码，此处我们在metastore中找存储注释的表，找到表中存储注释的字段，只改对应表对应字段的编码。如下两步修改，缺一不可。（1）修改mysql元数据库我们用到的注释有两种：字段注释和整张表的注释。COLUMNS_V2表中的COMMENT字段存储了Hive表所有字段的注释，TABLE_PARAMS表中的PARAM_VALUE字段存储了所有表的注释。我们可以通过命令修改字段编码，也可以用DataGrip或Navicat等工具修改，此

乱码注释 xff0c xff xff0 hive hadoop 数据仓库

hadoop - 有没有办法在将数据从 HIVE 移动到 ES 时跳过 ES 中的行插入？

我正在尝试使用以下查询将数据(超过3亿行)从配置单元表复制到Elasticsearch:-插入覆盖表TableNameESselect*fromHiveTableName;&在插入一些行后我得到了这个异常。我知道这是因为ES中映射的数据类型不同...Causedby:org.elasticsearch.hadoop.rest.EsHadoopInvalidRequest:Foundunrecoverableerror[xx.xx.xx.xx:9200]returnedBadRequest(400)-[MapperParsingException[failedtoparse[pctbla

hadoop HIVE section 34 39 elasticsearch

hadoop - Hive 查询在 Tez 上无限运行

下面是我尝试在Hive上运行的查询，执行引擎为tez。SELECTA.CITY,A.NAME,B.PRICE,(ROW_NUMBER()OVER(PARTITIONBYA.NAMEORDERBYB.PRICE))ASRNUMFROMTABLE1ALEFTJOINTABLE2BONA.NAME=B.NAMEWHERE(A.COLUMN2>=B.COLUMN3ANDA.COLUMN2当我在Hive中对我的数据运行上述查询时，它会持续运行数小时没有任何结果，但在句法上上述查询是正确的。TABLEA和TABLEB都有数百万条记录。我尝试过更改数据格式、增加容器大小、更改reducer的数量以及

hadoop Hive section https hiveql hadoop2 tez

hadoop - 如何使用 Pyspark 从 Hive Context 调用用 Java 编写的 Hive UDF

我在配置单元中使用getLastProcessedVal2UDF从表中获取最新的分区。这个UDF是用java编写的。我想通过配置单元上下文使用来自pyspark的相同UDF。dfsql_sel_nxt_batch_id_ini=sqlContext.sql('''selectl4_xxxx_seee.**getLastProcessedVal2**("/data/l4/work/hive/l4__stge/proctl_stg","APP_AMLMKTE_L1","L1_AMLMKT_MDWE","TRE_EXTION","2.1")''')错误:ERRORexec.FunctionR

Hive 编写 code section pyspark hadoop apache-spark apache-spark-sql

hadoop - Sqoop 导入到 HCatalog/Hive - 表不可见

使用Ambari2.2.2.0安装HDP-2.4.2.0-258我必须导入几个SQLServer模式，这些模式应该可以通过Hive、Pig、MR和任何第三方(将来)访问。我决定导入HCatalog。Sqoop提供了导入到Hive或HCatalog的方法，我想如果我导入到HCatalog，同一个表将可以从HiveCLI、MR和Pig访问(请评估我的假设)。问题:如果直接导入到Hive，该表是否可供Pig、MR使用？如果导入到HCatalog，通过Hive访问需要做什么？是否需要在Hive中预先创建表？如果是，在HCatalog中导入的优势是什么，(我可以直接在Hive中导入)/(在HDF

HCatalog hadoop SettingAttribute INFO mapreduce hive sqoop hortonworks-data-platform

hadoop - Hive Split 函数选择最后一组

我想拆分URL结构并且只对拆分的最后一部分感兴趣。例如www.example.com/subdirect/mainpage.aspxwww.example.com/mainpage4.aspxwww.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx这里我只想要aspx页面而不是之前的东西，即我只想返回下面的文本mainpage.aspxmainpage4.aspxmainpage2.aspx我尝试使用split，但我不确定如何动态地只返回URL结构的最后一部分。有任何想法吗？这是我正在尝试的脚本selectsplit(UR

hadoop Split code section mainpage hive hiveql

apache - 我正在使用 Hadoop 2.7.2 安装 Hive 2.0.0

我正在尝试使用Hadoop2.7.2安装Hive2.0.0但是我不知道我的执行有什么问题parallels@ubuntu:/usr/local/apache-hive-2.0.0-bin$./bin/hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/apache-hive-2.0.0-bin/lib/hive-jdbc-2.0.0-standalone.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J:Fo

apache Hadoop apache-hive hive

68 69 707172 73 74