HIVE

sql - Hive 复杂类型来处理一对多关系

如何使用Hive复杂类型处理一对多关系？例如，给定两个表:artist:artist_id,first_name,last_namesong:song_id,song_name,song_date,artist_id如何编写hiveql或sql以将歌曲集合包含到独特的艺术家中，即例如112,drew,jackson,{10:[hill,1992],13:[away,2011],....}113,maria,mcmillan,{25:[denial,2000],26:[fly,1990],....} 最佳答案 selecta.arti

hadoop - Sqoop import-all-table to hive 在特定数据库中失败

我正在执行下面的sqoop命令sqoopimport-all-tables-m1\--connect"jdbc:mysql://nn01.itversity.com:3306/retail_db"\--username=retail_dba\--password=itversity\--hive-import\--hive-home/apps/hive/warehouse\--hive-overwrite\--hive-databasegrv_sqoop_import\--create-hive-table\--compress\--compression-codecorg.apach

import-all-table hadoop section code hive sqoop

hadoop - 从存储在 .avsc 文件中的表架构创建配置单元表

我有一个hive表模式存储在一个hdfs文件schema.avsc中。我想创建一个具有相同模式的配置单元表，并希望从数据存储在HDFS文件系统中的另一个hdfs路径转储数据。1:如何创建表？2:如何将存储在hdfs文件中的数据转储到创建的表中？最佳答案 Howcanicreateatable?AvroSerDe上的ApacheHive文档显示了基于存储在文件中的Avro模式创建表的语法。为方便起见，我将在此处重复其中一个示例:CREATETABLEkstPARTITIONEDBY(dsstring)ROWFORMATSERDE'o

配置单 hadoop section 39 apache hive

hadoop - 将 XML 数据加载到配置单元表时出错

我正在尝试将XML文件加载到我的配置单元表中。下面是我的配置单元表查询。CREATETABLEMYDATA(NAMESTRING,AGEINT,SEXSTRING)ROWFORMATSERDE'com.ibm.spss.hive.serde2.xml.XmlSerDe'WITHSERDEPROPERTIES("column.xpath.NAME"="/TAG/NAME/text()","column.xpath.AGE"="/TAG/AGE/int()","column.xpath.SEX"="/TAG/SEX/text()")STOREDASINPUTFORMAT'com.ibm.s

时出配置单 34 code lt hadoop hive

hadoop - 运行存储在 HDFS 位置的配置单元脚本

我正在尝试运行存储在HDFS位置(hdfs://nameservice1/user/neeraj)中的配置单元脚本(.hql文件)，但我找不到正确的命令来执行它。有没有办法直接从HDFS位置运行它而不是将它移动到我的/home/位置？最佳答案 hive-f演示cat>my_script.sqlselect1+1asresult;hdfsdfs-putmy_script.sql/tmphive-fselect1+1asresult;OK2 关于hadoop-运行存储在HDFS位置的配置单

配置单 hadoop section my_script code hive hdfs

json - 将 Json 转换为 HIVE 中的单独列

我在Hive数据库表中有4列。前两列是字符串类型，第3和第4列是JSON。类型。如何提取不同列中的json数据。Hive中可用的SERDE似乎只处理json数据。我有普通(STRING)和JSON数据。我如何在此处的单独列中提取数据。例子:abc2341{max:2500e0,value:"20",Type:"1",ProviderType:"ABC"}{Name:"ABC",minA:1200e0,StartDate:1483900200000,EndDate:1483986600000,Flags:["flag4","flag3","flag2","flag1"]}xyz6789{

json 34 jsn jsn2 hadoop hive

hadoop - 配置单元连接错误

我一直在尝试在hadoop中安装hive，但弹出此错误，有人知道这是什么意思吗？最佳答案问题是因为您使用的Hadoop3仍处于第二个alpha测试阶段，简单的解决方案是删除它并安装hadoop2.7.3 关于hadoop-配置单元连接错误，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/42894870/

配置单 hadoop section stackoverflow hive

hadoop - 如何为查询结果添加一个整数唯一 ID - efficiently？

给定一个查询，select*from...(这可能是CTAS语句的一部分)目标是添加一个额外的列ID，其中ID是一个唯一的整数。select...asID,*from...附言ID不必是连续的(可能有间隙)ID可以是任意的(不必代表结果集中的特定顺序)row_number逻辑上解决了问题-selectrow_number()over()asID,*from...问题是，至少目前，全局row_number(没有partitionby)正在使用单个reducer(hive)/task(spark)实现。最佳答案 hivesetmapr

何为 efficiently code strong section hadoop apache-spark hive apache-spark-sql hiveql

hadoop - 如何使用配置单元计算由 "|"分隔符分隔的每列中的单词数？

输入数据是+----------------------+--------------------------------+|movie_name|Genres|+----------------------+--------------------------------+|digimon|Adventure|Animation|Children's||Slumber_Party_Massac|Horror|+----------------------+--------------------------------+我需要这样的输出+----------------------+

配置单单词 section code Adventure hadoop hive hiveql

mysql - 编译语句 : FAILED: SemanticException [Error 10002] 时出错

selectd.order_typefrommigu_td_aaa_order_log_ddwhereexists(select1frommigu_userrwherer.user_id='156210106'andr.user_num=d.serv_number)andd.product_idin('2028594290','2028596512','2028597138')orderbyd.opr_timedesclimit1为什么上面的sql失败，说明:失败:SemanticException[错误10002]:第4:11行无效的列引用“opr_time”但下面的一个有效:sel

时出 SemanticException code order select mysql sql hadoop hive

105 106 107108109 110 111