草庐IT

Hadoop - Hive 2 ParseException - 无法识别表达式规范中 'over' '(' 'partition' 附近的输入

自从升级到Hive2后,我查询中的这一行失败了FAILED:ParseExceptionline41:50cannotrecognizeinputnear'over''(''partition'inexpressionspecificationselecttempTable.*,(tempTable.rowrank-1)/(max(tempTable.tableRowRank))over(partitionbytempTable.column1)percent这在HiveServer1中工作正常???????? 最佳答案 刚刚解决了

c# - 如何在查询中将 .net DateTime.Ticks 转换为 Hive DateTime?

我的日志文件在DateTime.Ticks(635677577653488758)中有一个列,我正在尝试将其转换为HadoopHive中的日期。首先,我在MySql上尝试了下面的代码块,它成功了。但是相同的代码在Hive中不起作用,因为date_add函数适用于INT。SELECTDATE_ADD('2001-01-0100:00:00',INTERVAL(MAX(f.date)-631139040000000000)/10MICROSECOND);然后我会这样格式化...SELECTDATE_FORMAT(MyDateFromTicks,'%Y-%m-%dT%T.%fZ');我怎样才

hadoop - 使用 EsStorageHandler 在 Hive 中创建外部表时出错

我在创建外部表以将数据从Hive推送到ElasticSearch时遇到错误。到目前为止我做了什么:1)ElasticSearch-1.4.4设置成功并运行。2)Hadoop1.2.1搭建成功,所有守护进程都启动并运行。3)成功设置Hive-0.10.0。4)在Hadoop/lib和Hive/lib中配置elasticsearch-hadoop-1.2.0.jar。p>5)在Hive中成功创建了几个内部表。执行以下命令时出现错误:CREATEEXTERNALTABLEdrivers_external(idBIGINT,firstnameSTRING,lastnameSTRING,vehi

mysql - GROUP BY 和加入 HIVE

我怎样才能在HIVE中做这样的事情:表1:IDNameFriends1Tom5表2:IDNameDOB1Jerry10/10/19991KateNull1Peter02/11/19831RobertNull1Mitchell09/09/2000我想做的是:对于表1中的每个ID,找出num个不为空的DOB,然后除以Friends我写了一个查询:SELECTt.ID,t.Friends,COUNT(s.DOB)/t.FriendsfromTable1tjoinTable2son(t.ID=s.ID)GROUPBYt.ID当我这样做时,我收到错误消息,因为FRIENDS不是GROUPBYKe

sorting - Hive 分配方式与不分配方式

这听起来很基础,但这个问题困扰了我一段时间。假设我有以下查询SELECTs.ymd,s.symbol,s.price_closeFROMstockssSORTBYs.symbolASC;在这种情况下,如果数据在符号列上分布良好,那么基于符号列进行分布是有意义的,这样所有reducer都能很好地共享数据;将查询更改为以下内容会提供更好的性能SELECTs.ymd,s.symbol,s.price_closeFROMstockssDISTRIBUTEBYs.symbolSORTBYs.symbolASC,s.ymdASC;如果我不指定distributeby子句会有什么影响?在第一个查询中

bash - 从 Apache Hive 运行 bash 别名

我正在尝试在Hadoop机器上创建一个别名并从HiveJVM运行它。当我使用!显式地从Hive运行命令时前缀它有效,但是当我添加别名、获取.bashrc文件并从Hive调用别名时,出现错误。示例:.bashrc内容:#EnvironmentvariablesrequiredbyhadoopexportJAVA_HOME=/usr/lib/jvm/java-7-oracleexportHADOOP_HOME_WARN_SUPPRESS=trueexportHADOOP_HOME=/home/hadoopexportPATH=$PATH:/home/hadoop/binaliasload-

hadoop - 执行 Hive 查询时获取权限被拒绝错误

在连接到直线时执行selectcount(*)fromtablename查询时出现以下错误。ERROR:JobSubmissionfailedwithexception'org.apache.hadoop.security.AccessControlException(Permissiondeniedatorg.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.checkOwner(FSPermissionChecker.java:201)我可以执行showtables;成功但每当我执行查询时都会收到此错误。我以有权访问had

hadoop - Jaspersoft Hive 日期参数问题

我正在使用JasperSoftStudio连接到Hive并传递带有动态日期的查询。该报告应该在昨天的日期进行查询。我在JasperSoftStudio数据集和查询对话框中使用动态时遇到问题。以下查询从Hive命令行运行,但JasperSoftStudio似乎无法识别命令“date_sub”和“unix_timestamp()”。我正在使用JasperSoftStudio6.1版。SELECTcol1,count(col2),count(col3)FROMtable1WHEREdate=date_sub(from_unixtime(unix_timestamp(),'yyyy-MM-dd

hadoop - Hive 动态分区,未创建正确的分区

我正在尝试将数据插入到分区表中,但并未创建所有分区(仅创建了空值和零值),请参见下文。hive>selectstate_code,district_code,count(*)frommarital_statusgroupbystate_code,district_code;TotalMapReducejobs=1启动的MapReduce作业:...Job0:Map:1Reduce:1CumulativeCPU:3.49secHDFSRead:193305HDFSWrite:240SUCCESSTotalMapReduceCPUTimeSpent:3seconds490msecOK280

Hadoop/Hive Collect_list 没有重复项

根据帖子,Hive0.12-Collect_list,我试图找到Java代码来实现一个UDAF,它将完成这个或类似的功能,但没有重复序列。例如,collect_all()返回一个序列A,A,A,B,B,A,C,C我想要返回序列A,B,A,C。依次重复的项目将被删除。有没有人知道Hive0.12中的函数将完成或已经编写了他们自己的UDAF?一如既往,感谢您的帮助。 最佳答案 我前一段时间遇到了类似的问题。我不想写一个完整的UDAF所以我只是用brickhousecollect做了一个组合和我自己的UDF。假设你有这些数据idvalue