ACCESS_GROUP

java - 如何在 Hive 嵌入式模式下运行包含 "select count(*)"和 "group by"子句的 Hive Sql 查询？

如何在Hive嵌入式模式下运行此查询(1)selectproduct,count(*)ascntfromhive_bigpetstore_etlgroupbyproduct在Maven控制台中，我得到一个InvocationTargetException异常在我找到的Hive日志文件中java.lang.Exception:java.lang.NullPointerExceptionatorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:354)Causedby:java.lang.NullPointe

斯卡拉 Spark /鲨鱼 : How to access existing Hive tables in Hortonworks?

我正在尝试查找有关该主题的方法的一些文档/描述，请帮忙。我安装了Hortonworks的Hadoop2.2.0以及一些我需要查询的现有Hive表。HiveSQL在单个节点和集群上的运行速度极慢且不合理。我希望鲨鱼能更快地工作。从Spark/Shark文档中我无法弄清楚如何让Shark与现有的Hive表一起工作。任何想法如何实现这一目标？谢谢! 最佳答案您需要在特定于shark的配置单元目录中配置Metastore。在我回答的类似问题中提供了详细信息here.总而言之，您需要将hive-default.xml复制到hive-site

斯卡拉斯卡 gt lt property scala hadoop hive apache-spark shark-sql

windows - 在 Windows7 中从 c# 代码执行时 Hadoop 命令不工作，错误显示 : "Access is denied"

我正在使用winutils.exetaskcreateipipconfig从cmd以管理员权限执行Hadoop命令并显示结果。但是，如果我在具有管理员权限的C#程序中尝试相同的操作，则会显示Accessisdenied错误。错误:C:Hadoop\bin>winutils.exetaskcreateipipconfigcreateTaskerror(5):Accessisdenied. 最佳答案问题出在WinUtils.exe上。WinUtils.exe在task.c文件的createTask()方法中使用了AssignProce

c#行时 strong section AssignProcessToJobObject windows hadoop permissions

hadoop - Hive QL 中的条件 GROUP BY 子句

我正在尝试在HiveQL脚本中参数化GROUPBY子句。SELECTCOUNT(*)ASsales,country,state,cityFROMtestdb.dataWHEREPRICE>5GROUPBYIF(TRUE,(country,state,city),(country,state))如何实现这样的查询？最佳答案我曾尝试在GROUPBY及其作品中使用CASE语句。不过，您可能想要验证查询结果。如果您可以将您的条件转换为case语句，则此查询可以工作。SELECT*FROMtestdb.dataWHEREprice>5GR

hadoop GROUP section country mapreduce hive cloudera hiveql

python - 如何使用 Group_Map 使用 Python 3 修复 Spark.SQL 中的 "Cannot use null as map key!"错误

我正在使用Spark.SQL并尝试使用MAP语句创建一个数据透视表，以便将一列的值作为不同的列。我用这个查询准备了第一个表:spark.sql("""CREATETABLETABLE_01STOREDASPARQUETASselectROWS,COLUMNS,count(*)asNUM_ROWSfromTABLE_00groupbyROWS,COLUMNSorderbyROWS,COLUMNS""")想法是将其转换为:ROWSCOLUMNSNUM_ROWSVALUE1COL22VALUE1COL350VALUE2COL120VALUE2COL21VALUE2COL330进入这个:COL

Group_Map amp code COL section python python-3.x apache-spark hadoop

java - 错误 : org. apache.hadoop.security.AccessControlException : Permission denied: user=root, access=READ_EXECUTE,

我在CentOS6机器上使用的是hadoop-1.2.1版本，并且已经配置好，它运行成功，我还在Eclipsekepler中安装了hadoop的插件，但不幸的是我得到了一个权限被拒绝的错误，我有如图所示，我试图通过阅读许多博客来解决这个问题，但我仍然被困在那里..有人可以解决这个问题吗？最佳答案我从您的问题中了解到，我想您正在使用操作系统的“root”登录以启动Hadoop。我建议重新启动您的系统并从“Hadoop”(在用户列表中给出，例如root、Guest、Hadoop)登录，然后启动Hadoop。然后它就会工作。

AccessControlException READ_EXECUTE section Hadoop java eclipse

hadoop - pig 脚本 : Find sum of items in a group

这是我要运行的行counts=FOREACHz{sum=SUM(B::counter);GENERATEgroupasA::month,sum;};但是我收到以下错误:Invalidfieldprojection.Projectedfield[B::counter]doesnotexistinschema:group:chararray,y:bag{:tuple(A::id:chararray,A::month:chararray,B::counter:int)}.如何对这样一个包含基于一列分组的元组包的模式进行求和聚合？最佳答案

hadoop group section chararray counter apache-pig

hadoop - Hive group by with cube 和 group by 在同一个查询中

假设我正在观察表架构如下的超速事故:createtablespeeding_data(date_of_occurrencedate,yearint,makestring,modelstring,speedint);我想观察这些特征的不同组合下的平均速度，但希望它始终按date_of_occurrence分组，例如可能是这样的selectdate_of_occurrence,year,make,model,avg(speed)fromspeeding_datagroupbydate_of_occurrencegroupbyyear,make,modelwithcube;只是想知道在h

group hadoop section code date_of_occurrence hive hql hiveql

hadoop - 配置单元 : group column based on max value

我有一个包含字段的表datevalue10-02-19002309-05-19012210-03-19001010-02-190124....我必须返回每年的最大值即，190023190124我尝试了以下查询，但得到了错误的答案。SELECTYEAR(FROM_UNIXTIME(UNIX_TIMESTAMP(date,'dd-mm-yyyy')))asdate,MAX(value)FROMtebGROUPBYdate;有人可以建议我查询吗？最佳答案选项1selectyear(from_unixtime(unix_timestam

配置单 hadoop code pre section hive hiveql

scala - 星火 SQL : access file in current worker node directory

我需要使用spark-sql读取一个文件，该文件在当前目录中。我使用此命令解压缩存储在HDFS上的文件列表。valdecompressCommand=Seq(laszippath,"-i",inputFileName,"-o","out.las").!!该文件在当前工作节点目录中输出，我知道这一点是因为通过scala执行"ls-a"!!我可以看到该文件在那里。然后我尝试使用以下命令访问它:valdataFrame=sqlContext.read.las("out.las")我假设sql上下文会尝试在当前目录中查找文件，但事实并非如此。此外，它不会抛出错误，而是会发出一条警告，指出找不到

directory current code section 该文 scala hadoop apache-spark apache-spark-sql spark-dataframe

254 255 256257258 259 260