草庐IT

action_settings

全部标签

hadoop - 在 Oozie 中运行 Hive Action 时出错

我正在尝试通过Oozie运行hive操作。我的workflow.xml如下:${jobTracker}${nameNode}oozie.hive.defaults${hiveConfigDefaultXml}${hiveQuery}OUTPUT=${StagingDir}Hivefailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]这是我的job.properties文件:oozie.wf.application.path=${nameNode}/user/${user.name}/hiveQueryoozie.libpa

hadoop - 在 oozie Java Action 中传递 HBase 凭据

我需要安排一个与安全hbase交互的oozieJava操作,因此我需要为Java操作提供hbase凭据。我使用的是安全的hortonworks2.2环境,我的工作流XML如下${jobTracker}${nameNode}com.test.hbase.TestHBaseSecure${arg1}Javafailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]我还修改了oozie属性以包含HbaseCredentials类oozie.credentials.credentialclasses=hcat=org.apache.o

hadoop - 有没有办法让 "set"Hadoop Counter 而不是增加它?

API仅提供增加Mapper或Reducer中计数器的方法。有没有办法设置它?或者不管映射器和缩减器运行的次数如何,只增加它的值一次。 最佳答案 你想达到什么目的?这本身就很棘手,因为如果多个映射器试图设置计数器怎么办?谁应该赢?计数器通常只递增的原因是架构可以非常、非常快速和高效地完成此操作。 关于hadoop-有没有办法让"set"HadoopCounter而不是增加它?,我们在StackOverflow上找到一个类似的问题: https://stacko

hadoop - 找不到 hadoop 安装 : $HADOOP_HOME must be set or hadoop must be in the path

所以有点背景。我一直在尝试在CentOS6机器上设置Hive。我按照这个Youtube视频的说明操作:http://www.youtube.com/watch?v=L2lSrHsRpOI就我而言,我使用的是Hadoop-1.1.2和Hive0.9.0,本视频中所有标有“mnt”的目录我都将其替换为“opt”,因为这是我所有的hadoop和hive包的位置被打开了。当我到达视频中实际上应该通过“./hive”运行Hive的部分时弹出此错误:"Cannotfindhadoopinstallation:$HADOOP_HOMEmustbesetorhadoopmustbeinthepath"

hadoop - Hive 操作失败,主类 [org.apache.oozie.action.hadoop.HiveMain],退出代码 [40000]

我是这方面的新手,所以我完全有可能错过一些基本的东西。我正在尝试运行从协调器启动的Oozie工作流。协调器等待文件出现在目录中。工作流包含运行此脚本的Hive操作:CREATEexternalTABLEIFNOTEXISTSdaily_dump(idbigint,creationdatetimestamp,datelastupdatedtimestamp,data1string,data2string)LOCATION'/data/daily_dump';FROMdaily_dumpdINSERTOVERWRITETABLEmydata_orcPARTITION(id,datelast

hadoop - 本地主机 : ERROR: Cannot set priority of datanode process 32156

我正在尝试在ubuntu16.04上安装hadoop但是在启动hadoop时它会给我以下错误localhost:ERROR:Cannotsetpriorityofdatanodeprocess32156.Startingsecondarynamenodes[it-OptiPlex-3020]2017-09-1821:13:48,343WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingresou

hadoop - 配置单元:使用带分隔符的 collect_set

我正在尝试在配置单元查询中使用collect_set按条件对组中的列进行分组。每行都有空格作为分隔符,而不是“,”之类的。在这种情况下如何将分隔符更改为“,”或任何其他分隔符?提前致谢。问候,娜迦本普拉拉 最佳答案 COLLECT_SET返回一个数组,然后您可以使用CONCAT_WS将条目连接成单个逗号分隔值:selectserial_num,concat_ws(",",collect_set(customer_lastName))asconcatenate_lastNamesfromExternal_Tablegroupbyser

bash - Oozie shell 脚本 Action

我正在探索Oozie管理Hadoop工作流的功能。我正在尝试设置调用一些配置单元命令的shell操作。我的shell脚本hive.sh看起来像:#!/bin/bashhive-fhivescripthive脚本(已独立测试)创建一些表等的位置。我的问题是将hivescript保存在哪里,然后如何从shell脚本中引用它。我尝试了两种方法,首先使用本地路径,比如hive-f/local/path/to/file,然后使用像上面那样的相对路径,hive-fhivescript,在这种情况下,我将我的hivescript保存在oozie应用程序路径目录中(与hive.sh和workflow.

hadoop - java.lang.OutOfMemoryError : unable to create new native thread for big data set 错误

我运行的hive查询对于小型数据集运行良好。但我正在运行2.5亿条记录,我在日志中遇到的错误低于此FATALorg.apache.hadoop.mapred.Child:Errorrunningchild:java.lang.OutOfMemoryError:unabletocreatenewnativethreadatjava.lang.Thread.start0(NativeMethod)atjava.lang.Thread.start(Thread.java:640)atorg.apache.hadoop.mapred.Task$TaskReporter.startCommuni

java - (HBase) 错误 : JAVA_HOME is not set and Java could not be found

我已经阅读了一些关于设置JAVA_HOME的评论。因为我是这方面的初学者,所以我没有在不知道自己在做什么的情况下编辑任何东西。我不想把事情搞得更糟。因此,如果您能指导我解决这个问题并告诉我我的编码有什么问题,我将不胜感激。我一直在尝试安装Hadoop,然后安装HBase。在解决了很多困难和错误之后,我终于可以安装Hadoop,并在运行start-all.sh时得到这个输出,一切似乎都很好。>hduser@CSLAP106:~$/usr/local/hadoop/bin/start-all.sh>hduser@CSLAP106:~$jps>3005NameNode>3404JobTrac