草庐IT

hadoop - MapReduce 工作卡住了

我是hadoop的新手。我在ubuntu12.04上使用cloudera管理器安装了clouderahadoop。当我尝试使用cloudera的“测试安装”文档下给出的命令测试我的安装时,我的mapreduce作业卡在了接受阶段,并且永远不会从那里继续。我必须杀死工作。这是我正在使用的命令:sudo-uhdfshadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarpi101在hue作业浏览器中,作业状态已被接受。我们将不胜感激任何形式的帮助。提前致谢。 最佳答案

java - 如何使用 hue 界面将 Java Action 作为 oozie 工作流运行

我创建了一个接受args[0]=Hadoop的javamain方法的测试可执行jar。java程序接受这个参数并在文本文件中写入以下字符串;“currentTimeStamp/t欢迎使用Hadoop!/n”100,000次。我使用hue界面为java操作创建了一个oozie-workflow。请参阅下面的workflow.xml。然而,oozie-workflow执行成功,但操作不会创建或写入文本文件。文本文件路径为/user/ruben123/test.txt。当我使用命令java-jarTestRunner.jar"Hadoop"在本地unix服务器中运行jar文件时,它会正确执行

hadoop - oozie workflow 被杀死时回滚 Action

我一直在尝试在oozie中的一个Action失败时触发一个Action我可以使用错误节点来做到这一点,如下所示如果我的要求是在当前操作在oozie中失败时回滚,这将非常有效。我一直在寻找的是在工作流被终止的情况下触发一个步骤(如果有人进入工作流并单击HUE中的终止按钮。)当我通过HUE使用oozie时,我可以看到在workflow.xml中生成了一个名为kill的节点。我试图将我的自定义操作放在这个空间中,但每次我保存xml时,工作流都会获得默认值,如下所示Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]

hadoop - Oozie 作业在运行 hue 时由于 "not org.apache.hadoop.mapred.Mapper"而失败

我正在尝试通过oozie作业运行wordcount程序。当我像hadoopjarwordcoutjar/data.txt/out一样手动运行wordcoutjar时。它运行良好并给我输出。这是我的wordcount程序的映射器代码的详细信息。publicclassMapperWordcountextendsMapper{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();publicvoidmap(LongWritablekey,Textvalue,Contextcontext)thr

hadoop - ALTER TABLE (Hive) 中的动态数据

我的查询出现错误,我不完全确定原因:ALTERTABLErevenueADDPARTITION(ds=from_unixtime(unix_timestamp(),'yyyy-MM-dd'))LOCATIONCONCAT('s3://userenroll-analytics/prod/revenue/avro/',from_unixtime(unix_timestamp(),'yyyy/MM/dd'))错误:Errorwhilecompilingstatement:FAILED:ParseExceptionline1:38cannotrecognizeinputnear'from_un

shell - 在 oozie 工作流 (HUE) 中,如何将参数从 shell 操作传递到 HDFS fs 操作

在我的工作流程中,我有一个shell操作和一个HDFSfs操作ShellAction与日期相呼应。(日期=2016-10-06)我想在HDFSfsactionmkdir路径中设置上面的日期参数。以下是Action定义。我收到以下错误。EL_ERROREncountered"&",expectedoneof[,,,"true","false","null","(",")","-","not","!","empty",] 最佳答案 您需要连接两个字符串以形成完整路径。Stringconcat(Strings1,Strings2)它返回2

java - Hadoop 查询、日期、循环、BASH 或 Java

我是Hadoop、Linux的新手,并且15年多没有用Java编写代码,所以我通常只使用Hue来运行查询。我的问题是我正在尝试对12个月的数据运行一个基本的选择查询,但是,由于数据集的大小和应用的读取阈值,这个查询总是会失败。因此,我需要每周/每月运行相同的查询,将结果插入预先存在的表中,然后将它们聚合到我最后的12个月期间。原始查询:-SELECTcol1,col2,col3FROMfooWHERElocal_date>='2013-09-01'ANDlocal_date可能的新脚本(PLSQL格式):-DECLAREdtStartDATE;DECLAREdtEndDATE;SETd

python - Pig脚本无法注册UDF

我有一个简单的Pig脚本,它使用我创建的PythonUDF。如果我删除UDF部分,脚本可以正常完成。但是当我尝试注册我的UDF时,出现以下错误:ERROR2997:EncounteredIOException.Filepig_test/py_udf_substr.pydoesnotexist这是我的UDF:@outputSchema("chararray")defget_fistsn(data,n):returndata[:n]这是我的Pig脚本:REGISTER'pig_test/py_udf_substr.py'USINGjythonaspyudf;A=load'pig_test/

hadoop - 在 hadoop 上为 hue 启用 https

阅读文档后,我认为这会简单明了,但根本行不通。我已经生成了一个2048位key并对其进行了自签名。它们位于hue.ini指向的位置:#FilenameofSSLCertificatessl_certificate=/etc/hue/certs/cert/server.crt#FilenameofSSLRSAPrivateKeyssl_private_key=/etc/hue/certs/key/server.key#Webserverlistensonthisaddressandporthttp_host=0.0.0.0http_port=8082所以当我/etc/init.d/hue

ubuntu - Hadoop Hue 无法访问文件系统根目录

我正在从Hue的快速启动向导中获取这条消息。hadoop.hdfs_clusters.default.webhdfs_urlCurrentvalue:http://localhost:50070/webhdfs/v1Failedtoaccessfilesystemroot我试过了,Hue:Failedtoaccessfilesystemroot,但没有任何改变。还有其他想法吗? 最佳答案 我再次尝试了configuration从一开始的步骤,它奏效了.... 关于ubuntu-Hadoo