草庐IT

Application_home

全部标签

java - 为什么 hadoop_home 设置不正确

我按照以下说明为Windows安装hadoop2.3:https://www.youtube.com/watch?v=VhxWig96dME而且我可以让它在我的Macbook上的Windows8上运行得很好。但是,当我在我的Windows服务器上重复相同的步骤时,当我运行命令行时:hadoop它显示此错误:HADOOP_HOMEisnotsetcorrectly我再次非常仔细地检查,发现HADOOP_HOME设置得非常精确(如说明书和我之前在笔记本电脑上的设置)。那么可能是什么问题以及如何解决呢?笔记本电脑和服务器的设置有什么不同吗?我注意到当我运行相同的java安装文件(javase

apache-spark - 如何使用 APPLICATION ID 提交 YARN 作业

我想知道YARNCLI是否提供了使用上一次执行生成的APPLICATION_ID重新提交YARN应用程序的可能性。例子:/opt/mapr/spark/spark-2.1.0/bin/spark-submit--num-executors5--executor-memory2G--executor-cores2--masteryarn--deploy-modecluster--files/opt/mapr/hive/hive-2.1/conf/hive-site.xml--classcom.cisco.sdp.cdx.processing.DenormSchedulerJSONDeno

hadoop - 在 YARN 集群的特定节点上运行我自己的 application master

首先,我使用的是Hadoop-2.6.0。我想在YARN集群中的特定节点上启动我自己的appmaster,以便在预定的IP地址和端口上打开服务器。为此,我编写了一个驱动程序,在其中创建了一个ResourceRequest对象并调用了setResourceName方法来设置主机名,并将其附加到ApplicationSubmissionContext对象通过调用setAMContainerResourceRequest方法。我尝试了几次,但无法在特定节点上启动AppMaster。搜索代码后,我发现RMAppAttemptImpl使我在ResourceRequest中设置的内容无效,如下所示

ubuntu - 无法从 $HIVE_HOME 以外的任何其他位置启动配置单元

我已经使用Derby10.12.1.1安装了Hive2.1.0我可以从以下位置运行Hive:$HIVE_HOME但是当我从另一个位置运行时,比如root或其他地方,它会抛出一个错误:Exceptioninthread"main"java.lang.RuntimeException:Couldn'tcreatedirectory$/tmp/98e1866e-f8c7-451d-b958-1f773f0c4b02_resourcesatorg.apache.hadoop.hive.ql.util.ResourceDownloader.ensureDirectory(ResourceDown

hadoop - 运行 YARN 应用程序时获取 "User [dr.who] is not authorized to view the logs for application <AppID>"

我在HDP2.5集群中使用ApacheTwill运行自定义Yarn应用程序,但是当我转到我的容器网页时,我无法看到我自己的容器日志(syslog、stderr和stdout):当我导航到此页面时,登录名也从我的kerberos更改为“dr.who”。但是我可以看到map-reduce作业的日志。Hadoop版本为2.7.3,集群启用了yarnacl。 最佳答案 我在使用hadoopui时遇到了这个问题。我在this中找到doc,hadoop.http.staticuser.user默认设置为dr.who,您需要将其包含在相关设置文件

hadoop - yarn 中的 "Application priority"

我正在使用Hadoop2.9.0。是否可以在YARN中提交具有不同优先级的作业?根据一些JIRA票据,应用程序优先级似乎已经实现。我尝试使用YarnClient,并在提交作业之前为ApplicationSubmissionContext设置优先级。我还尝试使用CLI和updateApplicationPriority。但是,应用程序优先级似乎没有任何变化,它始终保持为0。我是否误解了YARN的ApplicationPriority概念?我看到了一些关于设置队列优先级的文档,但对于我的用例,我需要一个队列中的所有作业。将不胜感激任何对我的理解的澄清,或对我可能做错了什么的建议。谢谢。

maven - 需要将 flink-hadoop-compatibility-2.10 jar 显式复制到 EMR 集群上的 ${FLINK-HOME}/lib 位置

我目前正在开发一个Flink应用程序,该应用程序使用一些Hadoop依赖项将数据写入S3位置。在本地环境中它运行良好,但是当我在EMR集群上部署这个Flink应用程序时,它抛出了与兼容性问题相关的异常。我得到的错误信息是java.lang.RuntimeException:无法加载类“org.apache.hadoop.io.Writable”的TypeInformation。您可能缺少“flink-hadoop-compatibility”依赖项。在org.apache.flink.api.java.typeutils.TypeExtractor.createHadoopWritab

Hadoop Cygwin Windows 7 JAVA_HOME 路径未找到且命令未找到

我已经通过谷歌尝试了所有可能的解决方案,但仍然无法正常工作我没有从hadoop-env.sh和bin/java中得到这个命令未找到的错误,不是这样的目录,这里是hadoop-env.sh导出JAVA_HOME=/cygdrive/c/Java/jre6导出JAVA_HOME=c:/Java/jre6下面是我的错误-bash-4.1$bin/hadoopnamenode-format/usr/local/hadoop-1.2.1/libexec/../conf/hadoop-env.sh:第2行:$'\r':找不到命令/usr/local/hadoop-1.2.1/libexec/../

java - Hadoop hdfs 显示 ls : `/home/hduser/input/' : No such file or directory error

我已经使用thistutorial在一台机器上安装了Hadoop2.6.我使用的是Ubuntu12.04机器和Java版本1.6.0_27。我已经为Hadoop操作创建了单独的用户hduser。我已经设置了HADOOP_HOME环境变量的值/usr/local/hadoop我已经提取了Hadoop分布。现在我正在关注example.但是当我执行命令时$HADOOP_HOME/bin/hdfsdfs-ls/home/hduser/input/它给出了以下错误-15/01/0218:32:38WARNutil.NativeCodeLoader:Unabletoloadnative-hado

hadoop - Amazon EMR Application Master Web UI?

我已经开始使用HadoopYARN(AMI3.3.1)在AmazonEMR上运行PIG作业,但是由于Yarn中不再有作业跟踪器,我似乎无法找到WebUI以便我可以跟踪MapReduce作业的Mappers和Reducers的数量,当我尝试访问资源管理器UI页面中提供的ApplicationMaster链接时,我被告知该页面不存在(下面提供的图片)。有谁知道我如何通过我的网络浏览器访问一个UI,它会根据映射器、reducer的数量和每个完成的百分比等向我显示当前的工作状态?谢谢 最佳答案 从ResourceManager网页单击App