custom-application

hadoop - 限制 Application Master 请求的资源的属性

HadoopMRv2(Yarn)中是否有一个属性允许我们专门操纵ApplicationMaster请求的资源量(VCores和堆内存)？或者ApplicationMaster会动态评估所需的资源(基于每个应用程序)并为容器请求相应的资源？最佳答案以下属性可用于为YARNApplicationmaster设置VCors和HeapMemory。yarn.app.mapreduce.am.resource.mb8192yarn.app.mapreduce.am.resource.cpu-vcores1yarn.app.mapreduc

Hadoop MapReduce : Custom Input Format

我有一个文件，其中包含文本和“^”之间的数据:一些文字^在这里^还有一些^更多到这里我正在编写自定义输入格式以使用“^”字符分隔行。即映射器的输出应该是这样的:一些文字去这里还有一些更多内容在这里我编写了一个扩展FileInputFormat的自定义输入格式，还编写了一个扩展RecordReader的自定义记录阅读器。下面给出了我的自定义记录阅读器的代码。我不知道如何处理这段代码。在WHILE循环部分使用nextKeyValue()方法时遇到问题。我应该如何从拆分中读取数据并生成自定义键值？我正在使用所有新的mapreduce包而不是旧的mapred包。publicclassMyRec

MapReduce Hadoop 自定 section IOException

java - hadoop、 Jersey 和 JBoss : application won't start

首先，我对JBoss几乎一无所知。昨天之前从来没有接触过它，仍然不太了解它。但是，我公司的一位客户正在使用它来部署我们的应用程序，而我们的最新更新破坏了他们的配置，所以我正在努力解决它。无论如何，这是版本信息:Hadoop:2.7.2Jersey:2.3JBoss:6.1操作系统:Windows(我怀疑这是特定于操作系统的，那只是我正在处理的环境)我们最近向我们的应用程序添加了一个Hadoop连接器模块，这似乎是导致失败的原因。我已经能够重现这个问题，这里是堆栈跟踪:13:32:39,857ERROR[org.jboss.msc.service.fail](MSCservicethre

application hadoop jboss modules Final-redhat java

hadoop - 如何从 `yarn application -list` 访问 Tracking-URL？

我想查看我在yarn中看到的某个作业的yarnwebUI。当我做yarnapplication-list我可以看到跟踪URL.所以，我在chrome中导航到那个页面，它给了我这样的错误:The172.12.15.181pageisn'tworking.172.12.15.181didn'tsendanydata.我显然已经通过ssh进入了应该允许我看到它的机器。另外，这份工作肯定在status=RUNNING在yarn中。那么，是什么阻止我在这个url上看到yarnweb用户界面？我这样做正确吗？谢谢。最佳答案在yarnappl

Tracking-URL application section code yarn hadoop apache-spark pyspark hadoop-yarn

hadoop - Apache pig : Can we convert a custom Writable object to Pig format?

我们有一个自定义可写值对象的SequenceFile，该对象本质上等同于Pig中的复杂包数据类型。有没有一种方便的方法，我们可以编写自定义函数将hadoopWritable对象转换为bag数据类型，然后使用pig脚本对其进行处理？最佳答案一种选择是查看elephant-bird-如果你向下滚动这个github页面到README部分，它有一个关于Pig的部分:PigIncludesconverterinterfaceforturningTuplesintoWritablesandviceversa我从来没有用过它，我想你必须自己实

Writable convert section elephant-bird 自定 hadoop apache-pig

apache-spark - YARN 如何决定启动哪种类型的 Application master？

我提到了this链接并获得对YARN工作原理的公平理解。YARN能够运行Multi-Tenancy应用程序，例如MR、Spark等。关键点是特定于应用程序的ApplicationMaster(AM)。当客户端向ResourceManager提交Job时，ResourceManager如何知道它是哪种应用程序(MR、Spark)并因此启动适当的ApplicationMaster？谁能帮助RM如何知道提交给它的作业类型？编辑:这个问题是:RM怎么知道提交了什么样的Job，而不知道YARN和MR或者Spark之间有什么关系。RM收到一个Job，因此它必须启动第一个运行特定应用程序Applic

apache-spark Application YARN hadoop mapreduce hadoop-yarn hadoop2

python - Hive 转换使用 Python : Unable to initialize custom script

我正在尝试通过将Python脚本作为映射器来测试HiveTRANSFORM。我的hive脚本是:addfile/full/path/to/mapper.py;setmapred.job.queue.name=queue_name;usemy_database;selecttransform(s.year,s.month,s.day,s.hour)using'mapper.py'frommy_tableslimit10;我的Python映射器脚本只是试图回应输入:#!/usr/local/bin/pythonimportsysforlineinsys.stdin:printline我尝试

initialize python code 射器 section hadoop hive

java - HADOOP HTTPFS : giving error "User: ubuntu is not allowed to impersonate ubuntu" while accessing the application through Http

我在我的集群上安装了hadoop1.0.4，有1个主机和3个从机，现在我正在安装HTTPFS(hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT)以使用http协议(protocol)访问HDFS内容，我可以通过它访问正常的页面curl-i"http://myhost:14000"它工作正常:)但是如果我尝试访问HDFS然后它给我错误(ubantu是我的用户):(curl-i"http://myhost:14000/webhdfs/v1?user.name=ubantu&op=OPEN"错误:{"RemoteException":{"message"

ubuntu application section 34 hadoop java hdfs bigdata

idea启动项目，出现报错：Application Server was not connected before run configuration stop

文章目录前言一、开发环境二、分析问题1.检查日志信息2.解决方案修改端口Tomcat参数配置总结前言最近公司的一个传统项目，通过idea启动后，控制台立马就打印了启动完成的日志信息，但是通过前端页面又无法正常访问，随即展开了一番调查。一、开发环境IntelliJIDEA2023.1.2apache-tomcat-8.5.56jdk1.8.0_131SSH（spring2.5.6+Struts22.5.22+Hibernate3.3.2.GA）二、分析问题1.检查日志信息通过对idea控制台信息检查，发现并没有加载项目信息，启动的日志均是tomcat的信息，如下：随后停止了应用，发现右下角有一个

configuration Application span class token intellij-idea java tomcat ssh

scala - Spark : Custom key compare method for reduceByKey

我需要在Scala中使用我自己的类作为键/值对中的键。特别是，我有一个包含两个变量id1和id2的简单类，我希望元素仅根据id2和不是id1。我在网上找不到任何关于如何以及在何处可以重写reduceByKey()方法的比较方法的信息，以便它可以根据我的自定义compare()方法。感谢任何帮助。谢谢你。最佳答案您不能覆盖reduceByKey的比较，因为它无法利用这样一个事实，即您的数据通常在整个集群中的不同执行程序上按key进行混洗。不过，您可以更改key(请注意，根据您使用的转换/操作，这可能会重新洗牌周围的数据)。RDD中

reduceByKey compare code section scala hadoop apache-spark key-value reduce

47 48 495051 52 53