草庐IT

hadoop - 为具有多个 spark 客户端的 yarn 集群计算 yarn.nodemanager.resource.cpu-vcores

coder 2024-01-07 原文

如果我有 3 个 spark 应用程序都使用同一个 yarn cluster,我应该如何设置

yarn.nodemanager.resource.cpu-vcores

在 3 个 yarn-site.xml 中的每一个?

(每个 spark 应用程序都需要在类路径上有自己的 yarn-site.xml)

这个值在客户端 yarn-site.xml 中是否重要?

如果是:

假设集群有 16 个核心。

每个 yarn-site.xml 中的值是否应该为 5(总共 15,为系统进程留下 1 个核心)?或者我应该将每个设置为 15 吗?

(注意:Cloudera 表示此处应为系统进程保留一个核心:http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/ 但是,他们没有详细说明针对同一集群使用多个客户端)

假设Spark以yarn为主运行,以集群模式运行。

最佳答案

您是在谈论每个 YARN 节点管理器的服务器端配置吗?如果是这样,它通常会配置为略小于集群中每个节点上的 CPU 核心数(或虚拟核心数,如果您有超线程)。因此,如果您有 4 个节点,每个节点有 4 个内核,您可以将每个节点 3 个专用于 YARN 节点管理器,您的集群将总共有 12 个虚拟 CPU。

然后您在向集群提交 Spark 作业(参见 http://spark.apache.org/docs/latest/submitting-applications.html)时请求所需的资源,YARN 将尝试满足该请求。如果无法完成,您的 Spark 作业(或应用程序)将排队或最终超时。

您可以在 YARN 中配置不同的资源池,以保证特定数量的内存/CPU 资源分配给此类资源池,但这有点高级。

如果您以集群模式提交 Spark 应用程序,则必须考虑 Spark 驱动程序将在集群节点上运行,而不是在您的本地计算机(提交它的计算机)上运行。因此,它至少需要 1 个虚拟 CPU。

希望这能为您澄清一些事情。

关于hadoop - 为具有多个 spark 客户端的 yarn 集群计算 yarn.nodemanager.resource.cpu-vcores,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40537529/

有关hadoop - 为具有多个 spark 客户端的 yarn 集群计算 yarn.nodemanager.resource.cpu-vcores的更多相关文章

  1. hadoop安装之保姆级教程(二)之YARN的配置 - 2

    1.1.1 YARN的介绍 为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的,针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜,提出了全新的资源管理框架YARN. ApacheYARN(YetanotherResourceNegotiator的缩写)是Hadoop集群的资源管理系统,负责为计算程序提供服务器计算资源,相当于⼀个分布式的操作系统平台,⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现,但是因为具有⾜够的通⽤性,同样可以⽀持其他的分布式计算模

  2. ruby - 在 TCPServer (Ruby) 中,我如何从客户端获取 IP/MAC? - 2

    我想在Ruby的TCPServer中获取客户端的IP地址。以及(如果可能的话)MAC地址。例如,Ruby中的时间服务器,请参阅评论。tcpserver=TCPServer.new("",80)iftcpserverputs"Listening"loopdosocket=tcpserver.acceptifsocketThread.newdoputs"Connectedfrom"+#HERE!HowcanigettheIPAddressfromtheclient?socket.write(Time.now.to_s)socket.closeendendendend非常感谢!

  3. ruby-on-rails - 自定义 Rails 的默认 Resourceful Route 路径 - 2

    长话短说我想更改Rails资源路由的默认行为,移动所有资源的create路径,使其成为/resources/new的POST而不是比/resources。设置让我们假设一个像这样指定的足智多谋的路线:#routes.rbresources:events实际生成的路由是:$rakeroutesPrefixVerbURIPatternController#ActioneventsGET/events(.:format)events#indexPOST/events(.:format)events#createnew_eventGET/events/new(.:format)events#n

  4. ruby - 如何获得带有 SSL 客户端证书的 HTTPS 请求以与 Ruby EventMachine 一起使用? - 2

    我正在尝试使用RubyEventMachine访问使用SSL证书身份验证的HTTPSWeb服务,但我没有让它工作。我编写了以下简单代码块来对其进行端到端测试:require'rubygems'require'em-http'EventMachine.rundourl='https://foobar.com/'ssl_opts={:private_key_file=>'/tmp/private.key',:cert_chain_file=>'/tmp/ca.pem',:verify_peer=>false}http=EventMachine::HttpRequest.new(url).g

  5. ruby-on-rails - 在 Ruby on Rails 应用程序中使用客户端 SSL - 2

    我正在为需要与API建立SSL连接的客户端开发应用程序。我得到了三个文件;一个信任根证书(.cer)文件、一个中间证书(.cer)文件和一个签名的响应文件。我得到的安装说明与IIS或Javakeytool程序有关;我正在用RubyonRails构建应用程序,所以这两种方法都不是一个选项(据我所知)。证书由运行API服务的组织自签名,看来我获得了客户端证书以相互验证https连接。我不确定如何使用我的应用程序中的证书连接和使用API签名响应文件的作用我读过"Usingaself-signedcertificate"和thisarticleonOpenSSLinRuby但两者似乎都不是很到

  6. ruby - 为什么这个启用 SSL 的 Ruby 服务器/客户端测试有效? - 2

    我正在努力在Ruby中创建启用SSL的服务器,以及与服务器一起使用的相应Ruby客户端。为了进行测试,我使用以下命令创建了自己的根CA证书。$:~/devel/ssl-test/ssl/CA$opensslgenrsa-outTestCA.key2048GeneratingRSAprivatekey,2048bitlongmodulus............+++...........................+++eis65537(0x10001)$:~/devel/ssl-test/ssl/CA$opensslreq-new-keyTestCA.key-outTestCA.

  7. 大数据之Hadoop数据仓库Hive - 2

    目录:一、简介二、HQL的执行流程三、索引四、索引案例五、Hive常用DDL操作六、Hive常用DML操作七、查询结果插入到表八、更新和删除操作九、查询结果写出到文件系统十、HiveCLI和Beeline命令行的基本使用十一、Hive配置一、简介Hive是一个构建在Hadoop之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类SQL查询功能,用于查询的SQL语句会被转化为MapReduce作业,然后提交到Hadoop上运行。特点:简单、容易上手(提供了类似sql的查询语言hql),使得精通sql但是不了解Java编程的人也能很好地进行大数据分析;灵活性高,可以自定义用户函数(UDF)和

  8. ruby-on-rails - 在处理电子邮件回复时,我怎样才能忽略任何电子邮件客户端细节和历史记录? - 2

    我有一个通过IMAP处理传入电子邮件的Rails应用程序。当前使用一种方法来搜索TMail对象的各个部分以查找给定的content_type:defself.search_parts_for_content_type(parts,content_type='text/html')parts.eachdo|part|ifpart.content_type==content_typereturnpart.bodyelseifpart.multipart?ifbody=self.search_parts_for_content_type(part.parts,content_type)ret

  9. ruby-on-rails - rails : route helpers for nested resources - 2

    我有如下嵌套资源:resources:categoriesdoresources:productsend根据RailsGuides,Youcanalsouseurl_forwithasetofobjects,andRailswillautomaticallydeterminewhichrouteyouwant:Inthiscase,Railswillseethat@magazineisaMagazineand@adisanAdandwillthereforeusethemagazine_ad_pathhelper.Inhelperslikelink_to,youcanspecifyju

  10. ruby-on-rails - Heroku Cedar - 没有安装 Resque 前端的静态 Assets - 2

    我有一个简单的Rails应用程序部署到HerokuCedar堆栈。该应用程序使用Resque并安装了ResqueSinatra前端应用程序,因此我可以监控队列:#routes.rb...mountResque::Server,:at=>"/resque"这很好用,但是当部署到Heroku时,Resquefront-end'sCSS&JavaScript没有被送达。一段Heroku的日志表明它正在返回零字节:...2011-07-13T16:19:35+00:00heroku[router]:GETmyapp.herokuapp.com/resque/style.cssdyno=web.

随机推荐