草庐IT

指挥调度

全部标签

hadoop - 在 YARN 上运行时,Spark 调度程序池如何工作?

我有混合的Spark版本(1.6、2.0、2.1),全部部署在YARN(Hadoop2.6.0/CDH5.5)上。我试图保证某个应用程序永远不会缺少我们YARN集群上的资源,无论那里可能正在运行什么。我启用了随机播放服务并设置了一些FairSchedulerPools如Spark文档中所述。我为我希望永远不会资源匮乏的高优先级应用程序创建了一个单独的池,并为它提供了minShare资源:FAIR10FAIR124当我在YARN集群上运行Spark应用程序时,我可以看到我配置的池已被识别:17/04/0411:38:20INFOscheduler.FairSchedulableBuild

r - R脚本的分布式调度系统

我想在多台机器-Windows或Ubuntu-(一个任务只在一台机器上)上安排和分发R脚本的执行(例如使用RServe)。我不想重新发明轮子,而是想使用一个已经存在的系统以最佳方式分配这些任务,理想情况下有一个GUI来控制脚本的正确执行。1/是否有可用于此目的的R包或库?2/一个似乎被广泛使用的库是带有ApacheHadoop的mapReduce。我对这个框架没有经验。你会为我的目的建议什么安装/插件/设置?编辑:以下是有关我的设置的更多详细信息:我确实有一个充满机器(小型服务器或工作站)的办公室,这些机器有时也用于其他目的。我想使用所有这些机器的计算能力并在它们上分发我的R脚本。我还

scala - Apache Spark - spark 中的内部作业调度程序如何定义用户和池

我很抱歉在这里有点笼统,但我对作业调度在spark中的内部工作方式有点困惑。来自文档here我知道这是HadoopFairScheduler的某种实现。我无法理解这里的用户到底是谁(是linux用户、hadoop用户还是spark客户端?)。我也无法理解这里的池是如何定义的。例如,在我的hadoop集群中,我将资源分配给了两个不同的池(我们称它们为团队1和团队2)。但是在sparkcluster中,不同的pool和里面的user不会实例化自己的sparkcontext吗?这再次让我质疑,当我将属性设置为spark.scheduler.pool时,我传递了哪些参数。我基本了解驱动程序如何

hadoop - 如何编写自己的 Hadoop 调度程序?

最近在研究hadoop的scheduler机制。使用0.20.2(包括公平和容量)看过一些论文,LATE\DeadlineScheduler...有人试过吗?或者有指南吗?谢谢 最佳答案 如果您打算做自己的调度程序,也许您可​​以考虑作者DattaDhok的文档-mapreduce中基于学习的准入控制和任务分配。他们在准入控制和基于学习的hadoop调度程序方面做了一些工作。源代码可用。您是否找到关于这些主题的任何其他文件? 关于hadoop-如何编写自己的Hadoop调度程序?,我们在

java - 分布式作业调度、管理和报告

我最近玩了一次Hadoop并对其MapReduce作业的调度、管理和报告印象深刻。它似乎使新工作的分配和执行变得非常无缝,使开发人员能够专注于他们工作的实现。我想知道在Java领域中是否存在用于分布式执行作业的不容易表示为MapReduce问题的东西?例如:需要任务协调和同步的工作。例如,它们可能涉及任务的顺序执行,但并发执行某些任务是可行的:.--B--..--A--||--.|'--C--'|Start--||--Done||'--D-------------'您想要分配但不提供任何输出以减少的CPU密集型任务-例如图像转换/调整大小。那么有没有Java框架/平台提供这样的分布式计

php - 区间调度算法或事件选择算法

我在这个问题上苦苦挣扎了这么久。有n个人想在一家旅馆里住同一个房间。每个人都想在自己方便的时间入住酒店,但一次只能入住一个人。假设房间从早上5点到晚上11点可用。酒店经理从入住该房间的每个人那里收取500卢比。一个人在那个房间里呆多久并不重要。我们必须最大化经理的利润。假设n=4,即四个人想要同一个房间。假设第一个人想要早上6点到早上8点的房间,第二个人想要早上7点到早上8点的房间,第三个人想要早上8点到中午12点的房间,第四个人想要上午11点到下午1点的房间。通过观察上图,我们可以很容易地看出经理最多只能允许两个人入住(1stand3rdor1stand4thor2ndand3rdo

php - Laravel 调度程序时区

如何设置Laravel调度程序在特定时区的特定时间运行任务?服务器设置为UTC,但我想在Pacific/Auckland时区的每周一中午12点运行任务。例如这会起作用,但时区是UTC:protectedfunctionschedule(Schedule$schedule){$schedule->command('run-report')->weekly()->mondays()->at('12:00'));} 最佳答案 你可以使用timezone()方法:$schedule->command('run-report')->weekl

php - Laravel 调度程序每天在特定时间运行两次

如何在特定时间每天运行两次Laravel调度程序?假设我希望我的命令每天上午9点和下午5点运行有一个使用twiceDaily的选项,但我不确定如何指定时间 最佳答案 您可以使用手动cron表达式:$schedule->command('foo')->cron('09,17***');阅读更多:http://laravel.com/docs/5.0/artisan#scheduling-artisan-commands如果您不熟悉cron表达式,这里是漂亮的GUI:http://cron.nmonitoring.com/cron-ge

php - 是否有可重复使用的 PHP 路由器/调度程序?

我正在使用一个简单的框架来处理基于查询参数的请求。http://example.com/index.php?event=listPagehttp://example.com/index.php?event=itemView&id=1234我想把干净的url放在前面,这样你就可以通过这种方式访问​​它:http://example.com/listhttp://example.com/items/1234我知道路由和调度是如何工作的,我可以自己写。但我宁愿利用已经解决这个问题的所有代码。有谁知道提供此功能的通用库或类,但会让我从路由匹配中返回我想要的任何内容?像这样。$Router=ne

php - 在任务调度中追加输出

使用sendOutputTointaskscheduling,我们可以将任务输出存储在文件中:$schedule->command('test')->everyMinute()->sendOutputTo(storage_path('test'));但我不想只存储最后一次执行,我需要一个日志。如何在单个文件中记录计划任务输出? 最佳答案 appendOutputTo不是您要查找的内容吗?$schedule->command('test')->everyMinute()->appendOutputTo(storage_path('te