default-scheduler

docker - Hue 访问 HDFS : bypass default hue. ini？

设置我正在尝试使用bde2020提供的图像组成一个轻量级的最小hadoop堆栈。(学习目的)。现在，堆栈包括(除其他外)一个名称节点数据说明色调基本上，我是从欧洲大数据开始的officialdockercompose,并添加了一个基于theirdocumentation的色调图像问题Hue的文件浏览器无法访问HDFS:Cannotaccess:/user/dav.TheHDFSRESTserviceisnotavailable.Note:youareaHueadminbutnotaHDFSsuperuser,"hdfs"orpartofHDFSsupergroup,"supergrou

hadoop - 无法建立与本地主机的连接 :10000/default: java.net.ConnectException:连接被拒绝

我从事Hadoop/Hive方面的工作。我已经安装了Hadoop1.1.2和Hive0.10.0。当我使用Hive作为命令提示符时它工作正常，但是当我在Eclipse中使用它时JDBC然后给出以下错误:Couldnotestablishconnectiontolocalhost:10000/default:java.net.ConnectException:Connectionrefused 最佳答案您可以通过两种模式连接到Hive。通过thriftserver和嵌入式模式。通过查看您的urllocalhost:10000/def

ConnectException default section strong hive hadoop

hadoop - SET default_parallel 1;声明不适用于 pig

我是pig的新手，根据我的理解，SETdefault_parallel1语句应该生成一个输出文件，因为它将使用一个reducer。但是当我在下面的脚本中使用这个命令时，它给了我2个o/p文件。SETdefault_parallel1;A=LOAD'hdfs:/pigfldr/union1'usingPigStorage('')AS(sln:int);B=LOAD'hdfs:/pigfldr/union2'usingPigStorage('')AS(sln:int);C=UNIONA,B;STORECINTO'hdfs:/pigfldr/unionfres';

default_parallel parallel section reducer hadoop apache-pig

hadoop - 为什么 mapreduce 尝试由于 "Container preempted by scheduler"而被终止？

我刚刚注意到Hadoop上的许多Pig作业由于以下原因而被杀死:Containerpreemptedbyscheduler有人可以向我解释是什么原因造成的，我是否应该(并且能够)对此做些什么？谢谢! 最佳答案如果您有公平的调度程序并启用了多个不同的队列，那么更高优先级的应用程序可以终止您的作业(以抢占方式)。Hortonworks有一个很好的解释和更多的细节https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.2/bk_yarn_resource_mgt/content/pr

amp Container section https bk_yarn_resource_mgt hadoop apache-pig

hadoop - hadoop-2.7.3 中的 yarn : yarn-default. xml 位置

我们正在尝试在hadoop-2.7.3中找到yarn-default.xml的位置，有人可以指出它可能位于的位置......我能够找到yarn-site.xml但找不到yarn-default.xml如果有人能指出它的位置，将不胜感激。最佳答案在包含您的hadoop安装的目录中导航到share/doc/hadoop/hadoop-yarn/hadoop-yarn-common.如您所知，yarn-default.xml用作默认值的文档，而yarn-site.xml代表您的自定义配置值。

hadoop yarn section hadoop-yarn hadoop2

hadoop - Hadoop Fair/Capacity Scheduler 可以用在 MR1 上吗？

据我所知，YARN(MRv2)允许插入调度程序，替换默认的FIFO调度程序。我的问题是，我们可以在MRv1中做同样的事情吗？有没有办法在旧版本的Hadoop中替换FIFO调度程序，或者这是仅随YARN提供的东西？最佳答案我在Hadoop的0.20.x版本中使用公平调度程序已有一段时间了，从未遇到过任何问题。您可以设置以下属性:mapred.jobtracker.taskSchedulerorg.apache.hadoop.mapred.FairScheduler然后您可以转到http:///scheduler有关如何在MR1中设

Scheduler Capacity section 中设 code hadoop mapreduce scheduling hadoop-yarn

hadoop - Hive on tez in EMR schedule tasks very slow

我正在尝试在tez上使用Hive来查询存储在S3中的orc格式数据。TezAM定时任务非常慢，很多Map任务长时间处于“PENDING”状态。集群中有足够的资源(我会说足够了。有超过6TB的内存和超过1000个vcores可用，在这个作业中每个容器只花费2GB内存。这是唯一在集群中运行的作业yarncluster)，但它们在调度任务方面做得很慢。有什么方法可以加快这个过程吗？最佳答案我遇到了同样的问题。我决定更换Hive的引擎。试试这个命令:设置hive.execution.engine=mr;在任何情况下，MR都是最好的。AW

schedule hadoop section strong noreferrer hadoop-yarn tez

hadoop - default.fs.name 和 hive.metastore.warehouse.dir 不冲突

嗨，当我尝试运行以下命令时LoaddataInpath'/data'intoTableTablename;在hiveshell中抛出以下错误Movefrom:hdfs://hadoopcluster/datato:file:/user/hive/warehouse/Tablenameisnotvalid.Pleasecheckthatvaluesforparams"default.fs.name"and"hive.metastore.warehouse.dir"donotconflict.我的default.fs.name属性在哪里fs.defaultFShdfs://hadoopcl

metastore warehouse section code hadoop apache-hive

hadoop - 无法在 MESOS 框架 : Could not find or load main class org. apache.mesos.hdfs.scheduler.Main 上运行 HDFS

我尝试按照https://github.com/mesosphere/hdfs中提到的步骤进行操作.当我运行./bin/hdfs-mesos时，出现以下错误:Error:Couldnotfindorloadmainclassorg.apache.mesos.hdfs.scheduler.Main有谁知道我该如何解决这个错误？最佳答案为了运行mesos-hdfs，需要构建它。githubrepo仅包含源相同标记的版本。按照以下步骤操作:gitclonegit@github.com:mesosphere/hdfs.gitcdhdfs

scheduler hadoop hdfs section mesos

Spring Scheduled Task 在集群环境中运行

我正在编写一个具有每60秒执行一次的cron作业的应用程序。该应用程序配置为在需要时扩展到多个实例。我只想每60秒在1个实例上执行任务(在任何节点上)。开箱即用我找不到解决方案，我很惊讶以前没有被问过多次。我正在使用Spring4.1.6。最佳答案有一个ShedLock正是为这个目的服务的项目。您只需注释执行时应锁定的任务@Scheduled(...)@SchedulerLock(name="scheduledTaskName")publicvoidscheduledTask(){//dosomething}配置Spring和L

中运 Scheduled section code 34 spring spring-scheduled