草庐IT

Mesos-Slave

全部标签

java - Hadoop : Code shipped from master to slave

我启动了一个hadoop集群并向master提交了一个作业。jar文件仅包含在master中。hadoop是否会在作业开始时将jar运送到所有从机?从机是否有可能使用上次运行期间发布的先前版本的代码运行?谢谢巴拉 最佳答案 来自mapreduce教程:Theframeworkwillcopythenecessaryfilestotheslavenodebeforeanytasksforthejobareexecutedonthatnode.Itsefficiencystemsfromthefactthatthefilesareonl

使用 Ubuntu Master 和 Windows slave 的 Hadoop 集群配置

大家好,我是Hadoop新手。Hadoop版本(2.2.0)目标:独立安装Hadoop-Ubuntu12(已完成)独立安装Hadoop-Windows7(cygwin仅用于sshd)(已完成)使用UbuntuMaster和Windows7slave设置集群(这主要是为了学习目的和设置开发环境)(卡住)设置与以下问题的关系:精通在Ubuntu上运行hadoop2.2.0在Windows7上运行的从站使用来自hadoop2.2.0源代码的自编译版本。我仅将cygwin用于sshd无密码登录设置,我可以使用ssh两种方式登录来自hadoop之外。因为我的Ubuntu和Windows机器有不同

hadoop - 在 Mesos 上运行 Impala

是否可以在Mesos上运行Impala?有没有人试过这个?我知道有Llama用于在YARN上运行Impala。Mesos有类似的东西吗? 最佳答案 还没有听说有人在Mesos上运行Impala,尽管在Marathon上运行它或为它构建自定义框架应该不会太难。您还可以在Myriad上的YARN上的Llama上运行Impala在Mesos上,但这对您来说可能层太多了。 关于hadoop-在Mesos上运行Impala,我们在StackOverflow上找到一个类似的问题:

hadoop - hadoop分布式系统中如何控制不同slave的文件分配?

如何控制hadoop分布式系统中不同slave的文件分配?是否可以同时在hadoop中写入2个或更多文件作为mapreduce任务?我是hadoop的新手。它对我真的很有帮助。知道的请回答。 最佳答案 这是我对您的#1的回答:您无法直接控制映射任务在集群中的位置或文件在集群中的发送位置。JobTracker和NameNode分别处理这些。JobTracker将尝试将maptask发送到本地数据以提高性能。(我不得不猜测你的问题是什么意思,如果我没猜对,请详细说明)这是我对您的#2的回答:MultipleOutputs当您想从单个re

scala - Spark集群提交无法绑定(bind)slave地址

ERRORnetty.NettyTransport:failedtobindtospark.master/172.28.128.3:0,shuttingdownNettytransport15/03/1604:08:50WARNutil.Utils:Service'Driver'couldnotbindonport0.Attemptingport1.^^^是我从我的从属日志中得到的错误。我正在使用spark-submit提交我的工作。这是没有意义的,因为从站能够连接到主站,如web-ui所示。我认为我已经配置了正确的端口,如下所示是我在所有机器上的配置。Spark-Env.shexpo

apache - 使用 Kubernetes 或 Apache mesos

我们有一个产品,在一些docker文件中有描述,它可以创建必要的docker容器。一些docker容器将只运行一些基本应用程序,而其他容器将运行集群(hadoop)。现在是我需要使用哪个集群管理器的问题。Kubernetes或Apachemesos或两者兼而有之?我读到Kubernetes适用于100%容器化环境,而ApacheMesos更适用于部分容器化和部分非容器化的环境。但是ApacheMesos更适合在docker中运行hadoop(?)。我们的环境仅由docker容器组成,但有些带有hadoop集群,有些带有一些应用程序。什么是最好的? 最佳答案

ubuntu - Hadoop:java.net.UnknownHostException:hadoop-slave-2

我创建了一个有1个主节点和2个从节点的hadoop集群。我在*-site.xml文件中以最低规范运行它。core-site.xmlfs.defaultFShdfs://10.0.0.51:9000hfds-site.xmldfs.datanode.name.dir~/DNfilesmapred-site.xmlmapreduce.framework.nameyarnyarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.resource-tracker.address10.0.0.5

hadoop - 在独立模式下运行 spark 集群与 Yarn/Mesos

目前我正在以独立模式运行我的spark集群。我正在从平面文件或Cassandra(取决于工作)读取数据,并将处理后的数据写回到Cassandra本身。我想知道我是否切换到Hadoop并开始使用像YARN或mesos这样的资源管理器,它是否给我带来了额外的性能优势,例如执行时间和更好的资源管理?目前我在洗牌过程中处理大量数据时可能会出现阶段失败。如果我迁移到YARN,Resourcemanager可以解决这个问题吗? 最佳答案 Spark独立集群管理器还可以为您提供集群模式功能。如果您只运行Spark,Spark独立集群将提供几乎所有

hadoop - master节点的"start-all.sh"和"start-dfs.sh"不启动slave节点服务?

我已经用我的从节点的主机名更新了Hadoop主节点上的/conf/slaves文件,但是我无法从主节点启动从节点。我必须单独启动从站,然后我的5节点集群启动并运行。如何使用主节点的单个命令启动整个集群?此外,SecondaryNameNode正在所有从节点上运行。那是问题吗?如果是这样,我怎样才能将它们从奴隶中移除?我认为一个集群中应该只有一个SecondaryNameNode和一个NameNode,对吗?谢谢! 最佳答案 在ApacheHadoop3.0中使用$HADOOP_HOME/etc/hadoop/workers文件每行添

Hadoop Datanode slave 没有连接到我的 master

由于许多错误,我无法弄清楚为什么没有将datanodeslavevm连接到我的mastervm中。欢迎任何建议,所以我可以试试。首先,其中之一是我的从虚拟机日志中的错误:WARNorg.apache.hadoop.hdfs.server.datanode.DataNode:Problemconnectingtoserver:ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8:9000因此,我无法在我的主虚拟机中运行我想要的作业:hadoopjar./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.