草庐IT

cluster_id

全部标签

hadoop - JA017 : Could not lookup launched hadoop Job ID

在Hue中的OozieEditor中提交mapreduce作业时如何解决这个问题?:JA017:无法查找与操作[0000009-150711083342968-oozie-root-W@mapreduce-f660]关联的hadoop作业ID[job_local152843681_0009]。此操作失败!更新:Herearelogfile:2015-07-1504:54:40,304INFOActionStartXCommand:520-SERVER[myserver]USER[root]GROUP[-]TOKEN[]APP[My_Workflow]JOB[0000010-150711

hadoop - yarn : How to utilize full cluster resources?

所以我有一个带有7个工作节点的cloudera集群。30GB内存4个vCPU以下是我发现的一些配置(来自Google)对于调整我的集群性能很重要。我正在运行:yarn.nodemanager.resource.cpu-vcores=>4yarn.nodemanager.resource.memory-mb=>17GB(为操作系统和其他进程预留)mapreduce.map.memory.mb=>2GBmapreduce.reduce.memory.mb=>2GB运行nproc=>4(可用处理单元数)现在我担心的是,当我查看我的ResourceManager时,我看到可用内存为119GB,

java - Apache Spark :-Nullpointer Exception on broadcast variables (YARN Cluster mode)

我有一个简单的spark应用程序,我试图在YARN集群上广播一个String类型的变量。但是每次我尝试访问广播变量值时,我都会在任务中得到空值。如果你们可以提出建议,那将非常有帮助,我在这里做错了什么。我的代码如下:-publicclassTestAppimplementsSerializable{staticBroadcastmongoConnectionString;publicstaticvoidmain(String[]args){StringmongoBaseURL=args[0];SparkConfsparkConf=newSparkConf().setAppName(Co

hadoop - hadoop job -kill job_id 和 yarn application -kill application_id 有什么区别

hadoopjob-killjob_id和yarnapplication-killapplication_id有什么区别?job_id和application_id是否代表/指代同一个任务? 最佳答案 hadoopjob-killjob_id和yarnapplication-killapplication_id这两个命令都用于终止在Hadoop上运行的作业。如果您正在使用MapReduceVersion1(MRV1)并且您想要终止在Hadoop上运行的作业,那么您可以使用hadoopjob-killjob_id杀死一个工作,它会杀死

scala - Cluster 模式下使用 Spark 写入文件到本地系统

我知道这是一种使用Spark的奇怪方式,但我正在尝试使用Spark将数据帧保存到本地文件系统(不是hdfs),即使我处于集群模式。我知道我可以使用客户端模式,但我确实想在集群模式下运行并且不关心哪个节点(3个中的)应用程序将作为驱动程序运行。下面的代码是我正在尝试做的伪代码。//createdataframevaldf=Seq(Foo("John","Doe"),Foo("Jane","Doe")).toDF()//saveittothelocalfilesystemusing'file://'becauseitdefaultstohdfs://df.coalesce(1).rdd.s

hadoop - 了解 Spark : Cluster Manager, Master 和 Driver 节点

读完这篇question,我想再问一些问题:集群管理器是一个长期运行的服务,它在哪个节点上运行?主节点和驱动节点可能是同一台机器吗?我假设某处应该有一条规则说明这两个节点应该不同?如果Driver节点出现故障,谁负责重新启动应用程序?究竟会发生什么?即主节点、集群管理器和工作节点将如何参与(如果他们参与),以及以什么顺序参与?与上一个问题类似:如果主节点发生故障,具体会发生什么情况以及谁负责从故障中恢复? 最佳答案 1.TheClusterManagerisalong-runningservice,onwhichnodeitisru

scala - Spark : check your cluster UI to ensure that workers are registered

我在Spark中有一个简单的程序:/*SimpleApp.scala*/importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectSimpleApp{defmain(args:Array[String]){valconf=newSparkConf().setMaster("spark://10.250.7.117:7077").setAppName("SimpleApplication").set("spark.cores.m

amazon-web-services - EMR 主节点是否知道其集群 ID?

我希望能够创建EMR集群,并让这些集群将消息发送回某个中央队列。为了让它工作,我需要在每个主节点上运行某种代理。这些代理中的每一个都必须在此消息中标识自己,以便收件人知道该消息是关于哪个集群的。主节点是否知道它的ID(j-***************)?如果不是,那么是否有其他一些识别信息可以让消息收件人推断出此ID?我查看了/home/hadoop/conf中的配置文件,但没有发现任何有用的东西。我在/mnt/var/log/instance-controller/instance-controller.log中找到了ID,但看起来很难用grep查找。我想知道实例Controlle

如何将带有ID的URL重写为短URL使用ID

我们有一些SEO的预选example.com/media/player/related.php?mode=related&video_id=12345至example.com/video/12345所有ID参数都有数值。RewriteEngineOn我们如何实现这一目标?看答案为了重定向从/media/player/related.php?mode=related&video_id=12345(包含查询字符串)至/video/12345然后,您可以在您的顶部附近执行以下操作.htaccess文件。RewriteCond%{ENV:REDIRECT_STATUS}^$RewriteCond%{Q

php - 如何从此网址中删除 id 和 title?

这个问题在这里已经有了答案:PHP:RemoveURLParam?(6个答案)关闭7年前。我需要使用.htaccess文件从此网址中删除?id=和&title=。现在的URL-http://www.XXXX.com/video.php?id=XX&title=XXX-XXX-XXX我需要什么-http://www.XXXX.com/video.php/XX/XXX-XXX-XXX我已经从所有链接中删除了.php。