草庐IT

Cluster-driven

全部标签

java - 带有 --jars 的 spark-submit yarn-cluster 不起作用?

我正在尝试通过以下命令向CDHyarn集群提交一个spark作业我尝试了几种组合,但都不行......我现在所有的poijar都位于我的本地/root以及HDFS/user/root/lib中,因此我尝试了以下操作spark-submit--masteryarn-cluster--class"ReadExcelSC"./excel_sc.jar--jars/root/poi-3.12.jars,/root/poi-ooxml-3.12.jar,/root/poi-ooxml-schemas-3.12.jarspark-submit--masteryarn-cluster--class"

amazon-ec2 - 在 Amazon ec2 : multi node cluster 上运行 hadoop 作业

我必须在AmazonEC2集群上运行hadoopmapreduce作业。我尝试使用现有的AMI进行设置。但是在启动master和clients之后,“jps”没有列出任何节点。那么,即使在使用公共(public)hadoopAMI之后,我们还必须为主服务器和从服务器设置hadoop吗?master怎么知道slave的IP地址??谁能告诉我一些好的文档。我现在已经为此苦苦思索了12个多小时。有人可以帮忙吗?谢谢。 最佳答案 Matthew建议的另一种替代方法是使用Whirr。Whirr让在Amazon上部署Hadoop集群变得非常容易

apache-spark - 有关 yarn-cluster 模式下 Spark 驱动程序(及其 YARN 容器)的故障转移过程如何工作的资源/文档

我试图了解在以集群模式部署Yarn时,SparkDriver是否是单点故障。因此,我想在这种情况下更好地了解有关SparkDriver的YARN容器的故障转移过程的内部结构。我知道Spark驱动程序将在Yarn容器内的SparkApplicationMaster中运行。如果需要,SparkApplicationMaster将向YARNResourceManager请求资源。但是我还没有找到足够详细的文档来说明在SparkApplicationMaster(和Spark驱动程序)的YARN容器发生故障时的故障转移过程。我试图找到一些详细的资源,这些资源可以让我回答与以下场景相关的一些问题

hadoop - 使用 --master yarn-cluster : issue with spark-assembly 运行 spark-submit

我在基于Kerberos的集群上运行Spark1.1.0、HDP2.1。我可以使用--masteryarn-client成功运行spark-submit,并且结果已正确写入HDFS,但是,该作业没有显示在HadoopAllApplications页面上。我想使用--masteryarn-cluster运行spark-submit但我仍然收到此错误:appDiagnostics:Applicationapplication_1417686359838_0012failed2timesduetoAMContainerforappattempt_1417686359838_0012_0000

hadoop - Hive cluster by vs order by vs sort by

据我了解;sortby仅在reducer中排序orderby在全局范围内排序,但将所有内容都推送到一个reducer中clusterby通过键散列智能地将内容分发到reducer中,并按以下方式排序所以我的问题是clusterby保证全局顺序吗?distributionby将相同的键放入相同的reducer,但是相邻的键呢?我能找到的唯一文档是here从这个例子来看,它似乎是在全局范围内订购的。但从定义来看,我觉得它并不总是这样做。 最佳答案 一个简短的回答:是的,CLUSTERBY保证全局排序,前提是您愿意自己加入多个输出文件。较

php - Elasticsearch 报错 No alive nodes found in your cluster

我开始使用Elasticsearch。我在我的服务器上成功安装了Elasticsearch(不同于应用程序服务器)。但是当我尝试从我的应用程序服务器调用Elasticsearch时,它给出了一个错误fatalerror:未捕获异常“Elasticsearch\Common\Exceptions\NoNodesAvailableException”,消息为“在您的集群中找不到事件节点”当我检查Elasticsearch状态时,它显示事件。如何从我的应用程序服务器调用Elasticsearch到我的Elasticsearch服务器。setHosts($hosts)->build();$pa

javascript - 为什么 Node.js cluster.fork() 不在 Windows 8 上创建我的进程的副本?

我正在试验Node.js,看看在我的公司推荐它是否可行。作为初学者,我试图在没有Express(或替代方案)的情况下处理Node,而未处理的异常导致整个进程关闭并基本上让我离开网络这一事实似乎是一个问题。它非常清楚地写着nottouseanuncaughtexceptionhandler为进程吞下错误。Node.js的clustermodule如果我将它与domains结合使用,它似乎会很好地处理这个问题.事实上,domainsrecommendusingthemtojustsendouta500并使用集群,这样您就可以实际关闭出错的进程。我运行的是Windows8Enterprise

Node.js:通过 cluster.fork() 调用不同的行为

我正在使用Node和Redis,我需要向Redis添加订阅者以防事件发生。问题是我只希望处理发生一次......而且我真的很想只需要我的一个fork进程来监听redis。刚才我测试了看是否可以在另一个文件中创建一个新的集群并让它从那里开始,但没有任何乐趣。有人知道怎么做吗?我正在运行最新的稳定版Node(0.6.15)这是我的代码(2个文件):clusterTest1:---varc2=require('./clusterTest2');console.log('clusterTest1');//c2.test();---clusterTest2:---varcluster=requi

amazon-web-services - redis-cli CLUSTER NODES 命令在 CLUSTER RESET 后显示不同节点上的不同信息

我们有一个包含3台机器的Redis集群,每台机器上都有Master+Slave(亚马逊云环境)。顺序是[M1,S3][M2,S1][M3,S2]重启一台机器后,例如[M2,S1],CLUSTERNODES命令显示不同的信息。我不明白这怎么可能。例如:./redis-cli-h10.20.21.59-p7000CLUSTERNODES命令显示如下:bba828ee8151f5addb0cb3d3bf91db559837c13f10.20.21.59:7000我自己,主人-003已连接但是./redis-cli-h10.20.21.59-p7001CLUSTERNODES命令显示完全不同的

php - 使用 Predis 使用 Laravel-5.4.32 配置 AWS ElasticCache redis Cluster-3.2.4

我正在尝试在Laravel-5.4.32上使用ElasticCacheRedis集群(启用集群模式而不是哨兵)但出现以下错误:1/1)服务器异常已移动1349110.0.1.199:6379我的database.php如下所示:'redis'=>['client'=>'predis','cluster'=>true,'default'=>['host'=>env('REDIS_HOST','127.0.0.1'),'password'=>env('REDIS_PASSWORD',null),'port'=>env('REDIS_PORT',6379),'database'=>0,],]