草庐IT

bubble_cluster_one

全部标签

amazon-ec2 - 在 Amazon ec2 : multi node cluster 上运行 hadoop 作业

我必须在AmazonEC2集群上运行hadoopmapreduce作业。我尝试使用现有的AMI进行设置。但是在启动master和clients之后,“jps”没有列出任何节点。那么,即使在使用公共(public)hadoopAMI之后,我们还必须为主服务器和从服务器设置hadoop吗?master怎么知道slave的IP地址??谁能告诉我一些好的文档。我现在已经为此苦苦思索了12个多小时。有人可以帮忙吗?谢谢。 最佳答案 Matthew建议的另一种替代方法是使用Whirr。Whirr让在Amazon上部署Hadoop集群变得非常容易

apache-spark - 有关 yarn-cluster 模式下 Spark 驱动程序(及其 YARN 容器)的故障转移过程如何工作的资源/文档

我试图了解在以集群模式部署Yarn时,SparkDriver是否是单点故障。因此,我想在这种情况下更好地了解有关SparkDriver的YARN容器的故障转移过程的内部结构。我知道Spark驱动程序将在Yarn容器内的SparkApplicationMaster中运行。如果需要,SparkApplicationMaster将向YARNResourceManager请求资源。但是我还没有找到足够详细的文档来说明在SparkApplicationMaster(和Spark驱动程序)的YARN容器发生故障时的故障转移过程。我试图找到一些详细的资源,这些资源可以让我回答与以下场景相关的一些问题

hadoop - 在一致性 ONE 下读取查询期间 Cassandra 超时(需要 1 个响应,但只有 0 个副本响应)

我在一个有500000行的表上执行读取和更新查询,有时在处理大约300000行后出现错误,即使没有节点关闭也是如此。CassandratimeoutduringreadqueryatconsistencyONE(1responseswererequiredbutonly0replicaresponded)基础设施详情:拥有5个Cassandra节点、5个Spark节点和3个Hadoop节点,每个节点具有8个内核和28GB内存,Cassandra复制因子为3。Cassandra2.1.8.621|DSE4.7.1|星火1.2.1|Hadoop2.7.1。Cassandra配置:read_

Hadoop MapReduce : Possible to define two mappers and reducers in one hadoop job class?

我有两个单独的java类来执行两个不同的mapreduce作业。我可以独立运行它们。对于这两个作业,它们所操作的输入文件是相同的。所以我的问题是是否可以在一个java类中定义两个映射器和两个缩减器,例如mapper1.classmapper2.classreducer1.classreducer2.class然后点赞job.setMapperClass(mapper1.class);job.setmapperClass(mapper2.class);job.setCombinerClass(reducer1);job.setCombinerClass(reducer2);job.set

hadoop - 使用 --master yarn-cluster : issue with spark-assembly 运行 spark-submit

我在基于Kerberos的集群上运行Spark1.1.0、HDP2.1。我可以使用--masteryarn-client成功运行spark-submit,并且结果已正确写入HDFS,但是,该作业没有显示在HadoopAllApplications页面上。我想使用--masteryarn-cluster运行spark-submit但我仍然收到此错误:appDiagnostics:Applicationapplication_1417686359838_0012failed2timesduetoAMContainerforappattempt_1417686359838_0012_0000

hadoop - Hive cluster by vs order by vs sort by

据我了解;sortby仅在reducer中排序orderby在全局范围内排序,但将所有内容都推送到一个reducer中clusterby通过键散列智能地将内容分发到reducer中,并按以下方式排序所以我的问题是clusterby保证全局顺序吗?distributionby将相同的键放入相同的reducer,但是相邻的键呢?我能找到的唯一文档是here从这个例子来看,它似乎是在全局范围内订购的。但从定义来看,我觉得它并不总是这样做。 最佳答案 一个简短的回答:是的,CLUSTERBY保证全局排序,前提是您愿意自己加入多个输出文件。较

PHP群发邮件: One for each or one for all?

当用PHP发送群发邮件时,是向每个订阅者发送一封电子邮件(对所有电子邮件地址运行一个for循环)更好,还是仅将密件抄送中的所有内容添加到逗号分隔的列表中,并且因此只发送一封电子邮件?谢谢。 最佳答案 BCC字段中的地址数量很可能在SMTP服务器上受到限制(以避免垃圾邮件)。我会走安全路线,向每个订阅者发送电子邮件。如果需要,这还允许您为每个订阅者自定义电子邮件。另请注意,mail()可能不是发送大量邮件的最佳方式(因为它每次被调用时都会打开到SMTP服务器的新连接)。您可能想查看PEAR::Mail.

php - 采埃孚 : http request from one controller to onther hangs

我遇到了这个问题,我想从我的一个Controller向与另一个Controller链接的URL执行HTTP请求。它们彼此完全独立。当我的Controller包含以下代码时,我的应用程序会挂起,直到出现fatalerror:超过30秒的最大执行时间...$opts=array('http'=>array('method'=>"GET",'header'=>"Accept-language:en\r\n"."Cookie:DEFAULTID=rookgqj7bdi4os6f4pt5vqkk74\r\n"));$context=stream_context_create($opts);$co

php - E_NOTICE : How useful is it REALLY to fix every one?

首先我知道这个问题在这里不止一次出现过:WhyshouldIfixE_NOTICEerrors?WhyshouldIfixE_NOTICEerrors?Prosandcons但是我修复所有E_NOTICE的次数越多(正如人们所说的那样),我就越注意到:我正在微优化我实际上正在编写更多代码并使我的代码更难维护且速度更慢举个例子:假设您使用MongoDBPHP驱动程序并且您有一个MongoDate名为ts的类var中的对象在代表数据库集合中的单行的类中。现在你像这样访问这个变量:$obj->ts->sec但是PHP抛出了一个合适的(E_NOTICE)因为ts在这种情况下,它本身未定义为对象

php - Symfony2 中的路由 : optional parameter en four urls for one route

在我的Symfony2应用程序中,我想通过一个路由实现四个url:a-lot-of-other-stuff/report/-20(负数)a-lot-of-other-stuff/report/40(正数)a-lot-of-other-stuff/report/(没有数字)a-lot-of-other-stuff/report(没有数字也没有/)我的路线目前是这样的:report:pattern:/report/{days}defaults:{_controller:"AppReportBundle:Report:dayReport",days=null}Action定义为:public