HA集群

amazon-web-services - 如何使用 Hadoop 2.6 启动 Spark EC2 集群

我正在尝试使用Hadoop2.6在Spark1.6.1上运行SparkEC2集群-这是我尝试过的:./spark-ec2-i~/.ssh/***.pem\--instance-profile-name***\-k***\--region=us-east-1\--instance-type=m3.xlarge\-s2\--copy-aws-credentials\launchtest-cluster不过，这次安装的是Hadoop1.0。所以我在上面的命令中添加了以下选项:--hadoop-major-version=2\但是，我很快意识到，为了正确运行我的应用程序，我需要Hadoop2.

hadoop - 配置多模式 Hadoop 集群

我正在尝试建立一个多节点集群，我有3台机器，其中一台充当名称节点和数据节点，另外两台充当数据节点。我对所有机器都有不同的用户名，node1的用户名是hdfsadmin，node2的用户名是hduser，node3的用户名也是hduser。问题是当我尝试连接到数据节点时Hadoop抛出一个连接被拒绝的错误，因为它期望数据节点的名称与名称节点相同，这在我的情况下是不同的。我该如何解决这个问题？提前致谢最佳答案不，不需要所有节点都具有相同的主机名。请交叉检查以下内容:1)确保您能够通过ssh访问另一个节点。2)确保在/etc/host

多模 hadoop section hadoopmnslave stackoverflow

hadoop - 具有 6 到 7 个节点硬件配置的分布式 Spark 和 HDFS 集群

我计划旋转我的开发集群来为基础设施监控应用程序进行趋势分析，我计划使用Spark来分析故障趋势，并使用Cassandra来存储传入数据和分析数据。考虑从大约25000台机器/服务器(可能是不同服务器上的一组相同应用程序)收集性能矩阵。我期望每台机器的性能矩阵大小为2MB/秒，我计划将其插入具有时间戳、服务器作为主键和应用程序以及一些重要矩阵作为集群键的Cassandra表中。我将在此存储的信息之上运行Spark作业，以进行性能矩阵故障趋势分析。关于这个问题，考虑到上述情况，我需要多少个节点(机器)以及CPU和内存方面的什么配置来启动我的集群。最佳答案

hadoop Spark section Cassandra planning apache-spark matrix hardware-infrastructure

hadoop - 如何将 janusgraph 与现有的 hadoop 集群集成

我是大数据的新手，目前正在努力将Janusgraph集成到现有的hadoop集群中。能否请您告诉我如何执行此操作，或者请提供资源链接。最佳答案由于您刚刚开始使用JanusGraph，因此您应该从位于http://docs.janusgraph.org/latest/的官方文档开始。JanusGraph需要存储后端。有几个支持storagebackends.ApacheHadoop本身并不是JanusGraph的存储后端。ApacheHBasestoragebackend很可能是您可能拥有的。

hadoop janusgraph section noreferrer cluster-computing

hadoop - Docker 容器运行 Mesos 集群并在集群上运行其他 docker 容器(使用 Marathon)

我刚开始使用Mesos、Docker和Marathon，但我找不到任何可以回答这个特定问题的地方。我想设置一个在Docker上运行的Mesos集群——有几个互联网资源可以做到这一点，但我想在Mesos本身之上运行Docker容器。这意味着Docker容器在其他Docker容器中运行。这有什么问题吗？不知何故，它在直觉上似乎并不正确，但看起来这样做真的很方便。理想情况下，我想运行Mesos集群(使用Marathon、Chronos等)，然后在其上的Docker容器中运行Hadoop。这是可能的还是标准的做事方式？对于什么是良好做法的任何其他建议，我们将不胜感激。谢谢

容器 Marathon section Docker hadoop cluster-computing mesos

azure - 将 HDInsight 集群升级/迁移到最新版本

我确定这已发布在某处或已经传达，但我似乎找不到任何关于从一个版本升级/迁移HDInsight集群到下一个版本的信息。一点背景。自2014年1月24日以来，我们一直在使用Hive和HDInsight来存储我们所有的IIS日志。我们喜欢它，它为我们的团队提供了很好的洞察力。我最近在评论http://azure.microsoft.com/en-us/documentation/articles/hdinsight-component-versioning/并注意到我们的HDInsight版本(2.1.3.0.432823)不再受支持，并将于5月弃用。这让我开始思考如何进入3.2版。我似乎无

HDInsight azure section noreferrer hadoop azure-hdinsight

hadoop - 三节点hadoop集群中的Hbase安装

我已经安装了我的hadoop三节点集群(master、slave1和slave2)。我想安装Hbase完全分布式模式。我想在我的hadoop集群MASTER机器(即Namenode)中安装HBaseMaster和Zookeepr，并在SLAVE1和SLAVE2(即Datanodes)机器中安装区域服务器。这是正确的做法吗？抱歉，这可能是一个简单的问题，但我是NoSQL系统的新手，想进行此安装。如果有人能够分享安装的任何引用文档，我真的很感激。提前致谢。最佳答案为了在三个节点上配置hbase和zookeeper，即1master和

hadoop Hbase code pre

hadoop - 在Hadoop中，复制因子和集群中的节点数之间有什么关系？

例如，如果复制因子为3，并且集群中有2个节点。那么将创建多少个副本？它们将如何放置？最佳答案复制因子大于可用数据节点会破坏复制的目的。副本应该明确且唯一地放置在数据节点上。如果一个数据节点包含同一个block的多个副本(理论上)，它不会提供额外的容错能力，因为如果该节点出现故障，两个副本都会丢失。因此每个节点只有一个副本就足够了。并回答您的问题:Whatistherelationshipbetweenreplicationfactorandnumberofdatanodesincluster?Ans.Maximumreplica

点数 hadoop strong section replication hdfs bigdata

ubuntu - 用于多节点 Hadoop 集群的 Windows 7 和 vmware ubuntu 镜像 - IP 地址的配置

我是ubuntu和Hadoop的新手...我的笔记本电脑装有Windows7，它还有一个UbuntuVMWare镜像(我使用VMWare播放器打开)。我的想法是在同一台笔记本电脑上配置多节点hadoop集群。可不可以有两个ubuntu镜像，每个镜像作为一个虚拟机，这样就可以模拟集群配置(虽然不是理想的集群)？如果是这样，这两个虚拟机是否能够通信？我是否必须更改IP配置等才能使其正常工作？VM1(ubuntu)-HadoopmasterVM2(ubuntu)-Hadoopslave作为扩展，windows7有没有可能也加入集群？Windows7-HadoopmasterVM1(ubunt

ubuntu Windows section Hadoop cluster-computing

【Hadoop】集群配置之主要配置文件（hadoop-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml...）

Hadoop配置文件模板core-site.xmlhadoop-env.shhdfs-site.xmlyarn-env-shyarn-site.xmlmapred-site.xmlslavesHadoop配置文件模板参考官方配置文档：https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/ClusterSetup.html#Configuring_Environment_of_Hadoop_DaemonsHadoop的配置文件都在$HADOOP_HOME/etc/hadoop下面。比如我这里是：Hadoop

site 配置 span class token hadoop xml hdfs

42 43 444546 47 48