主_草庐IT

hadoop - LAN 虚拟机上的 Web 应用程序 : curl -L works from other vms, 浏览器/主机上的 curl 没有

我正在我的LAN上设置Hadoop虚拟机集群，其中一个虚拟机(ResourceManager)上的进程提供了一个表现出奇怪行为的WebUI。所有虚拟机都从我的桌面运行，并已分配ips。我定位的URL是resourcemanager:8088，这是行为。从我桌面上运行的其他虚拟机:curl-vresourcemanager:8088返回HTTP302Found响应，Location:http://resourcemanager:8088/cluster。向上看，我看到这是一个重定向，curl-Lresourcemanager:8088成功检索到HTML。从运行虚拟机的桌面:尝试从(Chr

机上 curl code resourcemanager section hadoop networking port hadoop-yarn

hadoop - 我可以强制 YARN 使用 Application Master 容器的主节点吗？

在我的Hadoop/Spark运行期间，我的大主节点硬件几乎什么都不做，因为YARN在每个任务上为其AM使用随机从节点。我更喜欢旧的Hadoop1；当出现问题时，通过这种方式可以避免大量的日志追踪和ssh痛苦。这可能吗？最佳答案 Spark和YARN节点标签是可能的。标记你的节点使用spark.yarn.am.nodeLabelExpression属性好读:https://developer.ibm.com/hadoop/2017/03/10/yarn-node-labels/ 关于h

Application 容器 section https yarn-node-labels hadoop apache-spark hadoop-yarn elastic-map-reduce

hadoop - 主节点如何启动hadoop集群中的所有进程？

我已经使用普通Hadoop设置了一个包含5个虚拟机的Hadoop集群。集群详情如下:192.168.1.100-配置为运行NameNode和SNN守护进程192.168.1.101-配置为运行ResourceManager守护程序。192.168.1.102-配置为运行DataNode和NodeManager守护进程。192.168.1.103-配置为运行DataNode和NodeManager守护进程。192.168.1.104-配置为运行DataNode和NodeManager守护进程。我在每个虚拟服务器中都保留了主从文件。高手:192.168.1.100192.168.1.101

hadoop 主 section code 192 virtualbox hadoop2 resourcemanager namenode

amazon-web-services - 我失去了从主服务器到从服务器(AWS EC2 Hadoop)的 ssh 连接能力

我最近失去了通过ssh将我的主人连接到我的奴隶和辅助名称节点的能力。我有4个EC2实例，上面有一个hadoop集群(一个NameNode、一个辅助nameNode和2个从节点)。我仍然可以用putty建立ssh连接，但是我无法实现如下的ssh连接:sshubuntu@instanceDns。我有以下错误:Permissiondenied(publickey).我确定我没有对ssh连接进行任何更改，所以我有点惊讶。这是一个详细的ssh连接试探性屏幕。我注意到我的.ssh文件中不再有id_rsa、id_rsa-cert和其他文件。我猜他们以前在这里，但我不知道他们会这样消失。为什么会这样？

amazon-web-services services section ssh OpenSSH hadoop amazon-ec2

hadoop - 如何将 hadoop 辅助名称节点与主名称节点分开？

全部我想问一下，我现在运行的是hadoop2.6.0。那么我怎样才能将这个辅助名称节点与主要名称节点分开呢？什么配置？我是否使用一台额外的计算机来成为辅助名称节点，或者它可以在数据节点中？我需要你的建议，谢谢... 最佳答案 NameNode、SecondaryNameNode、DataNodes只是根据“机器”执行的工作赋予的名称。在“理想的”分布式环境中，它们都可以而且应该驻留在不同的机器中。辅助NameNode在另一台机器上的唯一要求是:辅助NameNode和NamdeNode应该连接，以便FSImane和EditLogs可以

hadoop 辅助 section NameNode configuration mapreduce filesystems distributed

java - 对于嵌入式数据库，数据库是否加载到 neo4j 的主内存中？

我试图解析一个大文件并在neo4j数据库中为其创建节点。我使用mapreduce并因此为每个reduce调用加载以下行。GraphDatabaseServicedb=newGraphDatabaseFactory().newEmbeddedDatabase(DB_PATH);现在，这条线在运行一段时间后给我以下异常-java.lang.OutOfMemoryError:GCoverheadlimitexceededatorg.neo4j.io.pagecache.impl.muninn.MuninnPageCache.(MuninnPageCache.java:230)atorg.ne

neo4j java neo4 hadoop

java - 在主节点 : Failed construction of Regionserver : java.net.BindException

我有一个4节点集群(hadoop2.5.2)(Hbase1.0.0)，主机上有一个主节点(作为从节点)和3个从节点。调用start-hbase.sh后，jps没有显示HRegionServer进程在master上运行，但在所有三个slave上运行正常。master上的日志文件显示:java.lang.RuntimeException:FailedconstructionofRegionserver:classorg.apache.hadoop.hbase.regionserver.HRegionServeratorg.apache.hadoop.hbase.regionserver.H

java BindException apache HRegionServer hadoop hbase

hadoop - DOCKER 容器和主机上的运行时内核参数不一致

我的主机在Ubuntu14.04.2LTS上，我使用最新的centos基础镜像来创建IBMInfoSphereBigInsights的DOCKER镜像，以便将其推送到BluemixContainerCloud。我已经解决了几乎所有问题，但我仍然坚持使用sysctl设置运行时内核参数，因为它们的值错误并且安装程序提示。sysctl-a|grepnet.ipv4.ip_local_port_rangenet.ipv4.ip_local_port_range=3276861000当然不可能将它们设置在DOCKER容器内，我得到以下错误:sysctl-wnet.ipv4.ip_local_po

机上容器 ip_local_port_range sysctl code hadoop docker ibm-cloud biginsights

scala - 无法从 JAR 文件加载主类

我有一个Spark-scala应用程序。我试图显示一条简单的消息-“HellomyApp”。当我用sbtcompile编译它并用sbtrun运行它时，没问题。我成功显示了我的消息，但他显示错误；像这样:Hellomyapplication!16/11/2715:17:11ERRORUtils:uncaughterrorinthreadSparkListenerBus,stoppingSparkContextjava.lang.InterruptedExceptionERRORContextCleaner:Errorincleaningthreadjava.lang.Interrupte

scala JAR code section SparkContext hadoop apache-spark sbt

hadoop - hbase 区域服务器未与主服务器通信

我正在尝试让bhase集群正常工作。两个主服务器和两个区域服务器。我的问题是regionserver提示告诉主人他们已经起来了。:2016-07-0116:10:21,879WARN[regionserver/nbd-hadoop-data1/153.77.130.27:60020]**regionserver.HRegionServer:reportForDutyfailed;sleepingandthenretrying.**2016-07-0116:10:24,879INFO[regionserver/nbd-hadoop-data1/153.77.130.27:60020]**

hadoop hbase regionserver property gt