集群NoSQL

python-3.x - 如果任何 Datanode 驱动器(存储)发生故障，如何在 Hadoop 集群中进行检测

我正在尝试检测Hadoop集群中Datanode的驱动器故障。ClouderaManagerAPI没有任何特定的API。CMAPI仅与名称节点或重启服务相关。这里有什么建议吗？非常感谢! 最佳答案如果您有权访问NameNodeUI，JMX页面将为您提供此信息。如果您直接点击JMX页面，它将是一个JSON格式的页面，可以轻松解析。我们主要使用HortonWorks，很长时间没有接触Cloudera，但我认为它可以以某种方式提供。关于python-3.x-如果任何Datanode驱动器(

中进何在 section 长时 python-3.x hadoop hadoop-yarn cloudera cloudera-manager

ubuntu - 创建 3 节点 Hadoop 集群

我正在我的Ubuntu16机器和两台AWSEC2机器上创建3节点Hadoop集群。我的本地计算机(Ubuntu16)将用作名称节点，另外两台AWSEC2计算机将用作数据节点。我几乎没有怀疑。1)我是否也需要在DataNodes(AWSEC2机器)上安装Hadoop，就像我在名称节点(我的本地机器)上安装一样......？2)我能够在集群中的所有节点之间进行通信(名称节点到数据节点，反之亦然)。在名称节点中，我需要在名称节点机器中添加数据节点公共(public)DNS，以便我的名称节点可以在我的两个数据节点集群中传播数据..？请分享您的意见..!谢谢最佳

ubuntu Hadoop section 定数 cluster-computing

hadoop - 为什么只有映射器的工作在真实集群中如此缓慢？

我有一份映射器PrepareDataonly的工作，它需要将文本数据转换为SequencialFile，使用VLongWritable作为key和DoubleArrayWritable作为一个值。当我运行455000x90(~384Mb)数据时，例如:13.124,123.12,12.12,...1.1223.12,1.5,12.6,...6.123...在本地模式下平均需要:在Athlon64X2双核5600+上51秒，2.79Γгц；在Athlon64处理器3700+上54秒，1Γгц；=>平均52-53秒。但是当我用这两台机器(Athlon64X2双核5600+、3700+)在真

射器缓慢 strong DoubleWritable hadoop

使用 0.23 版本(MRv2 或 NextGen MR)设置的 Hadoop 集群

我看到hadoop的最新稳定版本是0.20.x。最新版本是0.23.。从.20.到0.23.x似乎有很多变化。我们能够建立具有稳定版本(0.20.2)的小型集群并练习mapreduce编程。我们已经看到在0.23.x中添加了许多新的API。为了探索0.23.x，我们还需要使用0.23.x版本设置集群。你们能给我们一份文档吗，我们可以在其中设置0.23.x版本的集群。当我解压tar文件时，0.23.x似乎完全不同，它不像0.20.x。请给我们一些书籍引用/文档，其中从一开始就提到了集群设置。谢谢MRK 最佳答案 0.23和pre-0.

NextGen Hadoop section 23 0.23 mrv2

hadoop - 在多节点集群上的 Hadoop 中运行字数统计示例时出现异常

我遵循链接为here的教程我正确配置了所有步骤。但在第8步中，即使用字数统计的示例MapReduce作业当我执行命令时它抛出异常./bin/hadoopjar/home/ila/hadoop-0.20.1-examples.jarwordcount/user/hduser/gutenberg/user/hduser/gutenberg-outHowcanisolvethisproblem.Exceptionisasfollows:-hduser@ila:/usr/local/hadoop-0.22.0/bin$./hadoopjar/home/ila/hadoop-0.20.1-exa

中运时出 hadoop code section mapreduce

hadoop - 使用 Whirr 启动 EC2 集群

我目前正在学习JefferyBreen的教程。当我想用Whirr启动ec2集群时遇到了一些麻烦。我使用的是cloudera演示vmcdh3u4。我下载了whirr0.8.1版本这是我运行的所有命令:$wgethttp://mirror.switch.ch/mirror/apache/dist/whirr/whirr-0.8.1/whirr-0.8.1.tar.gz$tarzxfwhirr-0.8.0.tar.gz$exportPATH="~/whirr-0.8.0/bin:$PATH"$exportAWS_ACCESS_KEY_ID=MYACCESSKEY$exportAWS_SECR

hadoop Whirr code amazon-ec2 cloudera apache-whirr

hadoop - oozie 应该安装在单个 hadoop 集群内的所有 hadoop 节点上吗？

我在hadoop1.0.3上运行oozie。我想了解是否必须在单个集群内的所有hadoop节点上安装oozie？仅将它安装在主节点(hadoop)上就足够了吗？我搜索了oozie文档，但找不到我的问题的答案。谢谢你，莫辛。最佳答案 Oozie不需要安装在集群中的所有节点上。它可以安装在专用机器上或与任何其他框架一起安装。检查这个guide用于快速安装Oozie。请注意，Oozie有一个客户端和一个服务器组件。服务器组件有一个Scheduler和一个WorkFlow引擎。WorkFlow引擎使用hPDL(HadoopProcessD

hadoop oozie section mapreduce

java - 没有 Hadoop 的 Canopy 集群

我是Mahout的新手。我想在不使用Hadoop的情况下在独立系统上运行CanopyClustering。这可能吗？如果可以，您能否告诉我相同的命令和步骤。提前致谢，拉什米最佳答案通过查看trunk上的代码，似乎Canopy需要一个runSequential参数，将其设置为true应该可以解决问题关于java-没有Hadoop的Canopy集群，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/q

Hadoop Canopy section 拉什 java mahout

java - hadoop 多节点集群 - 从节点无法执行 mapreduce 任务

我是hadoop的新手。我尝试按照MichaelNoll在http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/在集群上运行字数统计作业之前，一切似乎都很好。当我通过在主节点上运行以下cmd启动集群时:hadoop/start-all.shjps输出是正确的:关于主人:li@master:~$jps12839TaskTracker11814NameNode12535JobTracker25131Jps12118DataNode12421SecondaryNameNo

mapreduce hadoop mapred INFO JobClient java configuration cluster-computing

hadoop - 无法在 Hadoop 集群中启动数据节点

我正在尝试在我的3节点集群中安装CDH4.6。这3个中的一个数据节点根本无法启动。尝试通过所有可能的方式搜索和解决此问题，但失败了。请帮我解决这个问题。下面是日志。5:49:10.708PMFATALorg.apache.hadoop.hdfs.server.datanode.DataNodeExceptioninsecureMainjava.io.IOException:thepathcomponent:'/'isworld-writable.Itspermissionsare0777.Pleasefixthisorselectadifferentsocketpath.atorg.a

hadoop DataNode apache hdfs cloudera-manager

266 267 268269270 271 272