草庐IT

故障灯

全部标签

Hadoop - 在故障和恢复后维护复制因子

假设一个数据节点出现故障。复制因子已配置为2。namenode会尝试维护复制因子,并将丢失的数据block复制到另一台机器吗?如果上述情况属实,则假设同一个数据节点重新上线。namenode会删除额外的数据block吗,因为现在复制因子是3 最佳答案 是的,namenode会尽量保持复制因子。过度复制的block将从节点中随机删除。看这个FAQ 关于Hadoop-在故障和恢复后维护复制因子,我们在StackOverflow上找到一个类似的问题: https:/

Hadoop HA active NN 不断崩溃,自动故障转移不起作用

我正在使用hadoop2.2.0HA。这是我的配置。核心站点.xmlha.zookeeper.quorumzk01.bi.lietou.inc:2181,zk02.bi.lietou.inc:2181,zk03.bi.lietou.inc:2181ipc.client.connect.timeout20000hdfs-site.xmldfs.nameserviceslynxclusterdfs.ha.namenodes.lynxclusternn1,nn2dfs.namenode.rpc-address.lynxcluster.nn1192.168.30.133:2020dfs.nam

hadoop - sqoop import Job期间如何保持故障恢复

我们计划创建Oozie作业,该作业运行Sqoop命令以每小时为基础将数据从SQL服务器导入HDFS。但我们面临着挑战,如果该作业在此期间失败,如何发出警报,以及sqoop将如何检查哪些数据导入成功,哪些数据仍在等待中。sqoop导入时是否有维护事务和重试机制的流程。我们也会对他们的失败发出警报。 最佳答案 您可以将Oozie的工作流程配置为在失败时发送电子邮件。您可以通过将错误标记从任何操作重定向到发送电子邮件操作来实现此目的。电子邮件配置的示例如下。${emailToAddress}Failedtoimporttable.Thef

hadoop - 通过带有数据节点故障转移的 webhdfs 的 webrequest

我有hadoop集群和hadoop版本apache2.7.1高可用且由五个节点组成mn1,mn2,dn1,dn2,dn3如果我们从浏览器访问wbhdfs以打开一个名为myfile的文件,该文件的复制因子=3并在dn1、dn2和dn3上退出我们从浏览器发出以下命令http://mn1:50070/webhdfs/v1/hadoophome/myfile/?user.name=root&op=OPEN因此mn1将此请求重定向到dn1或dn2或dn3我们得到了文件我们也可以通过以下命令从hadoop中获取文件hdfsdfs-cat/hadoophome/myfile但是在数据节点故障的情况下

hadoop - HBase 批量放置故障排除

是否可以对HBase批量放置进行故障排除?我一次使用HBase批量放置5000条记录,我想在放置失败时找出哪一行或哪几行导致问题并记录下来。 最佳答案 方法HTable.batch(Listactions)接收一个Puts列表并返回一个与actions列表大小相同的数组(你给函数的puts列表)。如果actions(i)失败,则result[i]将为空。请注意,当batch()中的失败是由于最大尝试写入次数时,您需要捕获RetriesExhaustedWithDetailsException,并调用getExceptions(),以

hadoop - Cloudera Manager - HDFS 可用空间健康问题故障排除

我有一个由两台主机配置的集群-我正在运行的作业似乎正在创建大量日志,并且我的一个hdfs数据节点显示严重的健康问题为-四件事:如何清理这些日志并腾出空间?从/var/log/hadoop-hdfs手动删除它们是个好主意吗?如上/var/log/hadoop-hdfs目录只有610MBhdfs的空间在哪里被占用?如何配置日志文件以定期删除?我有HDFS、Spark和YARN-MR2服务已启动并正在运行,它们都在创建自己的日志。我也想清理那些。谢谢! 最佳答案 深入研究hdfs之后-要获取哪个目录的大小,请执行:hadoopfs-du-

python - HDFS IO 故障 "path is not a file"

我最近在hadoop上将我的h2o从3.6.0.8更新到3.10.0.9,并且我正在使用pythonapi。以前(使用3.6)我使用以下命令加载我保存的模型:model_to_load=h2o.load_model('hdfs://nameservice1/path/to/model/model_directory')我现在使用相同的命令(在3.10中)并得到以下错误:java.io.FileNotFoundException:Pathisnotafile:/path/to/model/model_directory我尝试降级回3.6.0.8,它工作正常,就像以前一样。在目录中,每棵树

mongodb - 具有故障转移功能的 Apache JCR - Hadoop?

我们正在研究如何使用JCR实现故障转移。也就是说,辅助服务器可以在遇到麻烦时占据“主”位置。我无法找到有关该主题的内容,因此欢迎提供帮助。可以将JCR和Hadoop结合起来吗?JCR和MongoDB? 最佳答案 JCR2.0RIJackrabitt“Oak”提供了支持MongoDB(复制和分片)所有功能的MongoDB集成(MongoDB存储)您可以在这里找到信息:-http://jackrabbit.apache.org/oak/docs/dev_getting_started.html

hadoop - HDFS 中的故障类型有哪些?

HDFS中的故障类型有哪些?当NameNode、SecondaryNameNode和DataNode销毁时,会发生什么? 最佳答案 故障主要有NameNode故障、DataNode故障和网络分区三种。NameNodefailuresDataNodeSecondaryNode对于所有失败的情况,请尝试sudojps。您将获得进程ID和进程名称。然后执行sudokill-9{process-id}。然后尝试在hdfs或pig/hiveshell中读取/写入数据。 关于hadoop-HDFS中

hadoop - 自动故障转移在 Hadoop 中不起作用

我正在尝试构建一个3节点集群(2个Namenode(nn1,nn2)和1个datanode(dn1))。使用NamenodeWEBUI,我能够看到nn1处于事件状态,nn2处于备用状态。然而,当我杀死活跃的nn1时,备用nn2不会活跃。请帮助我我做错了什么或需要修改什么nn1/etc/hosts127.0.0.1localhost192.168.10.153nn1192.168.10.154dn1192.168.10.155nn2nn2/etc/hosts127.0.0.1localhostnn2127.0.1.1ubuntu#Thefollowinglinesaredesirable