草庐IT

故障修复

全部标签

hadoop - hadoop 本身是否包含容错故障转移功能?

我刚刚安装了新版本的hadoop2,我想知道如果我配置了一个hadoop集群并启动了,我怎么知道是否数据传输失败,是否需要进行故障转移?我是否必须安装其他组件(如zookeeper)来跟踪/启用任何HA事件?谢谢! 最佳答案 默认情况下不启用高可用性。我强烈建议您阅读Apache的Hadoop文档。(http://hadoop.apache.org/)它将概述在Hadoop集群上运行的架构和服务。许多Hadoop服务都需要Zookeeper来协调它们在整个Hadoop集群中的操作,无论集群是否为HA。可以在ApacheZookeep

hadoop - 数据节点故障后恢复的 hdfs

我有一个包含2个主节点和2个数据节点的4节点hadoop集群。我在这个集群中有很多文件。我的一个数据节点崩溃了(从aws控制台意外终止)。因为我有复制因子1,所以我认为这不会导致任何数据丢失。我添加了新节点并将其作为数据节点。但是现在我的hdfsdfsadmin-report说很多缺失的block。为什么是这样?我怎样才能从这里恢复过来?我不能执行fsck-delete,因为这些文件对我很重要。当我尝试从这个集群到另一个新创建的集群的distcp时,我得到了丢失的block异常。添加新数据节点后是否需要执行任何步骤? 最佳答案 Ha

hadoop - 用于故障转移的 Apache HBase 复制

ApacheHBase:Replication:Slave/Replication集群是否也用于故障转移处理而不是单独的数据恢复? 最佳答案 是的。HBaseReplication可以用作灾难恢复解决方案,并有助于提供更高的可用性或故障转移。我假设您已经完成了这个page其中谈到了HBase复制。 关于hadoop-用于故障转移的ApacheHBase复制,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

hadoop - 分布式系统-主服务器故障

我最近在分布式系统上阅读了一些内容,例如Google的MapReduce和GSF研究论文。这两个系统都依赖于Master节点的存在,该节点协调其他“worker”节点。我想知道设计师如何保护自己免受主失效的影响?在MapReduce论文中,我们可以阅读:Itiseasytomakethemasterwriteperiodiccheckpointsofthemasterdatastructuresdescribedabove.Ifthemastertaskdies,anewcopycanbestartedfromthelastcheckpointedstate我不清楚世卫组织负责监测主故

hadoop - 关于 YARN 的查询(故障模式、容器大小、实例)

我想问几个问题来理解YARN的工作原理:任何人都可以解释或引用任何可以轻松了解YARN中故障模式的文档(即任务故障、应用程序主机故障、节点管理器故障、资源管理器故障)YARN中的容器大小是多少?和Mapreduce1中的slot一样吗?YARN的任何实际/工作示例?谢谢 最佳答案 请参阅Hadoop权威指南教科书...除此之外,apache网站上还有很多信息。容器大小不是固定的,它是根据资源管理器的要求动态分配的。从开发人员的角度来看,相同的旧map-reduce将适用于YARN。ResourceManager失败在YARN框架的初

目标检测YOLO实战应用案例100讲-基于红外图像处理的无人机光伏组件故障检测

目录前言国内外研究现状 光伏组件故障检测研究现状 图像检测算法研究现状 

hadoop - 有什么方法可以修复HDFS随机因子的种子

我正在使用HADOOP-0.22在HDFS上做一些实验。另一方面,为了使我的实验可重复,我需要修复一些随机因素的HDFS种子。具体来说,每次我重新格式化文件系统并导入同一组数据时,我都希望将数据block分配给与上一个实验相同的数据节点并具有相同的名称。我不知道是否有人这样做过。感谢任何回复。 最佳答案 您的Hadoop版本支持可插入block放置策略,您可以根据需要提供更加静态或非随机的block放置策略。参见HDFS-385了解更多技术细节,以及此后该界面的相关演变。 关于hadoo

Linux 常用操作命令(CentOS 7.0)- 故障定位:服务器负载、进程管理、日志分析

系统经研发测试上线后,如果运行期间出现了BUG,需要对服务故障进行定位,一般会查看服务器负载、服务状态、进程管理、服务日志等。本文以CentOS7.0操作系统上的命令操作作为示例进行记录。常用工具包安装#常用包安装:top[root@webf~]#yuminstall-yprocps#常用包安装:netstat[root@webf~]#yuminstall-ynet-tools#常用包安装:lsof:查看系统中已经打开的文件、网络连接和进程[root@webf~]#yuminstall-ylsof#常用包安装:vmstat、ifstat:查看系统中已经打开的文件、网络连接和进程[root@we

java - 如何处理 master actor 故障

我是Akka的新手,我构建了一个连接到HDFS的Akka模型,提取数据,对其进行处理并将处理后的数据写回HDFS。现在,如果我的masteractor崩溃了,那么相应的子actor(Workers)也会崩溃,整个系统必须重新启动。因此,如果有一个创建辅助主控的进程,一旦主主控发生故障且恢复时间最短,它会自动开始运行。我无法围绕这个画出清晰的画面。我们将不胜感激。谢谢 最佳答案 来自docs:/user:TheGuardianActorTheactorwhichisprobablymostinteractedwithisthepare

hadoop - HIVE ODBC - 故障转移

在HIVEJDBC驱动程序中-有使用Zookeper和多个HS2ip地址来处理故障转移的选项。jdbc:hive2://zookeeper_quorum|hs2_host:port/[db][;principal=/|_HOST@][;transportMode=binary|http][;httpPath=][;serviceDiscoveryMode=zookeeper;zooKeeperNamespace=]在HIVEODBC中,在ODBC.ini文件中,以下是支持的选项-[Hive]Driver=Description=HiveDriverv1DATABASE=defaultH