HDFS机架感知

DawnLewis's Blog 2023-03-28 原文

Hadoop版本：2.9.2

什么是机架感知

通常大型 Hadoop 集群是以机架的形式来组织的，同一个机架上的不同节点间的网络状况比不同机架之间的更为理想，NameNode 设法将数据块副本保存在不同的机架上以提高容错性。

HDFS 不能够自动判断集群中各个 DataNode 的网络状况情况，Hadoop 允许集群的管理员通过配置 net.topology.script.file.name 参数来确定节点所处的机架，配置文件提供了 ip 到 rackid 的翻译。NameNode 通过这个配置知道集群中各个 DataNode 机器的 rackid。如果 net.topology.script.file.name 没有设定，则每个 ip 都会被翻译成 /default-rack。机器感知如下图所示：

图中的 D 和 R 是交换机，H 是 DataNode，则 H1 的 rackid = /D1/R1/H1，有了 rackid 信息（这些 rackid 信息可以通过 net.topology.script.file.name 配置）就可以计算出任意两台 DataNode 之间的距离。

distance(/D1/R1/H1 , /D1/R1/H1) = 0 相同的 DataNode
distance(/D1/R1/H1 , /D1/R1/H2) = 2 同 rack 下的不同 DataNode
distance(/D1/R1/H1 , /D1/R2/H4) = 4 同 IDC 下的不同 DataNode
distance(/D1/R1/H1 , /D2/R3/H7) = 6 不同 IDC 下的 DataNode

说明：

当没有配置机架信息时，所有的机器 Hadoop 都在同一个默认的机架下，名为 "/defult-rack"，这种情况的任何一台 DataNode 机器，bug物理上是否属于同一个机架，都会被认为是在同一个机架下。
一旦配置 net.topology.script.file.name，就按照网络拓扑结构来寻找 DataNode：net.topology.script.file.name 这个配置选项的 value 指定为一个可执行程序，通常为一个脚本。

Hadoop机架感知的作用

不开启机架感知的缺点

默认情况下，hadoop 的机架感知是没有被启用的。所以，在通常情况下，hadoop 集群的 HDFS 在选机器的时候，是随机选择的。
也就是说，如果实际节点不完全在相同的机架，但是又没有配置机架感知很有可能在写数据时：

hadoop 将第一块数据 block1 写到了 rack1 上，然后随机的选择下将 block2 写入到了 rack2 下，此时两个 rack 之间产生了数据传输的流量，再接下来，在随机的情况下，又将 block3 重新又写回了 rack1，此时，两个 rack 之间又产生了一次数据流量。在 job 处理的数据量非常的大，或者往 hadoop 推送的数据量非常大的时候，这种情况会造成 rack 之间的网络流量成倍的上升，成为性能的瓶颈，进而影响作业的性能以至于整个集群的服务。

开启机架感知的优势

不同节点之间的通信能够尽量发生在同一个机架之内，而不是跨机架；

为了提高容错能力，DataNode 会尽可能把数据块的副本放到多个机架上。

机架感知的配置

检查当前集群机架配置情况

执行hdfs dfsadmin -printTopology打印当前机架信息，可以看到默认所有节点都是一个机架 default-rack，此时没有配置机架感知。

hdfs dfsadmin -printTopology

自定义机器机架位置

新建机架配置文件topology.data

vim $HADOOP_HOME/topology.data

由于官方配置文件没有确切的说明到底是主机名还是 ip 地址会被传入到脚本，所以在脚本中最好兼容主机名和 ip 地址。

192.168.166.121   hadoop1       /switch1/rack1
192.168.166.122   hadoop2       /switch1/rack1
192.168.166.123   hadoop3       /switch1/rack2

自定义机架感知脚本

在Hadoop的安装目录下新建脚本topology.sh

vim $HADOOP_HOME/topology.sh

编写脚本内容

#!/bin/bash
# 此处是你的机架配置文件topology.sh所在目录
HADOOP_CONF=/opt/servers/hadoop
while [ $# -gt 0 ] ;
do
        #脚本第一个参数节点ip或者主机名称赋值给nodeArg
        nodeArg=$1
        #以只读的方式打开机架配置文件
        exec<${HADOOP_CONF}/topology.data
        #声明返回值临时变量
        result=""
        #开始逐行读取
        while read line
        do
                #赋值行内容给ar，通过这种 变量=（ 值 ）的方式赋值，下面可以通过数组的方式取出每个词
                ar=( $line )
                #判断输入的主机名或者ip是否和该行匹配
                if [ "${ar[0]}" = "$nodeArg" ]||[ "${ar[1]}" = "$nodeArg" ]
                then
                        #将机架信息赋值给result
                        result="${ar[2]}"
                fi
        done
        shift
        #-z判断字符串长度是否为0，不为0输出实际机架，为0返回默认机架信息
        if [ -z "$result" ]
        then
                echo -n "/default-rack"
        else
                echo -n "$result"
        fi
done

配置core-site.xml文件机架感知

脚本必须添加可执行权限

chmod 777 topology.sh

修改 core-site.xml 文件。

<!-- 配置机架感知配置脚本  -->
<property>
    <name>net.topology.script.file.name</name>
    <!-- 注意这里是你脚本的实际位置 -->
    <value>/opt/servers/hadoop/topology.sh</value>
</property>

分发配置文件和脚本

rsync-script etc/hadoop/core-site.xml

rsync-script topology.*

验证机架感知配置

重启集群，执行 hdfs dfsadmin -printTopology 打印机架信息，可以看到集群已经按照配置感应到节点机架位置。

hdfs dfsadmin -printTopology

测试上传文件，因为只搭建了三个节点，因此设置副本数为2，查看两个副本是否存在不同的机架rack1和rack2上的节点。

在 hadoop2.8 版本之前的版本上述的结论可能不同，主要跟 Hadoop 的副本策略有关，详细的副本策略请看 https://weixiaodyanlei.xyz/archives/hdfs-fu-ben-ji-zhi

hdfs dfs -D dfs.replication=2 -put LICENSE.txt /

可以通过如下命令查看 HDFS 中的文件所在机架

hdfs fsck /LICENSE.txt -blocks -files -locations -racks

参考博客：https://blog.csdn.net/qq_31454379/article/details/105497503

HDFS 机架 topology code pre 大数据

有关HDFS机架感知的更多相关文章

【自动驾驶环境感知项目】——基于Paddle3D的点云障碍物检测 - 2
文章目录1.自动驾驶实战：基于Paddle3D的点云障碍物检测1.1环境信息1.2准备点云数据1.3安装Paddle3D1.4模型训练1.5模型评估1.6模型导出1.7模型部署效果附录show_lidar_pred_on_image.py1.自动驾驶实战：基于Paddle3D的点云障碍物检测项目地址——自动驾驶实战：基于Paddle3D的点云障碍物检测课程地址——自动驾驶感知系统揭秘1.1环境信息硬件信息CPU:2核AI加速卡:v100总显存:16GB总内存:16GB总硬盘:100GB环境配置Python:3.7.4框架信息框架版本:PaddlePaddle2.4.0（项目默认框架版本为2.3
ruby - 机架/Sinatra LoadError : cannot load such file - 2
我正在尝试使用Sinatra、Ruby、rack、haml、pony和SendGrid构建一个应用程序，并使用git和RVM部署在Heroku上。该应用程序是一个博客变体，应该发送一封电子邮件，其中包含在表单上提交的评论。在我的本地服务器上，当表单提交时出现以下错误:LoadErrorat/cannotloadsuchfile--ponyfile:tools.rblocation:requireline:314BACKTRACE(expand)/Users/Kevin/prog/ruby/Sinatra/Noobs/noobs.rbinblockinrequire'pony'在Hero
ruby-on-rails - 使用机架中间件捕获无效的 JSON 解析错误 - 2
我正在使用Rails5，我正在尝试改进对我的API的无效JSON请求的错误处理。我尝试通过救援在Controller中解析来处理无效格式的JSON，但意识到如果用户将ContentType添加到他们的请求header，Rails中间件会在我的JSON请求到达Controller之前解析它。我遵循了以下指南:https://robots.thoughtbot.com/catching-json-parse-errors-with-custom-middleware但是，在启动服务器时出现以下错误:.rbenv/versions/2.3.1/lib/ruby/gems/2.3.0/gems
ruby - 在没有机架的情况下运行 Capybara 在使用 url 参数时会产生错误 - 2
这是我的设置，基于此建议:HowtogetCucumber/Capybara/Mechanizetoworkagainstexternalnon-railssite在我将参数添加到URL之前它一直有效。对解决这个问题有什么建议吗？require'rspec'require'capybara/rspec'require'capybara/dsl'@test_url="test"RSpec.configuredo|config|config.includeCapybara::DSLendCapybara.configuredo|config|config.run_server=falsec
ruby-on-rails - 限制每个用户的请求数量(使用机架攻击和设计) - 2
我正在使用https://github.com/kickstarter/rack-attack/#throttles限制对某些网址的请求。机架攻击文档展示了如何通过请求IP或请求参数进行限制，但我想做的是限制每个用户的请求。因此，无论IP是什么，用户都应该能够在特定时间范围内发出不超过n个请求。我们使用devise进行身份验证，我想不出一种简单的方法来根据请求唯一标识用户。我应该在session/cookie中存储用户ID吗？也许是一个uniq哈希？您对实现这一目标的最佳方式有何看法？最佳答案想通了。Devise已将用户ID存储
ruby-on-rails - RoR - 哪个是首选 - 机架中间件或主动 Controller 过滤器？ - 2
对于最新版本的RubyonRails(问这个问题时是4)，实现修改请求/响应(例如身份验证机制)的代码的首选方法是什么。我看到许多网站和教程提倡Rackmiddleware虽然似乎可以通过ActionControllerfiltermethods实现相同的功能.除了讨论首选方法外，是否可以提供每种方法的优缺点比较？在我最初的调查中，ActionController过滤器方法似乎更紧密地集成到RoR应用程序中，这样您就可以绕过在某些Controller端点上运行某些过滤器，而中间件似乎无法拥有该级别的控制。这样的细节会很棒。谢谢! 最佳答案
ruby - 加载错误机架/测试 - 2
运行测试文件时出现以下错误。$rubytest/test_gothonweb.rb/Users/sony/.rvm/rubies/ruby-1.9.3-p194/lib/ruby/site_ruby/1.9.1/rubygems/custom_require.rb:36:in`require':cannotloadsuchfile--rack/test(LoadError)from/Users/sony/.rvm/rubies/ruby-1.9.3-p194/lib/ruby/site_ruby/1.9.1/rubygems/custom_require.rb:36:in`requir
ruby - 使用机架安装的多个 Sinatra 应用程序 - 2
我有一个关于在Sinatra上使用机架安装的问题。我有两个经典风格的Sinatra应用程序。让我们调用app.rb中定义的一个App和api.rb中定义的另一个API。我希望api.rb处理所有以“/api”开头的路由，而app.rb处理所有其他请求，包括根(“/”)。我如何使用机架安装方式进行设置？或者有比这更好的解决方案吗？最佳答案我认为您会更喜欢Rack::URLMap-它可能看起来像这样:runRack::URLMap.new("/"=>App.new,"/api"=>Api.new)这应该放在您的config.ru文件
HDFS+ MapReduce 数据处理与存储实验 - 2
文章目录实验二：HDFS+MapReduce数据处理与存储实验1.实验目的2.实验环境3.实验内容3.1HDFS部分3.1.1上传文件3.1.2下载文件3.1.3显示文件信息3.1.4显示目录信息3.1.5删除文件3.1.6移动文件3.2MapReduce部分3.2.0Mapreduce原理3.2.1合并和去重3.2.1.1编写Merge.java代码3.2.1.2编译执行3.2.2文件的排序3.2.2.1编写Sort.java代码3.2.2.2编译执行4.踩坑记录5.心得体会6.源码附录6.1Merge.java完整代码6.2Sort.java完整代码实验二：HDFS+MapReduce数据
ACE 编辑器中的 Javascript 智能感知 - 2
长话短说我需要ACE编辑器中JavaScript的智能自动完成/智能感知。解释我正在使用ACE编辑器为JavaScript创建在线IDE。是否有任何库或开源项目允许JavaScript的智能自动完成。JavaScript是一种动态语言，intellisense集成对于此类语言来说是微不足道的(TypeScript确实支持这一点)。ACE编辑器仅支持使用enableBasicAutocompletion的基本自动完成功能(如SublimeText)。我需要智能自动补全，一个实时解析后端javascript并提供建议的引擎。如能提供有关此问题的任何帮助，我们将不胜感激。谢谢。