Hadoop集群安装和搭建（全面超详细的过程）

小汤TYT 2023-04-15 原文

Hadoop集群安装和搭建（全面超详细的过程）

文章目录

前言

Hadoop是一个开源的、可运行与Linux集群上的分布式计算平台，用户可借助Hadoop存有基础环境的配置（虚拟机安装、Linux安装等），Hadoop集群搭建，配置和测试。

一、虚拟机的安装

VMware (Virtual Machine ware）是一个“虚拟PC”软件公司，提供服务器、桌面虚拟化的解决方案。
使用的虚拟软件：VMware15
VMware15软件的安装包与安装教程：https://mp.weixin.qq.com/s/AqPE61EmGJ89lO6sJshOzA

二、Linux系统安装

1.环境准备

VMware15.5 pro
Centos7镜像文件(mini)
Centos7下载链接：https://mirrors.tuna.tsinghua.edu.cn/centos/7.9.2009/isos/x86_64/

2.虚拟机安装

2.1 新建虚拟机，选择典型

;2.2 选择安装程序光盘映像文件（iso）

2.3 虚拟机名称和位置

2.4 指定磁盘容量

2.5 虚拟机配置如下

三、Centos系统安装

1.开启虚拟机

2.安装 CentOS7

3.选择语言（默认为English）

4.日期和时间亚洲/上海（这里默认为最小）

5.安装位置

6.系统网络和主机名

7.开始安装

8.设置ROOT密码

9.安装完成后重启即可

10.使用root权限登录

四、静态网络配置

1.查看网络是否连通

ping www.baidu.com

2.安装net-tools

 yum upgrade
 yum install net-tools

3.查看Mac地址（enter后面）

4.查看ip地址的起始和结束地址

5.修改网络配置文件

vi /etc/sysconfig/network-scripts/ifcfg-ens33

mac地址为2步骤的enter值
ip地址参照4步骤自行选择（必须在起始和结束的范围内）
子网掩码默认设置为255.255.255.0
网关的值为将ip地址中最后一段的值改为2
DNS使用谷歌提供的免费dns1：8.8.8.8

6.重启网络服务，查看是否配置成功

systemctl restart network
ping www.baidu.com

7.重启虚拟机后，查看是否连通网络（ip地址并未改变，且能连通网络）

reboot
ifconfig
ping www.baidu.com

五、虚拟机克隆配置

1.克隆虚拟机（右键相应虚拟机->管理->克隆）

2.创建完整克隆

3.克隆虚拟机名称和位置（等待克隆完成）

4.开启Hadoop02，修改主机名

hostnamectl set-hostname hadoop02
reboot                   //修改主机名后需重启虚拟机

5.查看mac地址

ifconfig

6.网络配置文件修改（标红需要修改，IP自己设置,mac用步骤5查到地址，网关为ip地址最后改为2）

vi /etc/sysconfig/network-scripts/ifcfg-ens33

7.重新启动网络配置（查看网络是否可用）

systemctl restart network
ping www.baidu.com

8.按照以上步骤，再克隆另外一台虚拟机Hadoop03

六、配置hosts文件和ssh免密登录

1.修改hosts配置文件（所有虚拟机都需要配置此文件）

vi /etc/hosts

2.生成密钥文件（四次回车）

ssh-keygen -t rsa

2.将本机公钥文件复制到其它虚拟机上（接收方需先开机）
在hadoop01上执行，先输入yes，后输入对应主机的密码，多台虚拟机配置操作相同

ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03

3.在虚拟机hadoop02，hadoop03都需要执行，保证三台主机都能够免密登录

ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop02

3.查看是否成功免密登录

七、Hadoop集群配置

1.在所有虚拟机根目录下新建文件夹export，export文件夹中新建data、servers和software文件

mkdir -p /export/data
mkdir -p /export/servers
mkdir -p /export/software

2.准备安装包
hadoop-2.7.4.tar.gz
jdk-8u161-linux-x64.tar.gz

3.下载安装软件Xshell
打开Xshell后点击文件并选择新建，名称填hadoop01，主机填写hadoop01的IP地址，再点击用户身份验证，把hadoop01的账号，密码输入，就可以通过Xshell控制虚拟机，方便后续软件的传输。（重复步骤新建会话控制hadoop02，hadoop03）

4.在Xshell先进入software文件内，然后下载rz命令，并使用rz命令进行文件上传，此时会弹出上传的窗口，选择要上传的文件，点击确定即可将本地文件上传到Linux上。

cd /export/software
yum   -y  install  lrzsz
rz

5.安装JDK（所有虚拟机都要操作）
5.1 解压jdk

cd /export/software
tar -zxvf jdk-8u161-linux-x64.tar.gz -C /export/servers/

5.2 重命名jdk目录

cd /export/servers
mv jdk1.8.0_161 jdk

5.3 配置环境变量

vi /etc/profile

#tip:在配置文件末尾追加
export JAVA_HOME=/export/servers/jdk
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

5.4 使配置文件生效

source /etc/profile

5.5 查看是否配置成功

java -version

6.Hadoop安装（所有虚拟机都要操作）
6.1 解压hadoop

cd /export/software
tar -zxvf hadoop-2.7.4.tar.gz -C /export/servers/

6.2 打开配置文件

vi /etc/profile

6.3 配置hadoop环境变量

#tip:在文件末尾追加
export HADOOP_HOME=/export/servers/hadoop-2.7.4
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

6.4 使配置文件生效

source /etc/profile

6.5 查看是否配置成功

hadoop version

7.Hadoop集群配置
7.1 进入主节点配置目录

cd /export/servers/hadoop-2.7.4/etc/hadoop/

7.2 修改hadoop-env.sh文件

vi hadoop-env.sh
#tip:找到相应位置，添加这段话
export JAVA_HOME=/export/servers/jdk

7.3 修改core-site.xml文件

vi core-site.xml

#tip:下图中乱码部分为注释代码，可以删掉，不影响
<configuration>
    <!--用于设置Hadoop的文件系统，由URI指定-->
    <property>
        <name>fs.defaultFS</name>
        <!--用于指定namenode地址在hadoop01机器上-->
        <value>hdfs://hadoop01:9000</value>
    </property>
    <!--配置Hadoop的临时目录，默认/tem/hadoop-${user.name}-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/export/servers/hadoop-2.7.4/tmp</value>
    </property>
</configuration>

7.4 修改hdfs-site.xml文件

vi hdfs-site.xml

<configuration>
    <!--指定HDFS的数量-->
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <!--secondary namenode 所在主机的IP和端口-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop02:50090</value>
    </property>
</configuration>

7.5 修改mapred-site.xml文件

cp mapred-site.xml.template mapred-site.xml**

vi mapred-site.xml

<configuration>
    <!--指定MapReduce运行时的框架，这里指定在YARN上，默认在local-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

7.6 修改yarn-site.xml文件

vi yarn-site.xml

<configuration>
    <!--指定YARN集群的管理者（ResourceManager）的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop01</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

7.7 修改slaves文件

#tip:将文件中的localhost删除，添加主节点和子节点的主机名称
#tip:如主节点hadoop01，子节点hadoop02和hadoop03
vi slaves

7.8将主节点中配置好的文件和hadoop目录copy给子节点

#tip:这里主节点为hadoop01，子节点为hadoop02和hadoop03
scp /etc/profile hadoop02:/etc/profile
scp /etc/profile hadoop03:/etc/profile
scp -r /export/ hadoop02:/
scp -r /export/ hadoop03:/

7.9 使子节点中的配置文件生效

#tip:返回hadoop02和hadoop03节点执行下面命令
source /etc/profile

7.10 在主节点格式化文件系统（successfully formatted 格式化成功）

hdfs namenode -format

八、Hadoop集群测试

1.启动集群
1.1在主节点启动所有HDFS服务进程

start-dfs.sh

1.2 在主节点启动所有HDFS服务进程

start-yarn.sh

1.3 使用jps命令查看进程

2.关闭防火墙（所有虚拟机都要操作）

systemctl stop firewalld    #关闭防火墙

systemctl disable firlewalld  #关闭防火墙开机启动

3.打开window下的C:\Windows\System32\drivers\etc打开hosts文件，在文件末添加三行代码：
192.168.121.134 hadoop01
192.68.121.135 hadoop02
192.168.121.136 hadoop03

4.通过UI界面查看Hadoop运行状态，在Windows系统下，访问http://hadoop01:50070，查看HDFS集群状态

5.在Windows系统下，访问http://hadoop01:8088，查看Yarn集群状态

Hadoop 集群 span class token centos linux

有关Hadoop集群安装和搭建（全面超详细的过程）的更多相关文章

ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2
我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库，所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po
ruby - 完全离线安装RVM - 2
我打算为ruby脚本创建一个安装程序，但我希望能够确保机器安装了RVM。有没有一种方法可以完全离线安装RVM并且不引人注目(通过不引人注目，就像创建一个可以做所有事情的脚本而不是要求用户向他们的bash_profile或bashrc添加一些东西)我不是要脚本本身，只是一个关于如何走这条路的快速指针(如果可能的话)。我们还研究了这个很有帮助的问题:RVM-isthereawayforsimpleofflineinstall?但有点误导，因为答案只向我们展示了如何离线在RVM中安装ruby。我们需要能够离线安装RVM本身，并查看脚本https://raw.github.com/wayn
ruby-on-rails - rails 目前在重启后没有安装 - 2
我有一个奇怪的问题:我在rvm上安装了rubyonrails。一切正常，我可以创建项目。但是在我输入“railsnew”时重新启动后，我有“程序'rails'当前未安装。”。SystemUbuntu12.04ruby-v"1.9.3p194"gemlistactionmailer(3.2.5)actionpack(3.2.5)activemodel(3.2.5)activerecord(3.2.5)activeresource(3.2.5)activesupport(3.2.5)arel(3.0.2)builder(3.0.0)bundler(1.1.4)coffee-rails(
ruby - 如何为 emacs 安装 ruby-mode - 2
我刚刚为fedora安装了emacs。我想用emacs编写ruby。为ruby提供代码提示、代码完成类型功能所需的工具、扩展是什么？最佳答案 ruby-mode已经包含在Emacs23之后的版本中。不过，它也可以通过ELPA获得。您可能感兴趣的其他一些事情是集成RVM、feature-mode(Cucumber)、rspec-mode、ruby-electric、inf-ruby、rinari(用于Rails)等。这是我当前用于Ruby开发的Emacs配置:https://github.com/citizen428/emacs
ruby-on-rails - 无法在centos上安装therubyracer(V8和GCC出错) - 2
我正在尝试在我的centos服务器上安装therubyracer，但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e
ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2
我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止，这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search
ruby - 如何在 Lion 上安装 Xcode 4.6，需要用 RVM 升级 ruby - 2
我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby，并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121
ruby - Fast-stemmer 安装问题 - 2
由于fast-stemmer的问题，我很难安装我想要的任何rubygem。我把我得到的错误放在下面。Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingfast-stemmer:ERROR:Failedtobuildgemnativeextension./System/Library/Frameworks/Ruby.framework/Versions/2.0/usr/bin/rubyextconf.rbcreatingMakefilemake"DESTDIR="cleanmake"DESTDIR=
ruby - 安装 Ruby 时遇到问题(无法下载资源 "readline--patch") - 2
当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub
ruby - 通过 RVM 安装 Ruby 1.9.2 永远行不通! - 2
当我执行>rvminstall1.9.2时一切顺利。然后我做>rvmuse1.9.2也很顺利。但是当涉及到ruby-v时..sam@sjones:~$rvminstall1.9.2/home/sam/.rvm/rubies/ruby-1.9.2-p136,thismaytakeawhiledependingonyourcpu(s)...ruby-1.9.2-p136-#fetchingruby-1.9.2-p136-#downloadingruby-1.9.2-p136,thismaytakeawhiledependingonyourconnection...%Total%Rece

Hadoop集群安装和搭建（全面超详细的过程）

Hadoop集群安装和搭建（全面超详细的过程）

文章目录

前言

一、虚拟机的安装

二、Linux系统安装

1.环境准备

2.虚拟机安装

三、Centos系统安装

四、静态网络配置

五、虚拟机克隆配置

六、配置hosts文件和ssh免密登录

七、Hadoop集群配置

八、Hadoop集群测试

有关Hadoop集群安装和搭建（全面超详细的过程）的更多相关文章

随机推荐