etcd v3版本生产级集群搭建以及实现一键启动脚本

字母哥博客 2023-04-17 原文

本专栏的上一篇文章写了《长篇图解etcd核心应用场景及编码实战》，本文继续。后续计划章节内容如下：

《长篇图解etcd核心应用场景及编码实战》
《搭建高可用etcd集群》
《基于etcd实现分布式锁（java代码实现）》
《基于etcd实现配置变更通知（java代码实现）》
《基于etcd实现服务注册与发现（java代码实现）》
《基于etcd实现分布式系统节点leader选举（java代码实现）》

很多人知道etcd是因为kubernetes，所以最常用的etcd集群的搭建方法是通过k8s来配置启动一个etcd集群。但是etcd除了搭配k8s进行使用，还有很多其他的应用场景，比如：分布式锁、配置变更通知、分布式系统多节点的leader选举等。所以此文为大家介绍的etcd集群安装脱离k8s，就是在linux服务器上直接安装etcd的高可用服务集群。

一、准备工作

以下的准备工作在三台服务器上都要完成

1.1. 规划主机服务器

首先需要规划服务器，因为etcd集群需要选举Leader，所以建议集群节点的个数是3或者5。也不要太多，节点之间会有数据复制保证数据一致性，节点越多网络及服务器性能消耗越大。需要确保服务器之间的网络联通性。

使用root用户在/etc/hosts文件中追加如下的配置，使主机名称hostname与ip之间建立映射关系。访问peer1就是访问对应的主机ip。

192.168.161.3       peer1
192.168.161.4       peer2
192.168.161.5       peer3

1.2. 新建etcd用户

在CentOS的linux发行版下，执行如下命令会创建用户及用户组etcd，并自动创建/home/etcd目录。如果你使用的是其他的操作系统发行版，可能需要使用useradd命令，并自行创建这个目录。

groupadd etcd
adduser -g etcd etcd

使用root用户新建用户及用户主目录。默认的新建用户是没有密码，可以使用passwd etcd命令为其设置密码。

1.3.开放防火墙端口

开放防火墙，使用如下3条命令开放etcd的标准端口2379、2380的端口。笔者在实际安装的过程中，通常不使用这2个端口，因为端口越固定，被攻击的可能性就越大。我们随机选择一个不常用的端口，安全性会更好一些，这里我还是使用标准端口了。集群内部的各个节点通过2380端口进行通信，2379端口负责对外与客户端通信

firewall-cmd --zone=public --add-port=2379/tcp --permanent;
firewall-cmd --zone=public --add-port=2380/tcp --permanent;
firewall-cmd --reload

使用root用户操作防火墙。

1.4.创建必要的目录

使用su - etcd从root用户切换到etcd用户，在etcd用户的主目录/home/etcd下面新建如下的目录, 用于etcd数据存储

mkdir -p /home/etcd/data;

1.5.下载etcd并解压

etcd用户下载etcd安装包，从github上下载比较慢，我选择的是国内华为云提供的加速镜像。如果你不想使用我的版本，你也可以搜索“etcd国内下载加速”选择自己需要的版本。wget命令下载，tar命令进行解压，这个不必多说。

wget https://mirrors.huaweicloud.com/etcd/v3.5.4/etcd-v3.5.4-linux-amd64.tar.gz;
tar -xzvf /home/etcd/etcd-v3.5.4-linux-amd64.tar.gz;

1.6. 集群主机免密登陆

后续我们在进行etcd运维，比如说启动集群的时候不希望一台服务器一台服务器的执行命令，而是希望在一台服务器上完成操作，这就需要集群etcd用户之间能够免密登陆对方。这里我就简单介绍了，讲解该如何实现，原理大家搜文章学习下。etcd权限用户根目录下执行如下命令，不论提示输入什么，一路回车即可。

ssh-keygen -t rsa

将公钥保存到authorized_keys文件中

cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

将公钥分发给peer2、peer3主机。按提示输入etcd的登陆密码

ssh-copy-id -i ~/.ssh/id_rsa.pub -p22 etcd@peer2;

需要分开执行，因为执行命令的过程中需要输入密码。

ssh-copy-id -i ~/.ssh/id_rsa.pub -p22 etcd@peer3;

这样，我们peer1免密登录peer2、peer3的配置工作就完成了。同样的操作，在peer2、peer3服务器上执行，将自己的公钥发给另外2台服务器，主机名称替换一下。这样设置完成之后，我们在这三台服务器中的任意一台服务器上etcd用户下执行如ssh etcd@peer3就可以登陆peer3，不需要输入密码，证明我们的操作成功了。

二、集群启动与验证

2.1. 一键启动脚本实现

完成上面的准备工作，实际上我们的etcd集群安装就已经完成了，实际的安装动作就是解压，解压目录下的etcd、etcdctl、etcdutl都是可执行文件，可以直接使用。

下面我们使用这个脚本来启动etcd集群（只需要在规划好的3台服务器上任意一台执行一次该脚本即可）。我们给这个脚本起个名字start-etcds.sh,并给它赋予可执行权限。

#!/bin/bash

## ------------config-----------------
export ETCDCTL_API=3
CLUSTER_TOKEN=etcdcluster01
DATADIR=/home/etcd/data
HOSTNAME1=peer1
HOSTNAME2=peer2
HOSTNAME3=peer3
HOSTIP1=192.168.161.3
HOSTIP2=192.168.161.4
HOSTIP3=192.168.161.5
CLUSTER=${HOSTNAME1}=http://${HOSTIP1}:2380,${HOSTNAME2}=http://${HOSTIP2}:2380,${HOSTNAME3}=http://${HOSTIP3}:2380
CLUSTER_IPS=(${HOSTIP1}  ${HOSTIP2}  ${HOSTIP3})
CLUSTER_NAMES=(${HOSTNAME1}  ${HOSTNAME2}  ${HOSTNAME3})

## ---------------start etcd node------------------
for i in $(seq 0 `expr ${#CLUSTER_IPS[@]} - 1`); do
    nodeip=${CLUSTER_IPS[i]}
    nodename=${CLUSTER_NAMES[i]}

    ssh -T $nodeip <<EOF
    nohup /home/etcd/etcd-v3.5.4-linux-amd64/etcd  \
        --name ${nodename} \
        --data-dir  ${DATADIR}  \
        --initial-advertise-peer-urls http://${nodeip}:2380 \
        --listen-peer-urls http://${nodeip}:2380 \
        --advertise-client-urls http://${nodeip}:2379 \
        --listen-client-urls http://${nodeip}:2379 \
        --initial-cluster ${CLUSTER} \
        --initial-cluster-state new \
        --initial-cluster-token ${CLUSTER_TOKEN} >> ${DATADIR}/etcd.log 2>&1  &
EOF
echo 从节点 $nodename 启动etcd节点...[ done ]

sleep 5
done

这个脚本分成两个部分，第一个部分config是我们自定义的shell脚本变量

export ETCDCTL_API=3表示使用版本号为3的etcdctl API。
CLUSTER_TOKEN一个etcd集群有一个唯一的token，随意设置保证唯一性即可。
DATADIR表示etcd的数据磁盘存储路径
HOSTNAME1、2、3表示我们事先规划好的3台服务器的主机名称，即：linux主机hostname命令的执行结果。
HOSTIP1、2、3表示我们事先规划好的3台服务器的IP地址。（如果有多块网卡，请选择对外提供服务的网卡ip）
CLUSTER是etcd集群配置的标准格式
CLUSTER_IPS、CLUSTER_NAMES分别是集群服务器各节点的ip和主机名称数组

第二个部分是etcd集群的启动脚本，因为我们已经配置了etcd用户的主机之间免密登陆，所以可以通过一个脚本启动3台服务器上的etcd服务。

for i in $(seq 0 expr ${#CLUSTER_IPS[@]} - 1); do 表示for循环，循环CLUSTER_IPS数组的长度赋值给i，所以i随着for循环依次等于1、2、3。
nodeip、nodename等于CLUSTER_IPS、CLUSTER_NAMES数组中下标为i的元素，即：主机的ip、主机的名称。
for循环遍历3台服务器，依次使用ssh -T $nodeip登陆3台服务器，因为上文已经做过免密登陆，所以无需密码。
EOF作为段落分割，其中间包裹的命令就是etcd实例的启动命令。

etcd的启动命令如下：

/home/etcd/etcd-v3.5.4-linux-amd64/etcd :启动etcd命令
--name: etcd节点名称，保证唯一性，我们使用etcd所部署的主机名称即可。
--data-dir: etcd数据存储位置
--initial-advertise-peer-urls ，
--listen-peer-urls 指定当前节点与集群内其他节点通信的url。如果该节点存在网络代理，--initial-advertise-peer-urls 设置为代理的地址：2379。
--advertise-client-urls ,
--listen-client-urls指定客户端与当前节点通信的url。如果该节点存在网络代理， --advertise-client-urls 设置为代理的地址：2380。
--initial-cluster集群各节点的通信地址列表
--initial-cluster-state新建的级群使用new，一个节点加入已经存在的集群用existing
--initial-cluster-token集群的token唯一标识。

2.2.验证集群

使用etcdctl member list查看当前的etcd集群包含多少个节点以及节点的状态

/home/etcd/etcd-v3.5.4-linux-amd64/etcdctl \
--endpoints=192.168.161.3:2379,192.168.161.4:2379,192.168.161.5:2379 \
member list

上面的命令结果中能看到状态是started证明我们的集群处于正常运行状态。如果想查询集群内那个节点是Leader节点，我更经常使用的命令是下面的这个

/home/etcd/etcd-v3.5.4-linux-amd64/etcdctl \
--endpoints=192.168.161.3:2379,192.168.161.4:2379,192.168.161.5:2379 \
endpoint status -w table

显示结果如下。可以看到“IS LEADER=true”的节点是集群的Leader节点：

码文不易，如果您觉得有帮助，请帮忙点击在看或者分享，没有您的支持我可能无法坚持下去！
欢迎关注我的公告号：字母哥杂谈，回复003赠送作者专栏《docker修炼之道》的PDF版本，30余篇精品docker文章。字母哥博客：zimug.com

etcd 版本 code li Java

有关etcd v3版本生产级集群搭建以及实现一键启动脚本的更多相关文章

ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby-on-rails - 项目升级后 Pow 不会更改 ruby 版本 - 2
我在我的Rails项目中使用Pow和powifygem。现在我尝试升级我的ruby版本(从1.9.3到2.0.0，我使用RVM)当我切换ruby版本、安装所有gem依赖项时，我通过运行railss并访问localhost:3000确保该应用程序正常运行以前，我通过使用pow访问http://my_app.dev来浏览我的应用程序。升级后，由于错误Bundler::RubyVersionMismatch:YourRubyversionis1.9.3,butyourGemfilespecified2.0.0，此url不起作用我尝试过的:重新创建pow应用程序重启pow服务器更新战俘
ruby-on-rails - 启动 Rails 服务器时 ImageMagick 的警告 - 2
最近，当我启动我的Rails服务器时，我收到了一长串警告。虽然它不影响我的应用程序，但我想知道如何解决这些警告。我的估计是imagemagick以某种方式被调用了两次？当我在警告前后检查我的git日志时。我想知道如何解决这个问题。-bcrypt-ruby(3.1.2)-better_errors(1.0.1)+bcrypt(3.1.7)+bcrypt-ruby(3.1.5)-bcrypt(>=3.1.3)+better_errors(1.1.0)bcrypt和imagemagick有关系吗？/Users/rbchris/.rbenv/versions/2.0.0-p247/lib/ru
ruby-on-rails - 在 ruby .gemspec 文件中，如何指定依赖项的多个版本？ - 2
我正在尝试修改当前依赖于定义为activeresource的gem:s.add_dependency"activeresource","~>3.0"为了让gem与Rails4一起工作，我需要扩展依赖关系以与activeresource的版本3或4一起工作。我不想简单地添加以下内容，因为它可能会在以后引起问题:s.add_dependency"activeresource",">=3.0"有没有办法指定可接受版本的列表？~>3.0还是~>4.0？最佳答案根据thedocumentation,如果你想要3到4之间的所有版本，你可以这
ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2
我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征，我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现，但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden
Ruby Sinatra 配置用于生产和开发 - 2
我已经在Sinatra上创建了应用程序，它代表了一个简单的API。我想在生产和开发上进行部署。我想在部署时选择，是开发还是生产，一些方法的逻辑应该改变，这取决于部署类型。是否有任何想法，如何完成以及解决此问题的一些示例。例子:我有代码get'/api/test'doreturn"Itisdev"end但是在部署到生产环境之后我想在运行/api/test之后看到ItisPROD如何实现？最佳答案根据SinatraDocumentation:EnvironmentscanbesetthroughtheRACK_ENVenvironm
ruby-on-rails - 如果我将 ruby 版本 2.5.1 与 rails 版本 2.3.18 一起使用会怎样？ - 2
如果我使用ruby版本2.5.1和Rails版本2.3.18会怎样？我有基于rails2.3.18和ruby1.9.2p320构建的rails应用程序，我只想升级ruby的版本，而不是rails，这可能吗？我必须面对哪些挑战？最佳答案 GitHub维护apublicfork它有针对旧Rails版本的分支，有各种变化，它们一直在运行。有一段时间，他们在较新的Ruby版本上运行较旧的Rails版本，而不是最初支持的版本，因此您可能会发现一些关于需要向后移植的有用提示。不过，他们现在已经有几年没有使用2.3了，所以充其量只能让更
ruby-on-rails - 获取 inf-ruby 以使用 ruby 版本管理器 (rvm) - 2
我安装了ruby版本管理器，并将RVM安装的ruby实现设置为默认值，这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时，它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径？谢谢! 最佳答案我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣，可以在这里获取:http://github.com/senny/rvm.el
ruby-on-rails - 在 Rails 中调试生产服务器 - 2
您如何在Rails中的实时服务器上进行有效调试，无论是在测试版/生产服务器上？我试过直接在服务器上修改文件，然后重启应用，但是修改好像没有生效，或者需要很长时间(缓存？)我也试过在本地做“脚本/服务器生产”，但是那很慢另一种选择是编码和部署，但效率很低。有人对他们如何有效地做到这一点有任何见解吗？最佳答案我会回答你的问题，即使我不同意这种热修补服务器代码的方式:)首先，你真的确定你已经重启了服务器吗？您可以通过跟踪日志文件来检查它。您更改的代码显示的View可能会被缓存。缓存页面位于tmp/cache文件夹下。您可以尝试手动删除
ruby-on-rails - 如何在发布新的 Ruby 或 Rails 版本时收到通知？ - 2
有人知道在发布新版本的Ruby和Rails时收到电子邮件的方法吗？他们有邮件列表，RubyonRails有一个推特，但我不想听到那些随之而来的喧嚣，我只想知道什么时候发布新版本，尤其是那些有安全修复的版本。最佳答案从therailsblog获取提要.http://weblog.rubyonrails.org/feed/atom.xml 关于ruby-on-rails-如何在发布新的Ruby或Rails版本时收到通知？，我们在StackOverflow上找到一个类似的问题：