引言钉钉单元化从2018年开始到今年已经是第五个年头了,五年的时间,钉钉单元化迭代了三个版本,从最初的毛头小子,到达今年已经小有成就。今天想借这个场来和大家分享我们单元化的心路历程和一些最佳实践。本文要分享的内容只涉及部分内容,无法做到面面俱到,主要是想在同路人中形成共鸣,进而能复用一些架构或者系统。在我们单元化建设过程中,除了网上仅有的文章外,其可以直接使用的系统乏善可陈,使我们不得不从最基础的系统开始,极大的影响建设效率。幸运最近几年云原生技术的兴起,让我们能复用很多基础设施,进而快速的提升我们单元化能力,助力钉钉的发展。单元化1.0合规驱动下的部署架构 2018年,部分大客户出于法律政策
引言钉钉单元化从2018年开始到今年已经是第五个年头了,五年的时间,钉钉单元化迭代了三个版本,从最初的毛头小子,到达今年已经小有成就。今天想借这个场来和大家分享我们单元化的心路历程和一些最佳实践。本文要分享的内容只涉及部分内容,无法做到面面俱到,主要是想在同路人中形成共鸣,进而能复用一些架构或者系统。在我们单元化建设过程中,除了网上仅有的文章外,其可以直接使用的系统乏善可陈,使我们不得不从最基础的系统开始,极大的影响建设效率。幸运最近几年云原生技术的兴起,让我们能复用很多基础设施,进而快速的提升我们单元化能力,助力钉钉的发展。单元化1.0合规驱动下的部署架构 2018年,部分大客户出于法律政策
引言钉钉单元化从2018年开始到今年已经是第五个年头了,五年的时间,钉钉单元化迭代了三个版本,从最初的毛头小子,到达今年已经小有成就。今天想借这个场来和大家分享我们单元化的心路历程和一些最佳实践。本文要分享的内容只涉及部分内容,无法做到面面俱到,主要是想在同路人中形成共鸣,进而能复用一些架构或者系统。在我们单元化建设过程中,除了网上仅有的文章外,其可以直接使用的系统乏善可陈,使我们不得不从最基础的系统开始,极大的影响建设效率。幸运最近几年云原生技术的兴起,让我们能复用很多基础设施,进而快速的提升我们单元化能力,助力钉钉的发展。单元化1.0合规驱动下的部署架构 2018年,部分大客户出于法律政策
引言钉钉单元化从2018年开始到今年已经是第五个年头了,五年的时间,钉钉单元化迭代了三个版本,从最初的毛头小子,到达今年已经小有成就。今天想借这个场来和大家分享我们单元化的心路历程和一些最佳实践。本文要分享的内容只涉及部分内容,无法做到面面俱到,主要是想在同路人中形成共鸣,进而能复用一些架构或者系统。在我们单元化建设过程中,除了网上仅有的文章外,其可以直接使用的系统乏善可陈,使我们不得不从最基础的系统开始,极大的影响建设效率。幸运最近几年云原生技术的兴起,让我们能复用很多基础设施,进而快速的提升我们单元化能力,助力钉钉的发展。单元化1.0合规驱动下的部署架构 2018年,部分大客户出于法律政策
配置内网穿透在本部分,你将使用钉钉内网穿透工具生成一个公网域名用于教程测试。打开命令行工具,执行以下命令,下载内网穿透工具。gitclonehttps://github.com/open-dingtalk/pierced.git执行以下命令,启动内网穿透。Windows执行以下命令:说明 Windows需使用cmd工具打开命令行。cdwindows_64./ding.exe-config=ding.cfg-subdomain=hyvdi8001MAC执行以下命令:cdmac_64 chmod777./ding./ding-config=./ding.cfg-subdomain=abc8080注
配置内网穿透在本部分,你将使用钉钉内网穿透工具生成一个公网域名用于教程测试。打开命令行工具,执行以下命令,下载内网穿透工具。gitclonehttps://github.com/open-dingtalk/pierced.git执行以下命令,启动内网穿透。Windows执行以下命令:说明 Windows需使用cmd工具打开命令行。cdwindows_64./ding.exe-config=ding.cfg-subdomain=hyvdi8001MAC执行以下命令:cdmac_64 chmod777./ding./ding-config=./ding.cfg-subdomain=abc8080注
背景目前的告警通知采用grafana来通知dingding群,这只是grafana的一个功能,所以在灵活性上还是有很多缺陷的,不如专门做告警通知的alertmanager方便grafana告警优点:可以发送趋势图,并且配置上来讲比较方便,直接在监控图里配置即可,比较简单缺点:不能创建一个告警模板应用到一批实例上,意味着我们要每个实例都去配置一下告警,非常麻烦。不能分组,比如:一个集群的多台机器,都挂掉了,那我们可能一下分别收到5,6个告警,这样大量冗余消息,时间长了人可能会有疏忽。告警恢复的消息,不能显示恢复的是哪个机器,只有一个ok和告警名,多个告警下来,具体是哪个恢复了我们也不知道。ale
背景目前的告警通知采用grafana来通知dingding群,这只是grafana的一个功能,所以在灵活性上还是有很多缺陷的,不如专门做告警通知的alertmanager方便grafana告警优点:可以发送趋势图,并且配置上来讲比较方便,直接在监控图里配置即可,比较简单缺点:不能创建一个告警模板应用到一批实例上,意味着我们要每个实例都去配置一下告警,非常麻烦。不能分组,比如:一个集群的多台机器,都挂掉了,那我们可能一下分别收到5,6个告警,这样大量冗余消息,时间长了人可能会有疏忽。告警恢复的消息,不能显示恢复的是哪个机器,只有一个ok和告警名,多个告警下来,具体是哪个恢复了我们也不知道。ale
Prometheus+Grafana+alertmanager+邮件+钉钉告警本文模拟生产环境一ansible部署ansbile部署在线安装yuminstall-yepel-releaseyuminstallansible-y离线安装#离线环境,提前在有网络的服务器上下载好需要的软件包yuminstall-yepel-releasemkdir-p/home/ansibleyuminstallansible-y--downloadonly--downloaddir/home/ansible/安装cd/home/ansible#安装nfsrpm-ivh*.rpm--force--nodeps[ro