草庐IT

通过Amazon EventBridge监控AWS资源发送告警至钉钉

AWS51 2023-06-24 原文

背景介绍

在使用AWS时偶尔会在管理员邮箱中收到AWS发的通知邮件,比如关于EC2维护信息,这些邮件很容易淹没在收件箱中,没有得到及时处理。另外对于重要的应用我们可能会在CloudWatch设置一些指标告警并进行邮件通知。如果这些都可以发到微信或钉钉等即时通信软件,就比邮件通知好多了,毕竟很多人都习惯在微信等即时通信软件上查看消息。为此,我们提供了AWS告警通知发送到企业微信和钉钉的解决方案。

**说明:**此方案仅目前仅支持AWS Global Regions,在AWS 北京和宁夏区暂时不支持事件的跨区传输。


架构图介绍
一、LogHub负责日志收集和可视化分析:

  1. 收集托管服务Cloufront日志、ALB来自不同国家区域的请求日志、服务器日志等,以及业务系统的Java应用日志数据;
  2. 通过OpenSearch存储与Dashboard可视化查看与分析,并设定OpenSearch告警当在指定时间范围内关键字出现多少次将触发SNS发送告警【接入无服务告警通知方案中】,将告警信息与办公沟通工具关联,如消息推送至钉钉和邮箱等。

二、AMP+AMG 指标监控:主要的作用是用于监控数仓的SQL慢查询

  1. AMP用于clickhouse集群监控、监听并存储clickhouse各节点clickhouse_exporter和node_exporter的实时状态数据。
  2. AMG 用于clickhouse SQL Tools和Prometheus监控可视化

三、无服务告警通知方案:云上资源的运维监控,接收告警推送至客户办公沟通工具

  1. 监控各项托管服务的health事件触发告警
  2. 监控各项托管服务的状态变化,例如 EC2的Stop、Restart、Terminate等
    通过cloudwatch监控业务系统多项指标 CPU、利用率、磁盘IO等;EKS集群的指标Container Insights 每个节点运行数量、Pod重启次数等;为这些指标创建告警规则触发Eventbridge 将告警发送至钉钉。

AWS服务介绍:

  • Event Bridge – 用于事件的监听及转发;
  • SNS – 用于服务间的解耦合;
  • Lambda – 发送事件到钉钉的的代码;
  • CloudFormation – 用于部署所需资源;

架构介绍

  • 发送消息到钉钉的代码全部采用无服务器架构,可以有效的节约企业成本。
  • 在账号中创建专门的事件总线(Target Event Bus),该Event Bus配置规则发送事件到SNS;Lambda用于接收SNS的事件,从Secrets Manager获取钉钉的账号信息,调用钉钉的接口,发送信息。
  • 账号的默认事件总线(Default Event Bus)配置规则,用于对事件进行筛选并发送事件到Target Event Bus。

配置钉钉

	- 参考钉钉官方网站文档来配置:[自定义机器人接入](https://open.dingtalk.com/document/robots/custom-robot-access)。
	- **自定义关键词:需要根据告警信息进行添加**

AWS配置

  • 配置发往钉钉的SNS Topic
    • 登陆AWS Console,选择Serverless Application Repository服务
    • 点击“Available applications”->“Public applications”
    • 在搜索框里输入“dingtalk”
    • 勾选上“Show apps that create custom IAM roles or resource policies”
    • 点击“DingTalk-Notifier”。
  • 在应用程序设置填入之前拿到的钉钉 Webhook URl,之后点击部署
  • 点击部署查看“Status”变为“Create complete”,等待部署完成
  • 部署完成后,进入Amazon Event Bridge 可以看到已经创建了两个针对EC2状态变化,Health事件的规则

测试

打开EC2控制台-启动实例如下图

参考文档:

集中整合EventBridge事件通知发送到钉钉和企业微信:

https://aws.amazon.com/cn/blogs/china/centralized-integration-of-eventbridge-event-notifications-sent-to-ding-talk-and-enterprise-wechat/

企业微信、钉钉接收 Amazon CloudWatch 告警

https://aws.amazon.com/cn/blogs/china/enterprise-wechat-and-dingtalk-receiving-amazon-cloudwatch-alarms/

无服务器告警推送方案部署文档

https://aws-gcr-solutions.s3.amazonaws.com/serverless-alert-notifier/v1.0.1/docs.pdf

转换器参考:

输入路径:

{"instance-id":"$.detail.instanceid","region":"$.region","state":"$.detail.state","time":"$.time"}

输入模板:

"EC2状态变化告警: \n时间: <time> \n区域: <region> \n实例id:<instance-id> \n状态: <state>"

有关通过Amazon EventBridge监控AWS资源发送告警至钉钉的更多相关文章

  1. ruby - 通过 rvm 升级 ruby​​gems 的问题 - 2

    尝试通过RVM将RubyGems升级到版本1.8.10并出现此错误:$rvmrubygemslatestRemovingoldRubygemsfiles...Installingrubygems-1.8.10forruby-1.9.2-p180...ERROR:Errorrunning'GEM_PATH="/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/ruby-1.9.2-p180@global:/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/rub

  2. ruby - 通过 erb 模板输出 ruby​​ 数组 - 2

    我正在使用puppet为ruby​​程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby​​不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

  3. ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2

    我正在编写一个小脚本来定位aws存储桶中的特定文件,并创建一个临时验证的url以发送给同事。(理想情况下,这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针,它似乎不符合这个标准,但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A

  4. ruby - 通过 ruby​​ 进程共享变量 - 2

    我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是

  5. ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2

    我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止,这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search

  6. ruby - 我可以使用 aws-sdk-ruby 在 AWS S3 上使用事务性文件删除/上传吗? - 2

    我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后,每个操作都应在S3上回滚。S3Object这可能吗?? 最佳答案 虽然S3API具有批量删除功能,但它不支持事务,因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST),因此每个上传操作都是通过一个独立的API调用完成的

  7. ruby-on-rails - Enumerator.new 如何处理已通过的 block ? - 2

    我在理解Enumerator.new方法的工作原理时遇到了一些困难。假设文档中的示例:fib=Enumerator.newdo|y|a=b=1loopdoy[1,1,2,3,5,8,13,21,34,55]循环中断条件在哪里,它如何知道循环应该迭代多少次(因为它没有任何明确的中断条件并且看起来像无限循环)? 最佳答案 Enumerator使用Fibers在内部。您的示例等效于:require'fiber'fiber=Fiber.newdoa=b=1loopdoFiber.yieldaa,b=b,a+bendend10.times.m

  8. ruby - 安装 Ruby 时遇到问题(无法下载资源 "readline--patch") - 2

    当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub

  9. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

    几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

  10. 通过 MacPorts 的 RubyGems 是个好主意吗? - 2

    从MB升级到新的MBP后,Apple的迁移助手没有移动我的gem。我这次是通过macports安装ruby​​gems,希望在下次升级时避免这种情况。有什么我应该注意的陷阱吗? 最佳答案 如果你想把你的gems安装在你的主目录中(在传输过程中应该复制过来,作为一个附带的好处,会让你以你自己的身份运行geminstall,而不是root),将gemhome:键设置为您在~/.gemrc中的主目录中的路径. 关于通过MacPorts的RubyGems是个好主意吗?,我们在StackOverf

随机推荐