prometheuskafkaSpark

在调研监控工具，之前一直用的zabbix很平稳（从没出过问题），监控内容大概有系统级别的cpu、内存、硬盘之类的，也有服务的运行情况、elasticsearch、hive、kafka的lag等等，但有几个问题没法解决：1、zabbix没法监控flink（虽然可以通过api调用方式，但flink指标有几百个一个一个加，并且zabbix机制为一个一个指标取的，极其麻烦和低效）2、jvm级别的es、spring、kafka等运行情况不好获取3、取kafka数据时，我们有n多topic对应又有n多groupid来消费，如果要取一遍所有信息，zabbix也是只能一个一个取（当然后边发现有模板的方式也可以

prometheus Grafana exporter grafana 普罗米修斯监控es prometheusflink prometheuskafkaSpark 大数据

prometheus+ Grafana监控全家桶

在调研监控工具，之前一直用的zabbix很平稳（从没出过问题），监控内容大概有系统级别的cpu、内存、硬盘之类的，也有服务的运行情况、elasticsearch、hive、kafka的lag等等，但有几个问题没法解决：1、zabbix没法监控flink（虽然可以通过api调用方式，但flink指标有几百个一个一个加，并且zabbix机制为一个一个指标取的，极其麻烦和低效）2、jvm级别的es、spring、kafka等运行情况不好获取3、取kafka数据时，我们有n多topic对应又有n多groupid来消费，如果要取一遍所有信息，zabbix也是只能一个一个取（当然后边发现有模板的方式也可以

prometheus Grafana exporter grafana 普罗米修斯监控es prometheusflink prometheuskafkaSpark 大数据