一、背景介绍1.1程序员的困扰作为一名IT从业人员,比如开发和运维,多少有过类似的经历:睡觉的时候被电话叫醒,过节的时候在值班,游玩的时候被通知处理故障。作为一名程序员,我们时时刻刻都在想着运用信息技术,为别人解决问题,提升效率,节省成本。随着微服务架构的快速发展,带来一系列复杂的调用链路和海量的数据。对于我们来说,排查问题是一个大挑战,寻找故障原因犹如大海捞针,需要花费大量的时间和精力。1.2现状分析vivo已经建立了一套完整的端到端监控体系,涵盖了基础监控、通用监控、调用链、日志监控、拨测监控等。这些系统每天都会产生海量的数据,如何利用好这些数据,挖掘数据背后的潜在价值,让数据更好的服务于
一、背景介绍1.1程序员的困扰作为一名IT从业人员,比如开发和运维,多少有过类似的经历:睡觉的时候被电话叫醒,过节的时候在值班,游玩的时候被通知处理故障。作为一名程序员,我们时时刻刻都在想着运用信息技术,为别人解决问题,提升效率,节省成本。随着微服务架构的快速发展,带来一系列复杂的调用链路和海量的数据。对于我们来说,排查问题是一个大挑战,寻找故障原因犹如大海捞针,需要花费大量的时间和精力。1.2现状分析vivo已经建立了一套完整的端到端监控体系,涵盖了基础监控、通用监控、调用链、日志监控、拨测监控等。这些系统每天都会产生海量的数据,如何利用好这些数据,挖掘数据背后的潜在价值,让数据更好的服务于
概述最近个人使用的windows电脑,C盘很快爆满,又不知道是哪些文件在占用。网上有很多的文章,有的说需要磁盘清理、碎片整理、有的说是windows更新服务造成的等等。但这些无法从根本上解决问题。今天分享一个小工具--TreeSize,让你轻松定位磁盘空间到底被什么占用了。什么是TreeSize?TreeSize是JAMSoftware的产品,一款用于管理、分析和清理硬盘空间的软件。使用此程序,您可以分析您的硬盘。找出硬盘中有多少百分比的图片,您保存了多少百分比的视频文件,识别最大的文件并在需要时将其删除,所有这些都可以使用各种图表或基于树的图表进行可视化。硬盘空间管理程序通过对磁盘空间的全面
概述最近个人使用的windows电脑,C盘很快爆满,又不知道是哪些文件在占用。网上有很多的文章,有的说需要磁盘清理、碎片整理、有的说是windows更新服务造成的等等。但这些无法从根本上解决问题。今天分享一个小工具--TreeSize,让你轻松定位磁盘空间到底被什么占用了。什么是TreeSize?TreeSize是JAMSoftware的产品,一款用于管理、分析和清理硬盘空间的软件。使用此程序,您可以分析您的硬盘。找出硬盘中有多少百分比的图片,您保存了多少百分比的视频文件,识别最大的文件并在需要时将其删除,所有这些都可以使用各种图表或基于树的图表进行可视化。硬盘空间管理程序通过对磁盘空间的全面
概述前几天分享一款磁盘空间利用率分析工具--TreeSize,但有粉丝说是英文界面,不够直观,问有没有类似的中文版的工具,今天特地分享一款工具WizTree,它应该适合你。什么是WizTreeWizTree是一个非常高速的Windows磁盘空间分析器实用程序。它会扫描您的硬盘驱动器并向您显示哪些文件和文件夹使用的磁盘空间最多。您的整个硬盘驱动器的文件系统以可视方式显示,使查找大文件和文件夹变得非常容易。使用WizTree提供的信息来快速定位和删除硬盘驱动器中的“空间占用”。警告:注意不要删除正确操作PC所需的任何文件!WizTree的特征磁盘空间分析快速识别占用硬盘空间的内容,并可选择删除文件
概述前几天分享一款磁盘空间利用率分析工具--TreeSize,但有粉丝说是英文界面,不够直观,问有没有类似的中文版的工具,今天特地分享一款工具WizTree,它应该适合你。什么是WizTreeWizTree是一个非常高速的Windows磁盘空间分析器实用程序。它会扫描您的硬盘驱动器并向您显示哪些文件和文件夹使用的磁盘空间最多。您的整个硬盘驱动器的文件系统以可视方式显示,使查找大文件和文件夹变得非常容易。使用WizTree提供的信息来快速定位和删除硬盘驱动器中的“空间占用”。警告:注意不要删除正确操作PC所需的任何文件!WizTree的特征磁盘空间分析快速识别占用硬盘空间的内容,并可选择删除文件
快速发现和定位问题的能力是快速恢复系统的基石,只有先做到快速发现和定位问题,才能谈如何解决问题,尽量减少用户损失。那么如何在复杂的大规模场景中,做到真正的先于用户发现和定位问题呢?我会将我们在管理大型 Kubernetes 集群过程中快速发现和定位问题的一些经验和实践带给大家——我们是如何通过自研通用链路探测+定向巡检工具KubeProbe应对遇到的大规模集群的稳定性挑战的。链路探测: 模拟广义用户行为,探测链路和系统是否异常定向检测: 检查集群异常指标,发现未来存在或可能存在的风险点系统增强: 发现问题提速增效,根因分析发现问题之后: 后置检查和自愈,Chat-Ops01 业务背景和挑战
快速发现和定位问题的能力是快速恢复系统的基石,只有先做到快速发现和定位问题,才能谈如何解决问题,尽量减少用户损失。那么如何在复杂的大规模场景中,做到真正的先于用户发现和定位问题呢?我会将我们在管理大型 Kubernetes 集群过程中快速发现和定位问题的一些经验和实践带给大家——我们是如何通过自研通用链路探测+定向巡检工具KubeProbe应对遇到的大规模集群的稳定性挑战的。链路探测: 模拟广义用户行为,探测链路和系统是否异常定向检测: 检查集群异常指标,发现未来存在或可能存在的风险点系统增强: 发现问题提速增效,根因分析发现问题之后: 后置检查和自愈,Chat-Ops01 业务背景和挑战
这一篇着重讲一下如何查找最耗费CPU的查询,然后分析它们的执行计划和相关的索引。以下是一些可以使用的SQL语句:查找最耗费CPU的查询:SELECTq.query_id,q.query_text,q.dbname,q.total_exec_time,q.calls,q.mean_exec_time,q.total_plan_count,q.total_plan_duration,q.total_index_scans,q.total_seq_scans,q.total_lock_time,q.blk_read_time,q.blk_write_time,q.total_blks_hit,q.t
这一篇着重讲一下如何查找最耗费CPU的查询,然后分析它们的执行计划和相关的索引。以下是一些可以使用的SQL语句:查找最耗费CPU的查询:SELECTq.query_id,q.query_text,q.dbname,q.total_exec_time,q.calls,q.mean_exec_time,q.total_plan_count,q.total_plan_duration,q.total_index_scans,q.total_seq_scans,q.total_lock_time,q.blk_read_time,q.blk_write_time,q.total_blks_hit,q.t