编者著:井老板是我11年入行加入百度时的团队大老板,骨灰级老炮,逮着这个机会不容易,把业内常见问题都问了个遍,以飨读者。井老板生性洒脱,嬉笑怒骂皆成文章,道理自在其中。这里是接地气、有高度的《运维百家讲坛》第 1 期,开讲!
嘉宾介绍

井源,左一,前百度运维架构师,前小米运维负责人,前美菜CIO
有些运维人员反映公司对运维的价值所知甚少,您当年是怎么给公司讲清楚运维的价值的呢?
首先需要和公司讲清楚运维的岗位职责(运维是干什么、产出什么)和关键指标(度量产出成果),比如工作围绕稳定、安全、高效等方向展开,开展了哪些运维项目,如何主动推进关键指标的达成。
关键指标,不仅仅包含服务可用性,还有比如服务器资源达标率、服务故障数据(故障分类、故障响应时间、平均故障恢复时间、故障告警覆盖率)、服务安全指标、服务资源到位时长等等。
比如搭建一套完善的监控系统:
监控服务器资源使用率,找出使用率不达标的服务器进行回收或资源重新分配,通过虚拟化、容器化等手段提升资源使用率 梳理告警阈值,规范P0、P1、P2、P3告警级别;监控系统提供告警合并、智能定位建议,提供活跃告警聚合,提供时间纬度的告警分析。方便更快的告警响应和故障定位,提升故障响应时间、故障恢复时间等 服务的告警和预案梳理,缩短平均故障恢复时间,提升故障告警覆盖率
业内有观点认为云和Kubernetes这样的基础设施的崛起会让运维岗位逐渐消亡,您是怎么看待这样的观点呢?
很多年前我们运维团队的口号是NO Ops,博客是noops.me。
很早就说过,运维岗位会逐渐消亡,或者部分工作职责会消亡。拿系统运维来举例,以前管理的团队需要服务器工程师、内核工程师、网络工程师、CDN工程师、机房运维工程师等小20人的团队。后来通过引入公有云,团队只有4个人,云资源管理员1人、CDN调度工程师1人、网络工程师1人、内核工程师1人,他们只需要管理和调度好第三方公司提供的资源和服务即可。
随着K8s和云的普及,以及研发代码工程化的不断成熟,运维在这个过程中的参与度会越来越少。在部署框架成熟的情况下,为了节省运维人力,提升部署效率,二、三级服务的部署已经交给研发自助完成。
随着科技的发展,时代的变化,一个岗位的消亡是很正常的事情,及时做好调整和规划才是思考的重心。
在企业大范围上云的当下大环境里,您觉得运维人员应该做出哪些调整才能更适合当下的人才需求?
在上云的大环境下,运维工程师更应该面向业务、面向架构,拓展自己的业务范围,成为保障业务稳定的关键人才。如果还是和以前一样,仅仅只关注监控报警,只负责服务部署变更,那么势必会被淘汰。
另一方面,可以往专精的方向走,成为某个领域的专家(监控、大数据、K8s、数据库等等),走运维研发专家的方向。
人生的建议,多寻找一些副业,运维工作只是生活的一小部分。
AIOps热炒了几年,但是最近明显声量变小了,您觉得企业现阶段应该落地AIOps么?应该注意哪些问题?
就拿智能监控为例,看到了很多文案说要通过AI预测故障、智能定位。到现在没有看到任何靠谱的案例。在一个服务变更快、依赖关系复杂、故障影响因素多的互联网业务系统中,如果真能通过历史数据,实现故障预测。那还不如去做地震预测,有几千年的地震数据积累,能够产生很大的社会价值。
做AIOps的前提,是真的懂AI,清楚机器学习和神经网络的原理。有多少人工才有多少智能,AIOps才能不是一个口号。
chatGPT这样的AI能力您觉得未来是否有可能解决运维行业的问题?
比如在故障管理中,根据故障的设备、数据、描述,通过知识库、历史故障库等等,给出故障可能的辅助建议(suggestbot)
BTW,如果你已经可以玩转chatGPT了,把这个技术投入到其他更能产生价值的领域吧,别老在运维这个领域耗着……
业务程序的部署,到底应该交给研发来做还是应该交给运维来做,在很多公司争论不休,您是怎么看待这个问题呢?
之前提到过,我们二、三级的服务是完全由研发去做,一级服务是运维和研发轮流去做,主要目的主要是让运维清楚当前服务的变化情况而已。运维人员在公司一开始做部署,更多是规范线上环境,规范服务部署方式,从而更好的研发部署系统,掌控所负责的服务架构。
安全问题、流程问题,完全可以通过部署系统去解决。运维就不要守着这个没任何价值,没任何沉淀的工作不放了。
您最想对(运维)行业说的一句话是?为什么?
“物理学没有不存在,只是我们认为的物理学,可能不存在。” 运维行业可能也不存在了,多少运维人的梦想是AIOps、NOOps,要么自己去干掉这个行业,要么在这个行业被干掉。
工具选型这块,到底是自研,还是使用开源,还是使用商业产品,是如何抉择的?
有能力有时间就使用开源,能力一般时间有限就使用商业产品。有钱有闲还很自负的话,可以尝试下自研。
您所在的公司是否也是多云架构?您觉得多云场景下哪些能力应该依托云厂商哪些能力应该自建?
我们是多云架构。专线或者数据传输的能力,这个需要自建。基于多云之上的公共能力也可以自建,比如监控系统、数据备份系统、部署系统、微服务核心组件等,其他的交给云厂商就好了。
您印象最深的一次故障是什么?对您有何启示?
运维这么多年,遇到的诡异故障太多了,root cause让你根本想象不到。只能说,故障很难避免,只能设法减少故障的频率、影响面和影响时间。
所以你的绩效不是故障次数和故障级别,而是故障影响面、故障响应、恢复时间等。
面对当下快速发展的基础技术,您对给刚入行和入行已久的运维人员,分别有什么职业规划的建议吗?
比较偏激哈~刚入行的,建议尽快转行!入行已久的,转行技术相对困难,已经打上了深深的运维烙印。我见过太多运维人员转行其他技术,多数都是运维研发、运维产品经理的岗位,还是找一下副业吧。
您觉得传统运维和SRE的区别是什么?您的团队做出这样的转型,其背后的思考是?
这都2023年了,聊这个话题就跟互联网运维弄个NOC监控值班一样,开倒车。
如果现在还在考虑要不要转型SRE、怎么转型SRE、SRE的变化这些问题,就跟5g时代,还在考虑用2g,还是3g……都会被时代所淘汰。
是否有种戛然而止的感觉?哈哈,这是《运维百家讲坛》第1期,我们会持续邀请业内大佬前来分享,越是有不同的观点才越有意思,越是能够引发思考,咱们一起,抱着开放的心态,聆听百家之言。下一期,再见!
点向量坐标矩阵的几何意义介绍旋转矩阵的几何含义之前,先介绍一下点向量坐标矩阵的几何含义点:在一维空间下就是一个标量,如同一条直线上,以任意某一个位置为0点,以一定的尺度间隔为1,2,3...,相反方向为-1,-2,-3...;如此就形成了一维坐标系,这时候任何一个点都可以用一个数值表示,如点p1=5,即即从原点出发沿着x轴正方向移动5个尺度;点p2=-3,负方向移动3个尺度; 在一维坐标系上过原点做垂直于一维坐标系的直线,则形成了二维坐标系,此时描述一个点需要两个数值来表示点p3=(3,2),即从原点出发沿着x轴正方向移动3个尺度,在此基础上沿着y轴正方向移动两个尺度的位置就是点p3。
文章目录🔥Linux系统目录结构🔥Linux用户和用户组🔥Linux用户管理🔥Linux系统目录结构文件系统组织结构⭐ /lib系统开机所需要最基本的动态链接共享库,其作用类似于Windows里的DLL文件。几乎所有的应用程序都需要用到这些共享库。⭐ /lost+found一般情况下是空的,当系统非法关机后,这里就存放了一些文件。⭐ /etc所有系统管理所需要的配置文件和子目录my.conf⭐ /usr用户的很多应用程序和文件都放在这个目录下。⭐ /bin是Binary的缩写,这个目录存放着经常使用的命令⭐ /sbin(usr/sbin、/usr/local/sbin)sbin就是peruse
急促的告警铃声响彻寂静的夜晚。对运维人来说,晚间值守耗费更大的精力,往往一个简单的磁盘使用率告警通知,就不得不爬起来进行处理,毕竟告警无小事,对于小问题,运维人也不能心存侥幸心理。虽然有着值班人员和团队的支撑,但频繁的告警还是让运维人员精疲力竭,如何让系统的稳定性提高,减轻一线人员的工作量,减轻一线人员的压力?通过智能运维,实现故障自愈将成为不可避免的选择。故障自愈是提升企业网络系统可用性和降低故障处理的人力投入,实现故障自愈从"人工处理"到"无人值守"的变革。通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形
我想从我的S3容器中读取照片的几何形状。当它在我的本地时,这是有效的:defphoto_geometry(style=:original)@geometry||={}@geometry[style]||=Paperclip::Geometry.from_filephoto.path(style)end但是当我将模型切换到S3时它似乎不起作用。有什么建议吗?更大的故事是,我正在尝试编写一些代码,允许我从S3检索照片,允许用户裁剪它们,然后将它们重新上传回S3,仍然由回形针分配。编辑:这是返回的错误:Paperclip::NotIdentifiedByImageMagickError:ph
作为一个10年老运维,在开始这篇文章之前,先送给大家一句话:干啥不好,非要做运维,听人劝,吃饱饭,趁年轻,换行吧!好了,不开玩笑了,回到正文中来。当谈到运维职业发展情况时,很多人都会说运维做不长久,然后劝人做两年就赶快转研发吧!总之是全面唱衰运维!但作为一个老运维,我想说的是:运维转开发确实是一个不错的选择,但运维做不长久则完全是对运维的偏见了!很多人有运维做不长久的偏见的原因其实和运维职业的特性有关,运维有三个老生常谈的特点:打杂,背锅,睡的少!说运维打杂,是说运维工作比较宽泛,运维职业门槛不高,什么都得会一点。公司里但凡跟计算机有关的事,可能都会找到运维,这就导致了运维工作比较杂!至于背黑
前言大家好,我是互联网老辛,专注云原生领域布道的终身学习者,本文是新班第一课需要准备的工具库,也是大家日后工作必备的武器库,能够提高学习和沟通效率,更好的完成运维工作。🏠个人主页:[互联网老辛](https://zmedu.blog.csdn.net)🧑个人简介:互联网老辛,云原生领域讲师,创业公司负责人😉😉💕座右铭:向内归因,一切问题先从自身找原因🍺🍺🍺💕欢迎大家:这里是CSDN,我总结知识的地方,喜欢的话请三连,有问题请私信😘文章目录前言一.常用工具1.1linux系统篇1.2效率工具包1.3其他辅助工具1.4个人网站类工具二.书籍推荐总结一.常用工具1.1linux系统篇以下分享,部分在
我正在尝试采用任何three.js几何体并将其现有面分割为更小的面。这实质上会给几何图形更高的“分辨率”。three.js的示例中有一个分割修改器工具,它非常适合我正在尝试做的事情,但它最终会改变和变形几何体的原始形状。我想保留原来的形状。ViewtheSubdivisionModifierExample当前分割修饰符的行为示例:我希望它如何表现的粗略示例:分割修饰符是这样应用的:letoriginalGeometry=newTHREE.BoxGeometry(1,1,1);letsubdivisionModifier=newTHREE.SubdivisionModifier(3);l
我有以下在Three.js中绘制菱形的代码:varmaterial=newTHREE.MeshPhongMaterial({color:0x55B663,side:THREE.DoubleSide});vargeometry=newTHREE.Geometry();geometry.vertices.push(newTHREE.Vector3(0,1,0));geometry.vertices.push(newTHREE.Vector3(0,-1,0));geometry.vertices.push(newTHREE.Vector3(-1,0,-1));geometry.vertice
本节主要讲解了如何将二维多边形划分为多个不相交的三角形。一、画廊问题artgalleryproblem 考虑如下场景,在一个尺寸为多边形的画廊中放置摄像头(哨兵),需要放几个才能完全覆盖该场景?可以看到下图至少需要两个哨兵。 如下图,若多边形是凸多边形或星形多边形,那么只须在中间的核位置放一个即可,此情况为该问题的最小解(下界): 若多边形不规则,那么最多n个点,即n多边形的每个顶点都设置一个哨兵,就可以将整个多边形覆盖,因此问题的最大解(上界)为n。 实际上,对于n个顶点的不规则多边形而言,最多只须n/3个点即可覆盖,如下图红点所示:因为场景不同导致
我想使用2个网格创建一棵松树,一个用于树干,另一个用于灌木,这就是我所做的:varpine_geometry=newTHREE.Geometry();varpine_texture_1=THREE.ImageUtils.loadTexture('./res/textures/4.jpg');varpine_geometry_1=newTHREE.CylinderGeometry(25,25,50,6);varpine_material_1=newTHREE.MeshBasicMaterial({map:pine_texture_1});varpine_1=newTHREE.Mesh(p