草庐IT

浅谈信息系统应急处置能力评估体系构建

王海洋 2023-03-28 原文
 随着银行数字化转型持续推进和互联网技术的迅猛发展,分布式、大数据等互联网架构应用也逐步在我行试点和推广,银行系统物理架构和技术框架日趋复杂,信息系统的高效稳定运行面临更大的挑战。而作为银行科技的立身之本,安全运营更是科技赋能业务、支持业务敏捷发展的基石。信息系统的应急处置能力作为安全运营的核心能力,在面对新形势下的各类变化和风险下,是否具备在短时间内内恢复生产服务,将业务运营的影响降至最低?因此我们需要具备一个“应急能力”视角下的评估体系,直观展现系统应急能力现状,及时发现应急层面存在的不足,在风险到来前排除隐患,防患未然。

一、应急处置能力评估体系建设的目标和意义

     应急处置能力评估体系的目标是通过科学的评价办法,直观、快速地识别出安全运营工作中存在的隐患和不足,使其既符合应急管理的一般原理,又适用于当前IT应急体系的现实特点。实现自我改进,迭代发展,推动和促进安全运营体系的完善。其具体意义体现在:

1.风险识别

定期开展应急能力评估,发掘故障应急的薄弱环节,及时排除生产安全隐患,确保IT应急管理工作的持续性和有效性;

2.指标导向

直观体现应对突发风险时的业务恢复能力,为各领域应急能力是否达标提供衡量依据,引导应急资源的合理分配,提高故障应急的专业化、数字化和智能化水平;

3.闭环赋能

通过对模型的应用和迭代,检验专业评估能力与风险应对能力的匹配度,促进各专业领域完善风险评估细则,支持系统交付标准的完善和非功能需求的提出,推动应急手段向工具化和智能化迈进。

二、G行现有信息系统应急处置体系

1.运维平台支撑

主要包含基础架构、大数据分析、监管防控和统一门户四层。基础架构层主要包含对机房、网络、存储等基础设施相关的操作和应急处置平台,其中机房管理基于基础设施管理系统,网络管理基于域名解析等系统,云管理基于云管平台,存储管理基于分布式数据库管理系统,灾备基于灾备切换管理系统,底层消息基于分布式消息平台。

大数据分析层负责对运维数据的采集采集、处理、分析和应用,为监管防控层的应急处置和管理层应急决策提出数据判断依据,主要包含基于统一AGENT、科技运营数据平台、运维数据分析平台、容量管理等系统。监管防控层负责依据数据分析层的决策对应用系统进行应急处置,主要包含运维管控平台、运维管理平台、运维操作平台和运维安全管理平台。统一门户层负责基于运维处置诉求和场景对运维数据的统一展示,包含基于运维业务视角、运维管理视角、运维操作视角和运维移动端视角的相关运维平台。

2.信息系统支撑

为保障信息系统整体运行稳定,在故障发生时能够快速发现、定位、处置和恢复业务,在上线前会针对以下领域进行专家评估:运维架构设计、互联网安全测试、网络指标、大数据、容器云、灾备应急、信息安全、监控设计、应用容量、应用运维、批量标准、数据备份、数据库设计、中间件配置、系统及相关指标,整体达标后方可安排相关上线操作,从信息系统自身建设层面保障系统的应急处置和快速恢复能力。

3.流程制度支撑

主要为满足业务连续性要求、保障故障发生时应急操作能够快速有效开展的相关流程制度,具体包含了《业务连续性管理政策》、《应急处置管理办法》、《突发重大较大事件应急实施细则》等。

4.人员组织支撑

包含应对信息系统突发状况的应急处置人员、组织人员和决策人员等。其中应急处置人员主要包括采取初始应急操作的各领域一线人员、根据业务影响和初始判断采取进一步应急操作的二线人员和协助二线进行问题快速定位和分析的三线人员,组织人员主要为保障应急处置快速高效合规开展的事件流程管控人员如事件经理等,决策人员为事态发展到一定阶段需要进行授权采取进一步重要操作的相关处室、中心及部分负责人等。

三、应急处置能力评估体系的内容

G行数据中心借鉴互联网运营理念,融合金融IT传统管理要求,结合现阶段安全运营的特点,就应急处置能力分解为:主动发现能力、影响判断能力、故障定位能力、业务恢复能力、数据恢复能力五个专项能力。

每个专项能力是否达标,除了包括是否满足相关能力的要求,还要考虑到熟练度和自动化程度。最终应急能力达标情况,是综合了专项应急能力指标、熟练度指标和自动化程度指标后的综合评估结果。

四、应急处置能力模型适用场景

1.系统体检

作为系统即将面临预知风险时的应急能力“体检报告”,如重大变更、业务营销等重点保障场景等。对于不合格的“体检项”有的放矢的提前进行防控工作的部署;

2.故障复盘

重大事件发生后,故障复盘时的“对照手册”,对故障当时应急能力水平进行系统性的审视,在整改后重新评估,确保系统或故障场景“体检合格”;

3.系统扫雷

作为系统长期运行后,对于应急能力状况摸底调查的 “扫雷目录”,及时发现运行风险,推动优化。

五、应急恢复能力模型案例

 近期,某系统近期有重大变更,系统对系统整体架构进行调整,由于变更可能引发较大风险,因此对该系统进行系统应急能力评估。经评估,各领域细分能力结果、大类应急能力结果及专项能力结果如下:

结论:该系统变更的应急恢复能力综合定级为“中”,熟练度不涉及,自动化应急能力为L2(部分自动化)。建议管理员完善影响判断、配置备份和应急工具自动化程度等相关事项,采取条件通过投产的模式进行系统投产。

六、应急处置能力评估体系的持续完善

     生产安全运营的形势随着内、外部的变化不断变化,因此事件管理本身是一个动态的过程,没有恒定不变的标准,需要不断的动态迭代完善。一方面,专业领域需要成立专家评定小组,定期对评估对象和评估指标进行重审和完善,另一方面流程管理领域需要基于生产系统运行特点和管理导向对每个评估对象的性质、作用和所处的层次调整评估权重。通过不断地迭代发展,达到应急恢复能力模型自我改进,系统风险及时发现排除,推动和促进安全运营体系不断完善。

      未来,金融信息科技将面临更多发展的机遇和挑战。光大银行在持续提升科技服务能力和创新能力的同时,经过多年的实践和积累,在事件管理方面形成了明确的事件管理制度和规范的应急处置流程,应急手段从标准化、自动化大步向数字化和智能化迈进。快速应急能力模型的构建,推动了IT信息管理向精细化方面再进一步。为故障应急,提供了一个更加全面、直观且富有前瞻性的视角。未来光大银行信息科技将继续大力推进服务化、数字化、自动化、智能化“四化”建设,不断完善事件应急管理体系,落实管理要求,加速提升光大银行信息科技的核心竞争力。

有关浅谈信息系统应急处置能力评估体系构建的更多相关文章

  1. ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2

    大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje

  2. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  3. 程序员如何提高代码能力? - 2

    前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源

  4. ruby - 在 Ruby 中构建长字符串的简洁方法 - 2

    在编写Ruby(客户端脚本)时,我看到了三种构建更长字符串的方法,包括行尾,所有这些对我来说“闻起来”有点难看。有没有更干净、更好的方法?变量递增。ifrender_quote?quote="NowthatthereistheTec-9,acrappyspraygunfromSouthMiami."quote+="ThisgunisadvertisedasthemostpopularguninAmericancrime.Doyoubelievethatshit?"quote+="Itactuallysaysthatinthelittlebookthatcomeswithit:themo

  5. 电脑0x0000001A蓝屏错误怎么U盘重装系统教学 - 2

      电脑0x0000001A蓝屏错误怎么U盘重装系统教学分享。有用户电脑开机之后遇到了系统蓝屏的情况。系统蓝屏问题很多时候都是系统bug,只有通过重装系统来进行解决。那么蓝屏问题如何通过U盘重装新系统来解决呢?来看看以下的详细操作方法教学吧。  准备工作:  1、U盘一个(尽量使用8G以上的U盘)。  2、一台正常联网可使用的电脑。  3、ghost或ISO系统镜像文件(Win10系统下载_Win10专业版_windows10正式版下载-系统之家)。  4、在本页面下载U盘启动盘制作工具:系统之家U盘启动工具。  U盘启动盘制作步骤:  注意:制作期间,U盘会被格式化,因此U盘中的重要文件请注

  6. 【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2

    在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList​()Obt

  7. kvm虚拟机安装centos7基于ubuntu20.04系统 - 2

    需求:要创建虚拟机,就需要给他提供一个虚拟的磁盘,我们就在/opt目录下创建一个10G大小的raw格式的虚拟磁盘CentOS-7-x86_64.raw命令格式:qemu-imgcreate-f磁盘格式磁盘名称磁盘大小qemu-imgcreate-f磁盘格式-o?1.创建磁盘qemu-imgcreate-fraw/opt/CentOS-7-x86_64.raw10G执行效果#ls/opt/CentOS-7-x86_64.raw2.安装虚拟机使用virt-install命令,基于我们提供的系统镜像和虚拟磁盘来创建一个虚拟机,另外在创建虚拟机之前,提前打开vnc客户端,在创建虚拟机的时候,通过vnc

  8. ruby - 使用 rbenv 和 ruby​​-build 构建 ruby​​ 失败,出现 undefined symbol : SSLv2_method - 2

    我正在尝试在配备ARMv7处理器的SynologyDS215j上安装ruby​​2.2.4或2.3.0。我用了optware-ng安装gcc、make、openssl、openssl-dev和zlib。我根据README中的说明安装了rbenv(版本1.0.0-19-g29b4da7)和ruby​​-build插件。.这些是随optware-ng安装的软件包及其版本binutils-2.25.1-1gcc-5.3.0-6gconv-modules-2.21-3glibc-opt-2.21-4libc-dev-2.21-1libgmp-6.0.0a-1libmpc-1.0.2-1libm

  9. ruby - 在没有基准或时间的情况下用 Ruby 测量用户时间或系统时间 - 2

    因为我现在正在做一些时间测量,我想知道是否可以在不使用Benchmark类或命令行实用程序time的情况下测量用户时间或系统时间。使用Time类只显示挂钟时间,而不显示系统和用户时间,但是我正在寻找具有相同灵active的解决方案,例如time=TimeUtility.now#somecodeuser,system,real=TimeUtility.now-time原因是我有点不喜欢Benchmark,因为它不能只返回数字(编辑:我错了-它可以。请参阅下面的答案。)。当然,我可以解析输出,但感觉不对。*NIX系统的time实用程序也应该可以解决我的问题,但我想知道是否已经在Ruby中实

  10. ruby - what is - gets is a directory - 错误信息 - 2

    我遇到了这个奇怪的错误.../Users/gideon/Documents/ca_ruby/rubytactoe/lib/player.rb:13:in`gets':Isadirectory-spec(Errno::EISDIR)player_spec.rb:require_relative'../spec_helper'#theuniverseisvastandinfinite...itcontainsagame....butnoplayersdescribe"tictactoegame"docontext"theplayerclass"doit"musthaveahumanplay

随机推荐