前言:作为一名数据服务工作者---资深“乙方”,见过、听过或亲身经历过很多的数据治理相关的项目,如:数据交换共享项目、数据治理项目、主数据项目、元数据项目……,这些项目中,有非常成功的——用的很好,也有差强人意的——勉强在用,还有没上线就下线的——基本没有使用。如果我们Review下这些项目,也许我们不难发现影响数据治理项目成功或失败的因素有很多,这些因素有管理方面的、业务方面的、技术方面的、企业文化方面的等等。
本文首发平台为微信公众号:谈数据。可微信搜索“谈数据”,或扫描下方二维码关注。
在笔者看来,数据治理项目的成功要素可以总结为以下几点:
企业数据战略管理
数据治理架构设计
数据治理的时机与切入点
组织与保障体系建设
技术和工具——工欲善其事必先利其器
建立长效运营机制
接下来的一段时间我会跟大家一起分享数据治理项目的各个成功要素,欢迎关注!
本期分享主题【数据治理的成功要素1:企业数据战略管理】,本文大纲:
一、数据战略是什么?
二、数据战略不是什么?
三、数据战略的四个要素
四、数据战略的三个层次
五、数据战略制定的方法和工具
六、总结
一、数据战略是什么
战略原本是军事领域的专用名词,是指指导全局战争的规划和方略。战略决定了组织的活动方向和内容,解决“干什么”的问题,是根本性的决策。在DAMA-DMBOK中对数据战略是这样定义的:

战略是选择和决策的集合,共同绘制出一个高层次的行动方案,以实现高层次目标。通常,数据战略是一个数据管理计划的战略,是保存和提高数据质量、完整性、安全性和存取的计划。然而,数据战略计划可能还包括利用信息达到竞争优势和支持企业目标的业务计划。数据战略必须来自与对业务战略中的所固有的数据需求的理解,这些数据需求驱动了组织的数据战略。数据战略的组成部分包括:
为数据管理制定激动人心的愿景
数据管理商业案例摘要,附带精选的例子
指导原则、价值观和管理远景。
数据管理的使用和长远目标
数据管理成功的管理措施
短期的(1~2年,具体、可度量、可操作、可实现、有时限的)数据管理方案目标。
说明数据管理的角色和组织级其职责和决策权概述。
数据管理方案的组成部分
数据管理实施路线图
数据管理的项目章程
数据管理的范围说明
简单来说,企业数据战略包括:数据管理的愿景(长期目标)、中期目标、短期目标、实施策略、实施方案、实施路线图等。
二、数据战略不是什么

数据战略是企业愿景吗?
可能是也可能不是,或者说不完全是。我们看下各大公司的企业愿景是什么。
IBM:无论是一小步,还是一大步,都要带动人类进步。
苹果公司:让每人都拥有一台计算机。
阿里巴巴:分享数据的第一平台,幸福指数最高的企业,活“102”年。
腾讯:科技向善。
百度:成为最懂用户,并能帮助人们成长的全球顶级高科技公司。
用友:用技术和创想推动社会和商业进步。
企业愿景是企业利益相关者的本质诉求的整合,是企业战略的最高指引,可以理解为企业的长期战略。在当今席卷全球的颠覆性技术浪潮中,市场变化莫测,相对遥远的长期数据战略,笔者更倾向于哪些有着明确目标、明确范围、明确实施路径,具备可执行、可实现性的短期数据战略。世界变化太快,谁都无法预测10年后的世界是什么样子的,企业数据战略的指定一定要具备应对市场和技术变化的能力。这里申明,笔者并不是反对企业制定长期的数据战略规划,而是要在长期的数据战略之上细化出短期的可执行、可实现、能见效的战略目标,“小步快跑、快速迭代”。数据战略是企业战略的一部分,而企业战略是实现企业愿景的规划和部署。
数据战略是数据架构吗?
显然也不是,至少说不完全是。数据架构是用于定义数据需求,指导对数据资产的整合和控制,是数据投资和业务战略相匹配的一套整体的构件规范。数据架构包括正确的数据定义、有效的数据结构、完整的数据规则、健全的数据文档。数据架构整合了数据、流程、应用、组织、规范和技术,其典型输入包括:企业数据模型、企业价值链分析、数据库架构、商务智能或数据仓库架构、数据集成和整合架构、数据质量管理架构、以及文档和内容管理架构。
数据战略和数据架构不是一回事。定义数据架构的决定,是数据战略的一部分,实施数据架构的决策是战略决策。数据战略会影响到数据架构的设计,反过来,数据架构支持数据战略的实现,并指导其决策。笔者认为:数据架构侧重于技术,是企业数据管理的战术范畴,数据架构对上承接数据战略目标,对下联通数据战略实施计划。数据战略的落地除了需要数据架构的技术支撑,也需要企业数据文化的建设。
既然数据战略既不是看似缥缈的愿景,也是技术相关的架构,结合DAMA-DMBOK给出的数据战略定义,我们尝试总结下企业的数据战略究竟是什么。笔者看来:数据战略就是企业为实现某些业务目标而做出的数据规划和部署,主要包括:数据战略目标、数据战略范围和内容、数据战略实施策略、以及数据战略的实施路径和计划,这也就是我们所说的“战略四要素”。
三、数据战略的四个要素

1、数据战略目标——愿景和目标
愿景是制定企业战略的起点,是企业的长期战略,而目标是企业短期内要达成的明确目标,是企业的短期战略。企业数据战略目标的规划设计不仅要有“诗和远方”的田野,也要考虑生活“眼前的苟且”。正如我们前边提到的阿里巴巴公司,大多数人都知道阿里巴巴是一个电子商务公司,可马云说阿里巴巴是一家大数据公司,其远期的数据战略目标是“分享数据的第一平台、幸福指数最高的企业”。阿里系的产品,如:天猫、淘宝、支付宝……,每时每刻都在生产、汇集、加工着大量的数据,这些数据是具备变现能力的。通过数据的变现和分享,希望阿里成为幸福指数最高的企业指日可待。如果我们把“分享数据的第一平台、幸福指数最高的企业”理解为阿里的远期数据战略的话, 当年阿里如火如荼的研发AliSQL替换Oracle的战略就是那个时期阿里的中期数据战略,这个战略从部署到实施花了10年之久;而当前被炒上天的“数据中台”就是目前阿里的短期数据战略,并且这个战略目前已经实现了。这里只是举例便于理解,也许阿里的数据战略并非如此。关于数据中台的话题,网上有太多的概念了,后边有机会的话可以分享下我对数据中台的理解,这里就略过了。
2、数据战略范围和内容——战略定位
战略定位是回答了“做什么”、“不做什么”的根本问题,企业数据战略定位,就是定义企业的数据管理/数据治理的范围和内容。按照DAMA的给出的数据战略范围主要包括:数据架构、元数据管理、数据标准管理、数据质量管理、主数据和参照数据、数据安全管理等。以上每个部分内容都可各成体系,那对企业来说,数据治理范围和内容该如何选择,却是摆在企业面前不得不回答的问题。这里,笔者建议企业的数据治理定位应充分考虑以下几点因素:企业的痛点需求是什么,希望实现的目标是什么,实施数据治理就能解这些问题吗,数据治理的投资计划(人力和资金),期望的投资回报率。把以上问题问题都想清楚了,你的数据战略定位也就清晰了——或选择全域治理、或选择个别亟待治理的主题。
3、数据战略实施策略——致胜逻辑
致胜逻辑是解决了“怎么做”,“由谁做”,“做的条件”、“成功原因”等问题,是战略的精髓。我们都知道数据治理项目涉及的业务范围广、系统范围大、参与人员多,并且数据治理是一个需要不断迭代、持续优化的过程,不能一蹴而就。那么数据治理项目该从何处入手,谁来主导、谁来配合、怎样才能保证项目的成功实施并能够取得效果?这个问题不好回答。根据笔者这些年见到、听到或亲身经历的数据项目,成功或失败,很大一部分因素是由这个“致胜逻辑”决定的。成功的项目不表,我们看大多数失败的项目都可能会有以下几个特点:目标不明确、范围不清晰、主导人员分量不足、参与人员不够积极、过分迷信技术和工具、过渡依赖外部资源……。做正确的事远比正确的做事更加重要,事前想清楚数据战略的致胜逻辑,要比事后总结教训的成本低很多。数据治理项目的成功一定是将以上因素有机整合,忽视某一因素都可能会影响的数据治理的成效。
4、数据战略的实施路径——行动计划
行动计划是落实战略目标或指导方针而采取的具有“协调性”的计划安排。行动计划解决了“谁”、“在什么时间”、“做什么事”、“达成什么目标”的具体活动计划。行动计划要具备可执行性、能够量化、能够度量,遵循PDCA的闭环管理,定期进行复盘和检讨。前文我们提到:数据治理是一个需要不断迭代、持续优化的过程,不可一蹴而就经验告诉我们:数据治理绝对不是引入先进的技术、牛X的软件就能够解决的。项目建设过程需要企业高层的高度重视并给予足够的资源支持,需要有经验丰富的顾问团队,需要技术部门和业务部门的通力协作,这样提高项目建设的成功率。然而,项目建设阶段的成功并不代表数据治理的成功,建设阶段的成功企业数据治理项目的终点,却是企业数据治理的起点。路漫漫兮其修远,企业数据治理需要的是持续运营,将数据治理形成规则融入企业文化,是企业数据治理的根本之“道”。
四、数据战略目标的三个层次
数据战略的三个境界——此节内容并没有官方定义,单凭个人理解,如有偏颇但求指正。笔者认为企业数据战略大致可以分为:满足基本的管理目标和业务目标、创新与创业、定义在数字化竞争生态中的角色和地位,三个层次。这三个层次并不是不同企业不同的数据管理目标,而是企业数据战略的在不同阶段、不同成熟度条件下的三个具体形态。

1、第一个层次——短期目标
满足基本的管理决策和业务协同。通过解决企业的数据管理中的各类问题,以满足决策分析和业务协同的需要,对于该层次的战略目标,笔者认为是企业最基础的、最迫切需要的、最能击中企业痛点的。随着多年的信息化建设,企业上了多套业务系统,而这些业务系统是由业务部门驱动建设的,缺乏信息化的顶层规划,各系统各自为政、各成体系、信息孤岛……,系统之间的数据不标准、不一致,导致的应用集成困难、数据分析不准确。可以说目前国内绝大部分企业都是处于这个状态,而信息技术的发展速度又太快,已逐步形成了技术倒逼企业数字化的转型的趋势,而高质量的数据资产,无疑是企业数字化转型的基石。
2、第二个层次——中期目标
创新与创业。基于数据实现企业管理的升级和业务的创新,通过数据的利用拓展新业务、构建新业态、探索新模式是笔者认为的企业数据战略的第二个层次,也是企业数据战略的中期目标。数据战略不再是企业战略的支撑,而是引导,或者说是相互作用,这个阶段“IT即业务”!对于传统制造企业利用数据的治理和融合,可以加速管理的创新、产品的创新、销售模式的创新,例如:利用数据治理加强集团管控、基于客户偏好的个性化定制、利用数据的供应链协同和优化、基于市场预测的创新产品设计与快速上市等等。对于服务行业利用大数据的探索服务的新模式,数据可以拓宽服务的视野,实现模式领域的横向拓展、服务精度的纵向延伸,例如:根据消费者需求推出定制化的主题房,酒店新零售的服务模式,都是酒店服务业在业务创新方面上的尝试,大大提升了客户的粘性,提高了酒店的盈利点。这样的案例,在金融服务、餐饮服务、医疗服务、教育服务等服务行业,每天都在上演……。未来的服务业的竞争将更加白热化,而数据资产的利用价值将愈发明显。
3、第三个层次——远景目标
定义在数字化竞争生态中的角色和地位,企业数据战略的最高奥义。用友董事长王文京预言:“未来所有企业都将是数字化企业”,针对这个观点本人深以为然。科技的变革将改变企业的业务形态和竞争模式,未来的数字化竞争中,数字化将是不可忽视的核心因素,企业数据战略的部署和成功实施,将决定您的企业在未来的竞争和数字化生态中,是领导地位、挑战者、特定领域者或是淘汰出局。“什么样的愿景,决定了什么样的未来”,企业数据战略愿景的规划一定要有未来的“诗和远方”。将数据战略愿景融入企业行动方针和核心价值观中,勾勒出企业未来的“图景”。例如,马云描述阿里巴巴的愿景:分享数据的第一平台,幸福指数最高的企业,活“102”年。
五、数据战略制定方法与工具
数据战略的制定以企业战略为基础、以业务价值链为模型、以管理应用为目标,以可执行的活动为步骤,通过系统化的思维,挖掘信息以及信息间的规律,经过科学的规划和设计,形成企业数据化运营的一幅蓝图。对于数据战略规划的方法,目前业界还未形成一套成熟的方法论体系,但是,IT咨询和IT战略规划的方法论已经比较成熟,可用作企业数据战略规划的参考,我们先看下各大知名咨询公司的IT战略规划方法:
埃森哲 IT战略规划方法论

IBM IT战略规划方法论

德勤 IT战略规划方法论

无论哪家方法论,对于IT战略规划本质上都是一样的,基本都包含了三个步骤:
1、调研分析,关键活动有:战略理解、需求分析、现状评估、行业最佳实践对比……
2、远景规划,关键活动有:业务规划、组织架构、技术架构、数据架构、应用架构、IT支撑……
3、实施策略,关键活动有:项目实施、进度和质量管控、效益分析、基础支撑……
以上IT咨询规划方法,同样适用于企业数据战略的规划设计,但在数据战略规划设计时需要重要考虑以下几个核心问题:
企业的业务目标是什么?它们如何与数据需求相关?
企业用来定义数据管理业务目标的核心标准是什么?
为确保数据管理满足业务目标,存在哪些衡量标准或关键绩效指标?
数据管理的组成部分是如何实施和测量有效性的?
如何确定长期和增量结果(阶段性)?
战略规划是一种艺术,极具复杂性,涉及方方面面,对咨询规划人员的复合能力要求比较高。常用的战略规划工具有战略地图、差距分析、SWOT分析、PEST分析、5W1H分析、发展驱动力分析、波特五力分析、BCG矩阵分析、麦肯锡三层面法、价值链分析和基本竞争战略等。工具的使用是帮助企业更好的进行战略分析,为战略蓝图的制定提供抓手。

注:对于战略规划的工具有还有很多,这里就再不一一列举,以后抽时间跟大家分享下,战略规划涉及的各个工具。
拿最常用的5W1H法来说,我们用数据治理规划举例,看下数据战略应回答的问题:

what:做什么。数据治理的内容和范围。
how:怎么做。数据治理实施路径、方法、策略。
who:谁来做。数据治理的责任主体,组织机构、岗位分工。
when:什么时间。数据治理实施计划表。
why:为什么做。数据治理的目标。
where:在哪应用。数据治理的应用场景,例如支持系统应用集成、支持决策分析。
笔者认为数据战略的规划设计中,相对于做什么(what),怎么做(how),谁来做(who),什么时间做(when),应用场景(where),为什么(why)其实是更重要的问题。只有明确了战略的目标,才能指导后续的工作方向,方向如果错了,就会越走越远。
六、总结
数据治理目标必须与数据相关联的业务价值进行衡量。需要企业的业务利益相关者的直接参与创建和验证,需要由管理层定义和批准参与规则和商定的管理框架,以确定如何将数据治理工作落实到位。企业的数据战略目标与企业业务战略目标的一致性,构建在治理过程中形成一种机制,以便随着环境的变化进行持续的战略调整。如阿里巴巴马云所说:“未来,无业务不数据,无数据不智能,无智能不商业”。做好企业数据战略,明确数据治理目标是企业实施数据治理的第一步,也是影响数据治理成败的关键要素。
参考资料:
DAMA-DMBOK2.0
IBM IT咨询方法论
德勤 IT战略规划方法论
埃森哲 IT咨询方法论
关注微信公众号:谈数据,和《一本书讲透数据治理》作者一起在数据治理路上前行!

我正在使用i18n从头开始构建一个多语言网络应用程序,虽然我自己可以处理一大堆yml文件,但我说的语言(非常)有限,最终我想寻求外部帮助帮助。我想知道这里是否有人在使用UI插件/gem(与django上的django-rosetta不同)来处理多个翻译器,其中一些翻译器不愿意或无法处理存储库中的100多个文件,处理语言数据。谢谢&问候,安德拉斯(如果您已经在rubyonrails-talk上遇到了这个问题,我们深表歉意) 最佳答案 有一个rails3branchofthetolkgem在github上。您可以通过在Gemfi
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
我安装了ruby版本管理器,并将RVM安装的ruby实现设置为默认值,这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时,它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径?谢谢! 最佳答案 我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣,可以在这里获取:http://github.com/senny/rvm.el
是否有简单的方法来更改默认ISO格式(yyyy-mm-dd)的ActiveAdmin日期过滤器显示格式? 最佳答案 您可以像这样为日期选择器提供额外的选项,而不是覆盖js:=f.input:my_date,as::datepicker,datepicker_options:{dateFormat:"mm/dd/yy"} 关于ruby-on-rails-事件管理员日期过滤器日期格式自定义,我们在StackOverflow上找到一个类似的问题: https://s
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD
本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01 客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02 数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co