数智化企业如何做好数据治理,管理数据资产?
本次直播我们邀请到具有12年产品经验的@栗子老师,服务过用友、京东、美团、58等多家大型软件及互联网公司。有丰富的ToB、ToISV经验,曾主导过多个从0-1的产品和团队搭建,专注于发掘和解决业务痛点与瓶颈。本文为直播内容整理,内容有删改。
大家好,我是栗子老师,具有12年的产品经验和6年大数据经验,曾先后就职于用友、京东、58等多家大型软件及互联网公司。
本次分享主要分三个部分:第一部分是数据治理体系搭建的起点与价值解析;第二部分是如何预量化处理现有业务数据,实现短期目标提效;第三部分是如何打破数据壁垒,构建常态化运营机制。
分享前有个小思考:本人来北京已有十几年,行囊也从刚毕业时的1个箱子扩大到现在的几个箱子和各种家用电器等,现在有一个目标是找到三年前购买的一条裙子,该怎么做?
首先需要对资产进行摸底,其次是明确目标,然后再基于已有资产进行分类、收纳、整理,最后在对应归类中找到裙子。
一、数据治理体系搭建的起点与价值解析
1. 什么是数据治理? IBM公司认为数据治理是根据企业的数据管控政策,利用组织人员、流程和技术的相互协作,使企业能将“数据作为资产”来管理和应用。
大部分企业都会对自身资产有较明确的管理流程和操作流程,数据治理也是企业进行数据管理的一个环节和手段,总而言之,可以通过数据驱动业务创新,提升管理水平,引领企业转型升级。
即要发挥数据的最大价值,让其对企业达到最大贡献,经过一系列的数据治理、数据分析后产出结果,结果能帮助企业、个人和领导管理层做辅助决策。
案例: 浑水公司在19年左右做空某幸的尽调报告,其在本身的App中找到某幸4409家的门店,最终由于各种原因完成数据分析的门店是981家,浑水公司为阐述的报告更具有真实性,因此拿出数据佐证。
浑水公司在去每一家店踩点时,就已属于数据采集过程;而在过程中会遇到各种情况,比如店铺没有找到或录像中断等,基于这些情况,需要做数据的治理,相当于数据清洗;数据清洗后,整理出来981家门店的数据分析结果,就可以认为是数据导入。
采集、清洗和导入这三步属于数据应用的前置状态,表明该数据相对较可信或属于可以用于应用状态的数据。
2. 什么时候开始数据治理? 第一,当数据环境变得复杂时,首先是不同时期涌现出对数据的不同期许,比如今天某个领导觉得数据湖不错;第二天另一个领导想要搞数据孪生;第三天又有别的领导认为卡夫卡比较适合等,他们都对数据有更高的期许,认为基于现状,数据可以做得更好、带来更多价值;其次是数据的冗余,数据需要跨部门、跨业务的底层数据做打通;最后是数据量激增,设备的重组和增加。
比如随着业务量的增加,企业规模越来越大,部门对数据的需求也会随之增加,但由于各个部门在前期时,可能属于数据自产自用的分散性作业,或在原有基础上嫁接新业务而没有做底层的数据打通等,都会导致数据指标口径不统一,并存在大量的数据冗余。
第二,业务需求,业务对数据的准确性、及时性和即时性提出要求,比如在现实中较常遇到的,当业务暂时无法增长或暂时进入平台期时,业务可能会找诸多借口把责任推到数据上,例如数据不够准确或不够及时等。
第三,公司战略决策,比如领导或公司一把手想做事情,或者是公司需要做战略性转型,要对数据进行整体的治理等。
3. 谁来发起数据治理? 谁都可以发起数据治理,但发起人和其所在部门在企业中的生态位直接决定数据治理项目的目标和成果。比如市场部想发起数据治理,可能只会针对市场这块的内容或这部分数据去发起治理,而发起人不同,对应的目标和涉及范围也会不同,最终的结果也会因中间涉及到的资源不同而各异。
上图是理想状态下的组织建设,虽然现实中很难实现,但需要明白并清晰了解理想状态下的组织建设,并在过程中不断提醒自己、周边和上下游的人,理想状态下组织建设的样子。
二、如何预量化处理现有业务数据,实现短期目标提效?
数据治理的目标主要有三点:运营合规、风险可控和价值创造。
1. 明确治理目标 首先在项目目标中,一是需要掌握项目的主线,比如上文小思考的找裙子,是否能用别的裙子替代,能否接受替代的偏差?二是发起人决定目标的高度,比如由市场部或由CEO发起,获取到的资源是不同的;三是立项通过,内容的目标都是为了立项通过,因为每个公司对立项项目的要求不同,投入产出、所需用到的资源、资源是否有人肯出钱等,都需要根据公司的立项流程去做。
其次是企业中的贡献度,一般贡献度会跟GMV挂钩,能为公司创造更多更大的价值,在公司整体的生态位也会更高,或者是领导或较高层的人员做这件事情,生态位也会更高,职位的不同所带来的的目标范围也不同。
最后是控制目标,如果项目立项成功,一定会有人想要夹带私活,因为正常数据治理的项目至少需要三个月或半年,甚至更久,这时会有人向数据产品经理询问:能否把某东西顺便做出来?这时就需要有取舍,考虑是否能答应,该要求是否在掌控的项目主线内,是否超出预想或超出掌控范围等。
或者在过程中领导突然加需求,这时就需要考虑如何协调,或考虑哪些需求可以被牺牲或暂时不做但可以交代清楚等。
2. 数据治理流程 关键点是选对调研对象,抱紧大腿。数据治理的流程主要分为四步:
第一步,对现有业务进行了解并打探业务走向,首先作为数据产品已经处于整个业务链条较末端的位置,所以需要主动了解现有业务,不能想当然认为1加1等于2,中间可能会有干扰因素等。
其次在对业务了解后,需要打探业务走向,未来这块要怎么做?属于一次性需求、短期需求还是长期需求?如果是一次性需求,就需要评估该需求是否可做,能否赶上时间点等。
最后还需与一线业务人员沟通日常的数据痛点,和数据分析人员沟通数据缺陷,因为作为数据分析人员,可以大概评估出取这一部分的数需要多长时间?需要跑多久等。
第二步,对现有资源摸底,中间会涉及到前端埋点资源和数据存储资源。
前端埋点是指在数据采集过程中,有没有打上点?比如有些较大的平台,会进行全埋点形式,就不会遇到没有埋上点、取不到数的情况;如果是选择性埋点,就要考虑是否有没打到点的地方,或正好借这次机会需要打点的地方。
数据存储资源是比较重要的内容,因为存储资源是需要用钱购买的,而且像阿里或京东等大规模平台,一定需要提前至少三个月去订购存储服务器,所以需要提前预估存储量,并对相关的存储设备有一定的了解,一定需要跟业务部门或出钱的人沟通清楚。
第三步,定制项目框架或里程碑,一般大公司会有专门的项目部门,然后根据不同项目的大小,委派全职或兼职的项目经理,项目经理在期间会不停提醒该段时间该产出什么内容,应该到哪个流程?在过程中需要对所有问题进行盘点,产品经理还需定制目标、治理路线和梳理盘点,并协助项目经理催促上下游业务等。
第四步、预量化,定义/目标实现,是指针对当前问题先进行评估,如果对预估不太清楚,可以咨询数据分析人员,因为相对业务人员,数据分析人员对数据属于较专业人员,可以给出建议。
三、如何打破数据壁垒,构建常态化运营机制? 在接下来的部分,栗子老师用案例详细讲解了 数据治理中的流程 和如何 打破数据壁垒,构建常态化运营机制 的方法。
囿于篇幅有限,想要观看完整视频的朋友可扫描下方二维码添加会员学习顾问@betty老师的微信,并备注“栗子”,即可获得观看链接。
四、六月直播回顾 本次会员直播课程,栗子老师为大家详细讲解了数智化企业如何做好数据治理,管理数据资产?希望大家都能有所收获~
每周三/四晚上8点,起点课堂会员平台都会邀请一线的互联网产品、运营实战派专家,与大家分享最新的产品行业动态、运营玩法和干货知识。
每个月的会员直播都有月度主题,每周直播围绕月度主题展开。六月主题如下:
给作者打赏,鼓励TA抓紧创作!
{{{path> 赞赏