近期数据治理案例合集 | 彭文华

这是彭文华的第129篇原创

    年底的各种分享很热闹,我是很自得其乐的。沉迷于各种切磋交流、学习大佬经验无法自拔。但是也有人抱怨,听这些分享没什么用,都是在**,吹牛而已,光说方法论,细节一点都不讲,下来根本没法执行。这哥们明显是把分享切磋当成师徒传承了。

    我这就把最近的数据治理的分享案例,以及DAMA数据管理知识体系教材拿出来,给大家说明一下两者的区别。文末有下载方式。

近期数据治理合集

    上周末,快手一口气放出了一个数据治理的合集,包含模型规范、成本管理、质量体系、元数据以及OneService的建设,囊括的非常全了。

    同时,DataFun还组织了一个数据治理分会,美团、网易严选和有赞也都各自分享了自身的经验。

    如果你听了各位大佬的分享,的确会有一种“不明觉厉,但是好像又没啥用”的感觉。这非常正常,因为这种分享一般都是把最近半年的研究实践成果浓缩成为40分钟的演讲,压缩比太高了么,必然会丢失非常多的细节。

    而且,分享的目的本来就不是教学,不会给你掰开揉碎了一点点跟你讲,基本都是讲方法论、实践情况,以及部分经验教训啥的。

    所以我们听分享的时候,就是去观摩一下各位大佬的精彩瞬间,类似于看“吐槽大会”,而不是通过看“吐槽大会”学会如何吐槽。

DAMA体系

这是DAMA的数据管理职能全景图。你看其中的核心是战略、组织和角色、政策和标准、项目和服务等跟技术没关系的东西。根据我个人的经验,这些往往才是数据治理的关键所在。

数据治理是三分整治,七分管理,技术最多最多也就占了三分。我们来做一个思想实验:假设你公司中奖了,奖品是一套特别牛的数据治理系统,而且还是按照你们公司的实际情况量身定做的。会发生什么结果呢?

首先,数据团队很可能就会**。因为到处受到约束,以前表随便建,现在不行了,系统里禁止这种行为。

然后业务团队也疯了,以前要数,直接让数据分析师拉数就行了,虽然会有数出多门、指标口径不一致的情况,但是一直都这样,大差不差,也都能忍受。但是现在不行,口径统一是好事,但是也意味着不能随便拿数了,得走一个巨大的流程来评审你提的这个新指标是否与库里重复,有没有价值。

业务不能等,就会找各种借口和漏洞,一方面进行攻击,来确定他们的合理性,另一方面寻找各种绕过的机制,拿到数据继续运营。

做过类似政策推动的人都知道,这些事情的根本压根就不是技术实现,而是组织、认知、共识。这些都没有,强推只会变成一地鸡毛,流程没人走,制度成空文,特例变普遍。

但是这些内容,在上述所有的案例分享中,统统都是一笔带过,甚至压根就没提过。要是按照他们分享的只言片语去蛮干,那得让人笑死。

另外说一句,除了DAMA,中国也有类似的数据治理标准体系,比如全国信息技术标准化技术委员会制定颁发的DCMM,信通院的各种数据治理课题等。多说一句,美团跟信通院走的很近哦。

总结

大会分享不是教程,而是传播、切磋,也是一个吸引人才的好办法。我等数据从业者,不要妄想从大会上学习到细节,而是要参考他人的实践路径,借他山之石,攻我们工作难题之玉,确定个方向而已。放心,我们在前行的道路上遇到的问题一个都不会少的。

另外,大会对于我们还有一个意义,就是建立连接。各种群得加起来,遇到问题也好交流。有些大佬会放自己个人的微信号,也加上,这些是非常精准的内推渠道啊!进大厂就考这招了!


扩展阅读:数据治理案例及标准全集资料已经给你准备好了,后台回复“治理全集”即可下载。

数据治理标准体系及报告

快手数据治理专场:

DataFun数据治理专场:

配合以下文章享受更佳

【附下载】实时数仓架构设计与选型

实战 | 手摸手搭建一个实时数据仓库[坏笑]

干货 | 数仓到底要分多少层?

干货 | 快手数据治理之成本管理

干货 | 快手数据治理之模型规范

热文 | 数据资产化的前提-浅谈数据治理体系的建设

我需要你的转发,爱你哟

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注