企业进行数据治理的三个步骤

2021/05/07 15:01 · 闲言碎语 · 2,542 次阅读 · 

企业如何进行数据治理,不同的公司会采用不同的方法和路径,各有各的好处。总体而言,以下三个步骤是必不可少的:

  • 第一步对企业数据进行归集和标准化。

信息化领域有一个说法就是“垃圾进,垃圾出”,意指用脏乱的数据做样本,产生的研究成果也是毫无价值的。数据的污染可能发生在数据产生、采集、传输、流转、加工、存储、提取、交换等各个环节,因此要保证数据治理目标的实现,就必须对数据进行全流程的管控,要在数据标准、数据质量、数据文件交换、元数据、数据生命周期、主辅数据源、数据安全、数据责任等方面形成统一的数据治理规范。

  • 第二步就是数据模型管理和标签梳理。

除此之外,数据标签是对数据实体特征的符号表示,每一个数据标签都是我们认识、观察和描述数据实体的一个角度。因此内部统一标签也至关重要。商品标签包含了条码、规格、口味、图片、包装等信息。顾客标签包括性别、年龄、地区、兴趣爱好、产品偏好、购买力、忠诚度等等。

在实际的数据治理中,数据资源目录、数据分类、数据标签是相互配合、相辅相成的。建立良好的数据资源目录的第一步就是明确数据资源的分类,根据数据分类去组织资源、编目,之后是为数据资源打上数据标签,让数据资源更贴近用户、更容易管理,以便充分发挥出数据的价值。

  • 第三步是企业算法和人工智能应用。

在对企业数据进行归集和标准化,并对数据模型进行管控和标签梳理之后,就可以对数据进行管理,并辅之以相应算法和人工智能,在具体业务场景应用举例如下。
以数据模型管理为例:人工智能可以帮助企业实现经验模型与计算机模型的完美融合,构建商品和会员的知识图谱。
以元数据管理为例:人工智能实现对非结构化数据的采集和关键信息的提取,并实现元数据的维护和整理。
再以主数据管理为例:主数据是企业核心业务实体的数据,是在整个价值链上被重复、共享应用与多个业务流程的,并与各个业务部门与各个系统之间共享的基础数据。在复杂数据主数据系统中,机器学习,自然语言处理等人工智能技术可以帮助定义和维护数据匹配规则,以及确定与主数据相关的记录,建立交叉引用等规则。

本文地址:http://blog.bijetsoft.com/gossip/403/
文章标签: ,   ,  
温馨提示:文章内容系作者个人观点,不代表皕杰官方博客对观点赞同或支持。
版权声明:本文为转载文章,来源于 知乎 ,版权归原作者所有,欢迎分享本文,转载请保留出处!

文件下载

产品好,技术强,服务优,皕杰是您可信赖的合作伙伴

上一篇:
下一篇: