企业进行数据治理的三个步骤|皕杰官方博客

企业如何进行数据治理，不同的公司会采用不同的方法和路径，各有各的好处。总体而言，以下三个步骤是必不可少的：

第一步对企业数据进行归集和标准化。

信息化领域有一个说法就是“垃圾进，垃圾出”，意指用脏乱的数据做样本，产生的研究成果也是毫无价值的。数据的污染可能发生在数据产生、采集、传输、流转、加工、存储、提取、交换等各个环节，因此要保证数据治理目标的实现，就必须对数据进行全流程的管控，要在数据标准、数据质量、数据文件交换、元数据、数据生命周期、主辅数据源、数据安全、数据责任等方面形成统一的数据治理规范。

第二步就是数据模型管理和标签梳理。

除此之外，数据标签是对数据实体特征的符号表示，每一个数据标签都是我们认识、观察和描述数据实体的一个角度。因此内部统一标签也至关重要。商品标签包含了条码、规格、口味、图片、包装等信息。顾客标签包括性别、年龄、地区、兴趣爱好、产品偏好、购买力、忠诚度等等。

在实际的数据治理中，数据资源目录、数据分类、数据标签是相互配合、相辅相成的。建立良好的数据资源目录的第一步就是明确数据资源的分类，根据数据分类去组织资源、编目，之后是为数据资源打上数据标签，让数据资源更贴近用户、更容易管理，以便充分发挥出数据的价值。

第三步是企业算法和人工智能应用。

在对企业数据进行归集和标准化，并对数据模型进行管控和标签梳理之后，就可以对数据进行管理，并辅之以相应算法和人工智能，在具体业务场景应用举例如下。
以数据模型管理为例：人工智能可以帮助企业实现经验模型与计算机模型的完美融合，构建商品和会员的知识图谱。
以元数据管理为例：人工智能实现对非结构化数据的采集和关键信息的提取，并实现元数据的维护和整理。
再以主数据管理为例：主数据是企业核心业务实体的数据，是在整个价值链上被重复、共享应用与多个业务流程的，并与各个业务部门与各个系统之间共享的基础数据。在复杂数据主数据系统中，机器学习，自然语言处理等人工智能技术可以帮助定义和维护数据匹配规则，以及确定与主数据相关的记录，建立交叉引用等规则。

本文地址：http://blog.bijetsoft.com/gossip/403/
文章标签：数据治理 , 数据质量 , 数据资源
温馨提示：文章内容系作者个人观点，不代表皕杰官方博客对观点赞同或支持。
版权声明：本文为转载文章，来源于知乎，版权归原作者所有，欢迎分享本文，转载请保留出处！

文件下载