自学内容网 自学内容网

数据治理(2)-数据标准

前言

在建模前规划制定数据标准,或在建模使用过程中根据业务情况沉淀企业业务的数据标准。通过规范约束标准代码、度量单位、字段标准、命名词典,来保障数据处理的一致性,从源头上保障数据的标准化生产,节约后续数据应用和处理的成本。数据标准包含字段标准标准代码度量单位命名词典


一、字段标准

字段标准是对含义相同但字段名称不同的数据进行统一规范管理的标准。

字段标准包含:

二、标准代码

标准代码是字段标准的取值范围,在标准代码中可设置某一字段标准可选择的数据的内容以及范围。例如性别字段标准的标准代码内容应该为男或女。

三、度量单位

度量单位指字段参数的数量单位(如个、厘米等),系统已为您提供了预置的度量单位,您可根据自定义需求创建新的度量单位。度量单位包括货币单位对象量词比例单位排名单位时间单位等度量类别。

四、命名词典

命名词典提供管理业务名词、物理表、字段的词根和词素等。

五、规则检查器

例如:某公司希望目标数仓分层中的表以dim_开头。当数仓分层中包含命名为dim_sku、dim_store、dimension_warehouse、fact_order的表时,触发检测后,检测结果如下表所示。

表名称

是否符合数仓分层的命名规范

dim_sku

匹配

dim_store

匹配

ension_warehouse

不匹配。名称不符合以dim_开头的规范。

fact_order

不匹配。名称不符合以dim_开头的规范。

总结

创建完成命名词典后,您可以在数仓规划的各层的检查器配置中。数据域、业务过程与业务分类的规划和创建。检查数仓中的表名、字段名等是否符合数仓分层的命名规范。


原文地址:https://blog.csdn.net/u010739163/article/details/143021036

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!