自学内容网 自学内容网

「数据治理」核心专业术语解释!

​数据治理就是指在一定的组织范围内,依托制度法规、标准规范、应用实践和支撑技术对数据进行全生命周期的数据确权、质量管理、安全控制、隐私保护、开放共享、交易流通和分析处理。数据治理的目标是为了提高数据的可用性、安全性、流通性,激活数据资源的价值,发挥数据资源的经济和社会效益。

“数据治理”核心专业术语名词解释

  • 数据元

定义:是用一组属性描述其定义、标识、表示和允许值的数据单元,数据元是组成实体数据的最小单元,也称原子数据,数据元由对象、特性和表示三部分组成。

作用:作为最小颗粒度的数据,数据元是对数据进行标准化定义的基础,也是构建统一、集成、稳定的行业数据模型的基础。在企业数据治理中,数据元是需要标准化的对象,一个数据元对象有且只有一个数据特性,每个数据特性对应一个数据表示。

  • 元数据

定义:元数据是描述数据的数据或关于数据的结构化数据,是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能,元数据主要有三类:业务元数据、技术元数据、管理元数据。

作用:在数据治理中,元数据是对数据的描述,存储着数据的描述信息,能够让数据更容易理解、查找、管理和使用。

  • 主数据

定义:主数据也称基准数据,是指系统间的核心共享数据,反映核心业务的高价值信息数据。主数据的特点是变化缓慢,在企业内部保持一致。主数据必须存在并加以正确维护,才能保证企业内部系统数据的参照完整性。主数据具有3大特性、4个超越:高价值性、高共享性、相对稳定性;超越业务,超越部门,超越系统,超越技术。

作用:在数据治理中,主数据用来解决企业异构系统之间核心数据不一致、不正确、不完整等问题。主数据是信息系统建设和大数据分析的基础,被认为是企业数字化转型的基石。

  • 业务数据

定义:业务数据是业务活动过程或系统自动产生的既定事实的数据,也称交易数据,例如,业务交易过程中产生的数据,系统产生的数据。

作用:业务数据主要面向应用,为业务应用提供服务,例如生产、销售、采购、设备管理、系统管理等。

  • 主题数据

定义:主题数据是根据数据分析的需要,按照业务主题对数据所做的一种组织和管理方式,其本质是为了进行面向主题的分析或加速主题应用的数据。主题数据是分析型数据,是按照一定的业务主题域组织的,服务于人们在决策时所关心的重点方面。一个主题数据可以由多个主数据和交易数据组成。主题数据一般是汇总的、不可更新的、用于读的数据。

作用:主题数据是按照一定的业务主题域组织的,服务于各种数据分析或应用开发。

  • 数据仓库

定义:数据仓库(Data
Warehouse,DW)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库是数据分析和数据可视化的基础,通过将来自不同业务系统的数据汇集到一起,并按照一定的主题进行编号、归类、分组,方便用户快速定位数据源,为数据分析提供支撑。

作用:数据仓库是为企业所有级别的决策制定过程提供所有类型数据支撑的战略集合,有以下三个主要特征和作用:数据仓库是对企业数据的汇聚和集成、数据仓库支持多维分析、数据仓库是数据挖掘技术的关键和基础。

  • 数据湖

定义:数据湖是一个以原始格式存储数据的存储库或系统。它按原样存储数据,而无须事先对数据进行结构化处理。数据湖可以存储结构化数据(如关系型数据库中的表)、半结构化数据(如CSV、日志、XML、JSON)、非结构化数据(如电子邮件、文档、PDF)和二进制数据(如图形、音频、视频)。

作用:数据湖可以更方便、以更低的成本解决不同数据结构的统一存储问题,同时还能够为机器学习提供全局数据。我们可以将数据湖理解为一个融合了大数据集成、存储、处理、机器学习、数据挖掘的解决方案。

更多“数据治理”专业术语名词解释

  • 数据中台:数据中台是企业级数据能力共享平台,提供企业级数据服务,实现数据共享。数据通过分层与水平解耦,经过汇聚、存储、整合、分析、加工,沉淀公共的数据能力,再经过服务封装,形成通用的调用接口,为前端应用提供数据服务调用,支撑前端应用敏捷迭代和快速构建。数据直接用于业务链路和交易场景,
    服务更多业务。数据中台不是一个标准化的产 品,是一整套策略和解决方案的集合。

  • 数据底座:数据底座是企业统一的数据平台,是数据的逻辑集合,由数据湖和数据主题联接两层构成,集成公司内部各个业务系统数据及外部数据,为业务可视、分析、决策等数据消费提供数据服务。数据底座由数据湖和数据主题联接构成。

  • 湖仓一体:是新出现的一种数据架构,它同时吸收了数据仓库和数据湖的优势,数据分析师和数据科学家可以在同一个数据存储中对数据进行操作,同时它也能为公司进行数据治理带来更多的便利性。就是把面向企业的数据仓库技术与数据湖存储技术相结合,为企业提供一个统一的、可共享的数据底座。

  • 数据标准:数据标准是指企业为保障数据的内外部使用和交换的一致性和准确性而制定的规范性约束。

  • 数据模型:数据模型(Data
    Model)是对现实世界数据特征的抽象,用于描述一组数据的概念和定义。它从抽象层次上描述了系统的静态特征、动态行为和约束条件。数据模型是数据库系统的核心与基础,是描述数据与数据之间联系、数据的语义、数据一致性约束的概念性工具的集合。

  • 数据标签:是对数据实体特征的符号表示,用来描述业务实体特征的数据形式,通过标签对业务实体进行刻画,从多角度反映业务实体的特征。

  • 数据血缘:追踪数据随时间流动的过程,可以清晰地了解数据起源、变化方式以及在数据管道内最终目的地。

  • 数据脱敏:对敏感信息进行处理,使其在保留一定特征的同时,无法识别具体个体,用于非生产环境测试或数据分析。

  • 数据分析:是指利用技术手段,对数据进行分析,发挥数据作用、释放数据价值的过程。

  • 数据挖掘:是数据分析的一种手段,是从大量数据中通过算法搜索隐藏于其中信息的过程。

五度易链-产业大数据服务_产业监测分析_大数据招商_企业服务icon-default.png?t=O83Ahttp://www.wdsk.net/


原文地址:https://blog.csdn.net/wuduyilian/article/details/143749134

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!