文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
3.1 简介
3.1.1 定义
数据仓库 ,英文名称为 Data Warehouse,可简写为 DW 或 DWH。
定义 :数据仓库是面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。
它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于 1990 年提出,主要功能仍是将组织透过资讯系统之 联机事务处理 (OLTP) 经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分析方法如 联机分析处理 (OLAP)、 数据挖掘 (Data Mining) 之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS) 之创建,帮助决策者能快速有效的自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构 商业智能 (BI)。
企业的数据处理大致分为两类 :
一类是操作型处理,也称为联机事务处理 OLTP,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。
另一类是分析型处理 OLAP,一般针对某些主题的历史数据进行分析,支持管理决策。数据仓库针对的是此类类型。
图 10 数据仓库价值曲线
3.1.2 数据仓库组成
数据仓库的组成部分包括:数据源、数据准备、数据存储、信息传递、元数据和管理控制部分。
- 数据源:有四个主要类别分别是生产数据、内部数据、存档数据和外部数据。
- 数据准备:ETL 过程。
- 数据存储:一般是多维数据库。
- 信息传递:提供在线查询和报表。定期邮件报表等等。
- 元数据:包括三类分别是操作型元数据,抽取和转换元数据、最终用户元数据。
- 管理控制部分:元数据是管理控制模块的数据来源。
3.1.3 术语
表格 5 DM 常见术语
名词 | 定义 |
---|---|
OLTP | 联线事务处理。针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。 |
OLAP | 联线分析处理。一般针对某些主题的历史数据进行分析,支持管理决策。传统数据仓库一般是此类型。 |
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论