返回介绍

3.1 简介

发布于 2024-10-03 15:40:36 字数 1645 浏览 0 评论 0 收藏 0

3.1.1 定义

数据仓库 ,英文名称为 Data Warehouse,可简写为 DW 或 DWH。

定义 :数据仓库是面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。

它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于 1990 年提出,主要功能仍是将组织透过资讯系统之 联机事务处理 (OLTP) 经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分析方法如 联机分析处理 (OLAP)、 数据挖掘 (Data Mining) 之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS) 之创建,帮助决策者能快速有效的自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构 商业智能 (BI)。

企业的数据处理大致分为两类

  • 一类是操作型处理,也称为联机事务处理 OLTP,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。

  • 另一类是分析型处理 OLAP,一般针对某些主题的历史数据进行分析,支持管理决策。数据仓库针对的是此类类型。

    image-20191201171523236

图 10 数据仓库价值曲线

3.1.2 数据仓库组成

数据仓库的组成部分包括:数据源、数据准备、数据存储、信息传递、元数据和管理控制部分。

  • 数据源:有四个主要类别分别是生产数据、内部数据、存档数据和外部数据。
  • 数据准备:ETL 过程。
  • 数据存储:一般是多维数据库。
  • 信息传递:提供在线查询和报表。定期邮件报表等等。
  • 元数据:包括三类分别是操作型元数据,抽取和转换元数据、最终用户元数据。
  • 管理控制部分:元数据是管理控制模块的数据来源。

3.1.3 术语

表格 5 DM 常见术语

名词定义
OLTP联线事务处理。针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。
OLAP联线分析处理。一般针对某些主题的历史数据进行分析,支持管理决策。传统数据仓库一般是此类型。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文