PostgreSQL 到数据仓库:近实时 ETL/数据提取的最佳方法
背景: 我有一个针对 OLTP 进行了深度优化的 PostgreSQL (v8.3) 数据库。 我需要在半实时的基础上从中提取数据(有人肯定会问半实时意味着什么,答案…
在数据集市中填充事实表的想法
我正在寻找在数据集市中填充事实表的想法。假设我有以下维度 Physician Patient date geo_location Patient_demography test 我使用了两个 ETL 工具来…
对或错:好的设计要求每个表都有一个主键,如果没有别的,就是一个连续的整数
考虑一个杂货店场景(我正在编造),其中您有代表销售交易的事实记录,其中事实表的列包括 SaleItemFact Table ------------------ CustomerID Produc…
请解释一下 AbInitio 恢复文件(.rec)?我们什么时候应该回滚该文件?
请介绍一下AbInitio恢复文件的概念。 当 Abinitio 图执行失败时,哪些情况下应该回滚恢复文件,哪些情况下不应该回滚恢复文件。 请提供任何 AbInitio…
数据仓库中的 2 个多维数据集可以直接相互比较吗?
有没有办法比较两个 OLAP 多维数据集之间的所有信息(聚合、详细级别)?例如,假设我想将为与 sql server 2000 一起创建的一个多维数据集与同一个多…
用于数据仓库的 SQL Server tempDB 的大小
数据仓库应用程序的 tempDB 是否有预期大小? 10场演出是否过多? 它受到频繁的大型查询的影响。 数据仓库本身有 50 GB。 我正在使用 SQL Server 2000…
Netezza、Teradata、DB2 并行/企业……与 Hadoop 或其他相比?
我正在考虑在 Hadoop 等 Map/Reduce 解决方案之上构建一些数据仓库/查询基础设施。 然而,令我震惊的是,所有 M/R 工作都只是重复 RDBMS 人员在过去 2…