Netezza、Teradata、DB2 并行/企业……与 Hadoop 或其他相比？

发布于 2024-08-18 05:58:26 字数 255 浏览 17 评论 0原文

我正在考虑在 Hadoop 等 Map/Reduce 解决方案之上构建一些数据仓库/查询基础设施。

然而，令我震惊的是，所有 M/R 工作都只是重复 RDBMS 人员在过去 20 年中使用并行 SQL 数据库解决的问题。并行 SQL 实现可跨节点扩展读取和写入，就像 M/R 一样，但另外还包含常规数据库（SQL、现有集成库等）的优点。

问题是：您似乎找不到这些公司的客户在网上发布太多信息。那么，这里有人有此类解决方案的经验吗，并且可以给我一些见解和/或链接吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

黑色毁心梦 2024-08-25 05:58:26

我使用过 Netezza 和 Hadoop。并拥有 Infobright（列数据库）的二手知识。

Netezza 是一个真正的数据库并实现了 ACID 属性，这既有成本也有好处。 Netezza 正在努力通过 twinfin 新架构允许更多 M/R 代码在其表数据上运行。在该设备的早期版本中，它们支持用户定义的函数和聚合。在 SPU 上运行 Linux 并使用 Intel 处理器的新版本中，为执行更多接近数据的自定义代码打开了大门。我在 Netezza 的经历非常积极——无论是技术还是公司。

Hadoop 是纯粹的映射缩减计算。它不会产生 ACID 数据库属性的成本。所以，它确实与 Netezza 不同。根据使用模式，它可能比 Netezza 更好，而且肯定更便宜。 Hadoop 支持 Hbase 和 Hive，可以以较低的成本为您提供所需的查询便利。

我们团队的另一位开发人员评估了 Infobright，所以这是二手的，发现加载性能很差，并且某些聚合很慢。它与 Netezza 有一些相似之处（例如，netezza 中使用区域图来帮助缩小扫描范围）。 Infobright 是开源的，有社区版和受支持的企业版。

针对您的特定问题，还有更多内容可以说 - 可能超出了本论坛的范围。希望这有帮助。

回复收藏 0 原文