当前位置：文江博客话题详情

用于数据分析的 NoSql 或 MySQL

发布于 2024-12-10 03:00:42 字数 474 浏览 0 评论 0原文

我们有一个集群（hadoop、pig），其数据量为 350Gb（每周增加几 GB）。

所有这些数据都需要可供分析使用。

我们有一个具有星型模式的 Msyql 解决方案（仅将部分数据加载到此）。但

令人担忧的是，这一举措能延伸到什么程度？

我应该像 Hive 这样的 NoSQL 来进行数据分析吗？

我读了这篇文章 http://anders.com/cms/282/Distributed .Data/Hadoop/Hbase/Hive

大数据有多大，我什么时候应该放弃 MySQL？ Mysql的结构僵化会带来问题吗？

目前数据只有几GB（在MySQL中），但它肯定会增长。 MySQL集群怎么样？

我应该走这条路吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情释 2024-12-17 03:00:42

350Gb（每周增加几 GB）...所有这些数据都需要可供分析

您内部有 MySQL 专家吗？如果是的话，当然=>只需创建并扩展 MySQL 集群即可。这个解决方案的唯一问题不是它是 MySQL，也不是它不是 NoSQL =>从字面上看，这是因为它需要专家进行设置，并始终在您身边，以防需要更改。但你猜怎么着 =>与 Map/Reduce SQL 模拟相比，SQL 对于分析来说更加更好、更简单。

Oracle 可能会成为 MySQL 解决方案稍后出现的问题。因此，请确保您了解 MySQL 的哪些功能可以免费使用，哪些功能需要付费。

如果您没有内部有MySQL专家，或者您不想付费请一位专家，那么您绝对可以转向NoSQL。但这并不意味着您不需要 NoSQL 产品专业知识，但对于 NoSQL 解决方案来说，将 X 节点配置和运行为单个系统是一个极其简单和自然的过程。

例如，在 Riak 和其他一些 NoSQL 野兽中，大多数分发复杂性都由产品解决，而无需您执行任何操作 =>真的就是这么简单。

使用 NoSQL 所付出的代价是失去 SQL（想想良好的聚合功能）和一致性，这是最终的，如果你严格进行分析，对你来说，一致性可能根本不是代价。

作为回报，您将获得非常自然的大数据处理、容错和还有更多。

如果您在 Hadooooxyz 空间，并且可以付费，请查看 Hadapt，它承诺 5倍 Hive 性能。

回复收藏 0 原文

欢烬 2024-12-17 03:00:42

这个问题当然已经有好几个月了，但是……我最近遇到了 InfiniDB，它将 MySQL 前端放在一个高度可扩展的、基于 MapReduce 的大数据引擎上，专门用于分析。它可能是这个问题的一个解决方案——原则上它应该会出现并且需要很少的管理和很少的代码更改。支持在一台机器上纵向扩展或多台服务器上的扩展...

回复收藏 0 原文