通过将大型键值存储从 MySQL 迁移到 NoSQL 数据库，我能否获得显着的性能提升？

发布于 2024-09-13 02:17:53 字数 488 浏览 6 评论 0原文

我正在开发一个包含大量科学数据集的数据库。典型的使用场景是每天会有5GB左右的新数据写入数据库；每天也会删除 5GB。数据库总大小约为 50GB。我运行的服务器将无法将整个数据集存储在内存中。

我已经构建了数据库，使得主数据表只是一个由唯一 ID 和值组成的键/值存储。

查询通常针对大约 100 个连续值，例如。 SELECT Value WHERE ID BETWEEN 7000000 AND 7000100;

我目前正在使用 MySQL / MyISAM，这些查询大约需要 0.1 - 0.3 秒，但最近我开始意识到 MySQL 可能是对于基本上大型键/值存储来说，这不是最佳解决方案。

在我开始做大量安装新软件和重写整个数据库的工作之前，我想大致了解一下使用 NoSQL DB（例如 Tokyo Tyrant、Cassandra、MongoDB）而不是使用 NoSQL DB 时是否会看到性能的显着提升。 MySQL 用于这些类型的检索。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

っ〆星空下的拥抱 2024-09-20 02:17:53

另请考虑 OrientDB。它使用RB+Tree算法的索引。在我的测试中，在笔记本电脑上读取 100GB 数据库的 100 个项目花费了 0.001-0.015 秒，但这取决于键/值在索引内的分布方式。

使用它进行自己的测试应该需要不到 1 小时。

一个坏消息是 OrientDB 尚不支持集群配置（计划于 2010 年 9 月发布）。

回复收藏 0 原文

软甜啾 2024-09-20 02:17:53

我在生产中使用 MongoDB 进行写入密集型操作，其中我的写入和读取操作速度都比您提到的要好，数据库的大小约为 90GB，单个实例 (amazon m1.xlarge) 的速度为 100QPS 我可以告诉你，在150M条目的数据库上，典型的key->value查询大约需要1-15ms，在重负载下查询时间达到30-50ms。
无论如何，200 毫秒对于键/值存储来说太多了。

如果您只使用单个商品服务器，我会建议 mongoDB，因为它非常高效且易于学习
如果您正在寻找分布式解决方案，您可以尝试任何 Dynamo 克隆：
Cassandra (Facebook) 或 Project Volemort (LinkedIn) 是最受欢迎的。
请记住，寻求强一致性会大大减慢这些系统的速度。

回复收藏 0 原文