当前位置：文江博客话题详情

time-series amazon-simpledb temporal

Amazon SimpleDB 适用于来自数千个独立设备的大型时态数据集

发布于 2024-11-14 09:05:02 字数 1021 浏览 3 评论 0原文

我正在尝试确定 Amazon SimpleDB 是否适合我拥有的数据子集。

我部署了数千个记录数据的自主传感器设备。

每个传感器设备基本上每天每小时四次报告几个值，持续数月甚至数年。我需要保留所有这些数据以进行历史统计分析。一般是写一次，读多次。基于服务器的应用程序定期运行来查询数据以推断其他信息。

今天，SQL 中的数据行看起来像这样：

(id, device_id, utc_timestamp, value1, value2)

我们现有的 MySQL 解决方案不会进一步扩展，具有数千万行。我们查询诸如“告诉我昨天所有 value1 的总和”或“显示过去 8 小时内 value2 的平均值”之类的内容。我们在 SQL 中执行此操作，但可以愉快地更改为在代码中执行此操作。 SimpleDBs 的“最终一致性”似乎很适合我们的目的。

我正在尽我所能地阅读并准备开始尝试我们的 AWS 账户，但是我不清楚各种 SimpleDB 概念（项目、域、属性等）如何与我们的域相关。

SimpleDB 是否是一个合适的工具？通用方法是什么？

PS：我们主要使用Python，但是从高层次考虑这一点时这应该不重要。目前我知道 boto 库。

编辑：

继续搜索此问题的解决方案时，我确实遇到了 Stack Overflow 问题存储时间序列数据的最佳开源解决方案是什么？ 这很有用。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

大海や 2024-11-21 09:05:02

几个月后我就跟进了这个问题……

去年夏天我确实有机会直接与亚马逊讨论这个问题，并最终获得了最终成为 DynamoDB 的测试版程序，但无法谈论它。

我会推荐它用于这种情况，您需要一个主键以及可能被描述为辅助索引/范围的内容 - 例如时间戳。这可以让您对搜索更有信心，即“向我显示周一到周五期间设备 X 的所有数据”。

由于各种原因，我们实际上还没有转向这一点，但仍然计划这样做。

http://aws.amazon.com/dynamodb/

回复收藏 0 原文

花心好男孩 2024-11-21 09:05:02

我认为，只要您的查询非常简单，Amazon SimpleDb 以及 Microsoft Azure Tables 就是一个很好的解决方案。一旦你尝试做一些在关系数据库上绝对不是问题的事情，比如聚合，你就会开始遇到麻烦。因此，如果您要做一些繁重的报告工作，可能会变得混乱。

回复收藏 0 原文

只有影子陪我不离不弃 2024-11-21 09:05:02

听起来您的问题可能最好由循环数据库 (RRD) 处理。 RRD 以这样的方式存储时间变量数据，以便文件大小永远不会超出其初始设置。它对于生成图形和时间序列信息非常酷且非常有用。

回复收藏 0 原文

青瓷清茶倾城歌 2024-11-21 09:05:02

我同意 Oliver Weichhold 的观点，即基于云的数据库解决方案将处理您所描述的用例。您可以将数据分布在多个 SimpleDB 域（例如分区）中，并以大多数查询可以从单个域执行而无需遍历整个数据库的方式存储数据。定义分区策略将是成功转向基于云的数据库的关键。此处讨论了数据集分区

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

隔纱相望

文章 0 评论 0

昵称有卵用

文章 0 评论 0

梨涡

文章 0 评论 0

蓝咒

文章 0 评论 0

白芷

文章 0 评论 0

樱娆

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文