几乎实时存储和导出点击流数据的最佳方式是什么

发布于 2024-10-31 08:09:03 字数 224 浏览 0 评论 0原文

假设我有一个点击率很高的网站。我需要将点击数据存储在某个数据库中,以便将其用于报告和监控目的。点击数据将包含诸如谁将用户引荐到该网站、用户来自哪里、他们什么时间来等信息。 有没有一种方法可以存储这些数据,然后以 10 分钟为间隔进行分析,以便您可以了解网站每 10 分钟的运行情况。哪种类型的数据库最适合此目的以及哪种分析工具可以从这些数据中快速生成有意义的信息。我正在考虑的一种分析选择是使用某种形式的映射缩减来对此数据运行查询。

Let us say I have a website which is getting lots of hits. I need to store the click data in some database so that it can be used for reporting and monitoring purposes. The click data will contain information like who is referring the users to this site, where users are coming from, what time do they come etc.
Is there a way to store and then analyze this data in lets say 10 minute intervals so that you can get an overview of how the site is performing every 10 minutes. What type of database will be best suited for this purpose and what kind of analyzing tools can quickly generate meaningful information from this data. One option for analysis I am thinking of is using some variation of map-reduce to run the queries on this data.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

倥絔 2024-11-07 08:09:03

虽然我还没有尝试过 OpenTSDB 看起来很有希望。

引用:

OpenTSDB 是一个分布式、可扩展的
时间序列数据库 (TSDB) 编写于
HBase 的顶部。 OpenTSDB 被写入
解决一个共同的需求:存储、索引
并提供从以下位置收集的指标
计算机系统(网络设备、
操作系统、应用程序)
大规模,并使这些数据变得容易
可访问且可图形化。

Although I haven't tried it yet OpenTSDB looks promising.

Quote:

OpenTSDB is a distributed, scalable
Time Series Database (TSDB) written on
top of HBase. OpenTSDB was written to
address a common need: store, index
and serve metrics collected from
computer systems (network gear,
operating systems, applications) at a
large scale, and make this data easily
accessible and graphable.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文