几乎实时存储和导出点击流数据的最佳方式是什么
假设我有一个点击率很高的网站。我需要将点击数据存储在某个数据库中,以便将其用于报告和监控目的。点击数据将包含诸如谁将用户引荐到该网站、用户来自哪里、他们什么时间来等信息。 有没有一种方法可以存储这些数据,然后以 10 分钟为间隔进行分析,以便您可以了解网站每 10 分钟的运行情况。哪种类型的数据库最适合此目的以及哪种分析工具可以从这些数据中快速生成有意义的信息。我正在考虑的一种分析选择是使用某种形式的映射缩减来对此数据运行查询。
Let us say I have a website which is getting lots of hits. I need to store the click data in some database so that it can be used for reporting and monitoring purposes. The click data will contain information like who is referring the users to this site, where users are coming from, what time do they come etc.
Is there a way to store and then analyze this data in lets say 10 minute intervals so that you can get an overview of how the site is performing every 10 minutes. What type of database will be best suited for this purpose and what kind of analyzing tools can quickly generate meaningful information from this data. One option for analysis I am thinking of is using some variation of map-reduce to run the queries on this data.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
虽然我还没有尝试过 OpenTSDB 看起来很有希望。
引用:
Although I haven't tried it yet OpenTSDB looks promising.
Quote: