从大型应用程序收集分析的策略

发布于 2024-08-11 20:34:52 字数 487 浏览 10 评论 0原文

Superfeedr 是一种提要解析按需服务。我们希望为用户提供分析，并且正在研究实现这一目标的最佳策略。

简而言之，我们希望跟踪系统中的操作数量（事件，例如：给定提要中的新条目）以及聚合数据（提要的订阅者数量）。

当然，可以根据事件“计算”聚合数据。（订阅源的订阅者数量等于订阅的总和减去取消订阅的总和）。然而，由于我们想要研究随着时间的推移（每天的订阅者数量），事件方法可能不是最优的，因为我们会一遍又一遍地重新计算相同的事情。

如何在您的应用程序中构建这样一个组件？什么信息流？什么数据存储？什么绘图解决方案？等等...

我知道这是一个相当悬而未决的问题，但我确信我们不是第一个有这种需求的人！

[更新]：基础设施：我们有一组工作人员，它们是 XMPP 客户端，并且一起交互。它们基于 EventMachine，这意味着它们不会阻塞 IO。期望的目标：我们必须能够收集大量数据。目前，我们已经达到约 200-300 条消息/秒，我们的目标是 10 倍至 100 倍。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冷︶言冷语的世界 2024-08-18 20:34:52

如果没有有关您的基础设施和所需扩展目标的更多信息，很难说。您可能会发现此幻灯片有关 Twitter 如何使用 Hadoop< /a> 具有指导意义。它由 Kevin Weil 在最近的 NoSQL East 会议。

借鉴 Twitter 正在做的事情的想法，您可以考虑将架构分为收集、分析和渲染阶段。

收集阶段：超低延迟。非常具有可扩展性。很多装订选择。在 facebook 开发。

处理节点日志事件-> 抄写员-> HDFS

分析阶段：类似 SQL 的查询语言，允许您执行探索性的即席查询。

HDFS -> 猪 -> MySQL

渲染阶段：在您当前的 Web 框架中实现

MySQL-> JSON->内存缓存 ->闪存图表

这里有一些关于 SO 的帖子，涉及为网络选择 Flash 图表组件。我个人在 AmCharts 方面取得了巨大成功。

回复收藏 0 原文

~没有更多了~

关于作者

陪你搞怪i

暂无简介

文章

24 人气

关注发私信

友情链接

文江博客

从大型应用程序收集分析的策略

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

一桥轻雨一伞开

冷血

隔岸观火

昔梦

最终幸福

世界等同你

友情链接

从大型应用程序收集分析的策略

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

一桥轻雨一伞开

冷血

隔岸观火

昔梦

最终幸福

世界等同你

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。