当前位置：文江博客话题详情

asp.net database-design olap aggregate

如何处理网络统计模块的大量数据

发布于 2024-07-12 06:12:14 字数 638 浏览 12 评论 0原文

我正在为我的网站开发一个统计模块，它将帮助我衡量转化率和其他有趣的数据。

我使用的机制是 - 每次用户进入我的数据库中的特定区域时，将数据库条目存储在统计表中（我在 cookie 的帮助下避免重复记录）。

例如，我有以下区域：

网站 - 由于我最近不再信任 Google Analytics，因此用于计算唯一用户的常规区域。
类别 - 自我描述。
迷你网站 - 自我描述。
产品图片 - 每当用户看到产品和潜在客户提交表单时。

问题是一个月后，我的统计表中充满了很多行，而我编写的用于解析数据的 ASP.NET 页面加载非常很慢。

我想也许编写一个能够以某种方式解析数据的服务，但我看不到任何方法可以在不失去灵活性的情况下做到这一点。

我的问题：

像 Google Analytics 这样的大规模数据解析应用程序加载数据的速度有多快？
对我来说最好的方法是什么？
也许我的数据库设计是错误的，我应该只将数据存储在一张表中？

感谢任何提供帮助的人，

Eytan。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

粉红×色少女 2024-07-19 06:12:14

您正在寻找的基本方法称为聚合。

您对根据数据计算的某些函数感兴趣，而不是在启动显示网站时“在线”计算数据，而是通过夜间批处理或在写入日志记录时增量地离线计算它们。

一个简单的增强功能是存储每个用户/会话的计数，而不是存储每次点击并对其进行计数。这会将您的分析处理要求减少一个因素（按每个会话的点击次数的顺序）。当然，插入日志条目时会增加处理成本。

另一种聚合称为在线分析处理，它仅沿着数据的某些维度进行聚合，允许用户在浏览模式下聚合其他维度。这需要权衡性能、存储和灵活性。

回复收藏 0 原文

漆黑的白昼 2024-07-19 06:12:14

看来使用两个数据库可以做得很好。一种用于事务数据，它处理所有 INSERT 语句。另一个用于报告并处理您的所有查询请求。

您可以将鼻涕从报告数据库中索引出来，和/或对数据进行非规范化，以便在查询中使用更少的联接。定期将数据从事务数据库导出到报告数据库。此行为将与前面提到的聚合想法一起改善报告响应时间。

回复收藏 0 原文

蓝色星空 2024-07-19 06:12:14

另一个需要知道的技巧是分区。查看在您选择的数据库中如何完成此操作 - 但基本上的想法是，您告诉数据库将表划分为多个子表，每个子表基于某个值具有相同的定义。

就您而言，“范围分区”非常有用——根据值所属的范围选择分区。如果按日期范围进行分区，则可以为每周（或每天或每月 - 取决于您如何使用数据以及数据量）创建单独的子表。

这意味着，如果您在发出查询时指定日期范围，则该范围之外的数据甚至不会被考虑；这可以节省大量时间，甚至比索引更好（索引必须考虑每一行，因此它会随着数据的增长而增长；分区每天一个）。

这使得在线查询（当您点击 ASP 页面时发出）和用于预先计算必要统计数据的聚合查询变得更快。

回复收藏 0 原文

~没有更多了~

关于作者

最舍不得你

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

知足的幸福

文章 0 评论 0

我一向站在原地

文章 0 评论 0

慕烟庭风

文章 0 评论 0

秉忠贞之诚守退让之实

文章 0 评论 0

小兔几

文章 0 评论 0

mb_3y7WUgWY

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文