当前位置：文江博客话题详情

IIS logging cube aggregate ssas

使用SSAS分析IIS日志

发布于 2024-10-19 11:14:26 字数 385 浏览 10 评论 0原文

我想聚合我们的 IIS 日志，并能够快速对它们执行简单的查询（例如，过去一个月中页面 x 被点击了多少次等）。

我想聚合这些数据（可能会降低到 10 分钟左右的粒度）在时间维度上）到 SSAS 立方体中。

我们已经通过 SSIS 将日志导入到表中。表变得非常大，我想开始删除较旧的数据（比如 3 个多月前），同时将历史记录保留在多维数据集中（这样我仍然可以查询超过 3 个月的时间）。这是合理的事情吗 - 显然，如果我想更改它，我将无法轻松重建我的多维数据集......而且我想我需要开始备份多维数据集，就好像它是数据库一样？

目前我对数据没有 PK - 添加身份列或创建过时、时间和 url 的复合 PK 会更好吗？

来自成功实施此功能的人的任何反馈都将非常棒:)

谢谢！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

凶凌 2024-10-26 11:14:26

我还没有完全做到这一点，但我会尽可能地给你意见：

表变得很大，为什么这是一个问题 - 是存储空间还是速度？

如果速度快，请考虑使用表分区来拆分大型表。您可以按日期范围对它们进行分区，然后将分区切换到另一个表（减少原始表的大小），这是一个纯粹的元数据操作，并且是即时的。然后，SSAS 可以使用在处理时合并两个表的视图（如果您需要重建的话）。

如果是存储空间，您是否查看过 SQL Server 中的压缩（2008 年可用，不确定您使用的是哪个版本？）。

就我个人而言，如果没有重建多维数据集的能力，我不会感到高兴 - 还要记住，多维数据集会复制源数据（或者更确切地说，它根据 DSV 使用的部分），因此您可能不会像您想象的那样节省那么多如果您删除旧数据&将立方体视为“存储设备”。您的多维数据集仅使用部分表格吗？与基础数据相比，它的大小是多少？

SSAS 并不严格要求对数据进行 PK - 但是 - 我总是使用它们，主要是为了防止重复加载（我也按时间加载 - 检查数据比上次加载的数据更新），但最好有一个 PK 约束来防止重复加载。

对于您的 PK，日期、时间、URL 听起来不错，但取决于您网站的繁忙程度。您的示例不允许两个人在同一秒查看相同的 URL。能否将 IP 地址添加到 PK 中？如果访客刷新得很快怎么办？您能否将其视为重复项，并将其从 SSIS 数据流中删除？

祝你好运，如果您对我所说的内容有任何疑问，请告诉我。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

尘曦

文章 0 评论 0

在梵高的星空下

文章 0 评论 0

善良天后

文章 0 评论 0

韬韬不绝

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

不美如何

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文