关于构建 Web 分析工具(最好是 Python 友好)的建议 - OLAP/Python

发布于 2024-12-28 17:52:22 字数 395 浏览 2 评论 0原文

我即将开始为电子商务网站开发网络分析工具。

我将记录几个不同的事件,基本上是点击页面和页面视图的各种元素。

这些事件携带元数据(登录用户的用户名、他的国家、他的年龄等),页面本身携带其他元数据(类别、子类别、产品等)。

我的公司想要像 OLAP 多维数据集这样的东西,能够回答这样的问题:

有多少来自国家 x 的客户访问了类别 y? 2012 年 1 月类别 x 的综合浏览量是多少? 有多少来自 x 国家的客户访问了类别 y?

我的理解是,我应该使用OLAP引擎来记录这些事件,然后构建一个报告接口以供我的同事使用。

我说得对吗?您对我应该使用的引擎和前端/报告工具有建议吗?我是一名 Python 程序员,所以任何 Python 友好的东西都会很好。

谢谢你!

I'm about to start the development of a web analytics tool for an e-commerce website.

I'm going to log several different events, basically clicks on various elements of the page and page views.

These events carry metadata (username of the loggedin user, his country, his age, etc...) and the page itself carries other metadata (category, subcategory, product etc...).

My companies would like something like an OLAP cube, to be able to answer questions like:

How many customer from country x visited category y?
How many pageviews for category x in January 2012?
How many customer from country x visited category y?

My understanding is that I should use an OLAP engine to record these events, and then build a reporting interface to allow my colleagues to use it.

Am I right? Do you have advices on the engine and frontend/reporting tool I should use? I'm a Python programmer, so anything Python-friendly would be nice.

Thank you!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

始于初秋 2025-01-04 17:52:22

主要问题是您的立方体有多大以及您是否需要开源 OLAP 解决方案。

如果您正在处理大立方体并希望为未来的功能腾出空间,您可能会选择真正的 OLAP 服务器< /a>.其中一些是开源的 - Mondrian - 其他有“有限”社区版本 - 帕洛icCube。这里重要的一点是与 MDX 和 XMLA 兼容。事实上的 OLAP 标准,因此您可以插入不同的报告工具和/或使用现有的库。据我了解,XMLA 库没有 Phyton 版本,就像 Java 或 .NET 中一样,不确定这是正确的方法。

如果你的立方体很小,你可以自己开发一些东西,或者像 Charlax 的评论所指出的那样寻求其他更快的解决方案。

The main question is how big your cube is going to be and if you need an open source OLAP solution or not.

If you're dealing with big cubes and want to get room for future features you might go for a real OLAP Server. A few are open source - Mondrian - and other have a 'limited' community edition - Palo, icCube. The important point here is being compatible with MDX and XMLA. defacto OLAP standard, so you can plug different reporting tools and/or using existing libraries. My understanding, there is no Phyton version for an XMLA library as in Java or .NET not sure this is the way to go.

If you're cubes are small you can develop something on your own or go for other quicker solutions as the comment of Charlax is indicating.

新一帅帅 2025-01-04 17:52:22

正如所选答案中提到的,这取决于您的数据量。但是,如果您遇到轻量级 Python OLAP 框架就足够的情况,那么您可以尝试 Cubes< /a>,来源位于 github。它包含 SQL 后端(也可以实现任何其他后端)并提供轻量级 HTTP OLAP 服务器。使用它的应用程序示例(带有 HTTP Slicer OLAP 服务器后端的 PHP 前端)可以找到 这里 它不包含可视化层和复杂的查询思想,但这是小规模的权衡。

As mentioned in the selected answer, it depends on your data amount. However, just you run into a case that a light-weight Python OLAP framework would be sufficient, then you might try Cubes, sources are on github. It contains SQL backend (any other might be implemented as well) and provides a light HTTP OLAP server. Example of an application (PHP front-end with HTTP Slicer OLAP server backend) using it can be found here It does not contain visualization layer and complex queries thought, but that is trade-off for being small.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文