请教下百度统计一类分析服务的数据库设计

发布于 2022-08-26 16:13:53 字数 512 浏览 21 评论 0

最近启动了一个新项目,类似于百度统计、友盟一类的数据分析产品。

产品中大量使用count,groupby一类的聚合查询(按日期组织PV,UV,销售额一类的),现在page_visit表数据量过百万后服务器已经稍显吃力,搭档的建议是增加缓存表,就是每天把用户的数据都算一遍,用户查询时直接从缓存表中取数据。但是缓存表带来的额外工作量会比较大,维护成本也高。

所以想请教下百度统计、友盟一类的数据库是如何设计的?

部分表结构 page_visit表: id,storeID,productID,title,ip,country,city,url,referUrl,browser,createTime,os... 每一次访问都会插入一条新的记录。

store表: id,userID,name,email...

product表: id,storeID,title,price,size,color...

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

自此以后,行同陌路 2022-09-02 16:13:53

缓存表,读和写在不同的表上。转存的脚本不难写应该~

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文