MongoDB-mongodb 大数据统计
请问各位有没有做过基于mongodb保存原始数据的大数据统计,4KW条记录应该算大数据了吧?
谈谈你们统计的思路,学习一下,谢谢各位了!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
请问各位有没有做过基于mongodb保存原始数据的大数据统计,4KW条记录应该算大数据了吧?
谈谈你们统计的思路,学习一下,谢谢各位了!
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
1、mongodb数据库的搭建,按照存储的数据大小和增量设置数据的配置:分配空间的大小、分片等
2、源数据的存储按照类型、统计的指标将源数据存储到不同的db或者collection,方便后续分析可以采用多线程进行读取统计
3、读取源数据,初步的拆分,先统计一些整体指标,例如pv,这个步骤会产生一些中间数据,例如独立ip、用户等,这部分数据需要设计好索引,方便下一步的查询统计,此步骤可以和2步骤合并
4、分析中间数据和详细的其他指标等
5、删除中间数据以便节省空间,所以中间数据的存储数据的存储要最好放到一个db中,分析结束后直接删除db是最快的