当前位置：文江博客话题详情

大容量日志记录并批量保存到数据库？

发布于 2024-11-24 01:10:58 字数 481 浏览 10 评论 0原文

我希望以快速的方式存储有关对我的网站的请求的信息，而不会给我的数据库带来额外的压力。目标是使用此信息来防止滥用并收集有关用户如何与网站交互的信息（ip、GET/POST、url/action、时间戳）。

我目前正在对数据库的每个页面请求保存一个新行。然而，当服务器也已经将相同的信息记录到 nginx 日志文件时，这会通过额外的数据库调用来浪费资源。

我想知道我能做些什么来更好地处理这个问题，我有两个想法我想知道是否有更好的方法。

CRON 作业每天解析访问日志并将其作为批量事务保存到数据库。
RAM缓存（redis/memcached）用于存储有关请求的数据，然后CRON将其保存到数据库。

但是，如果我以可以检索所有记录并将它们插入数据库的方式使用键值缓存，我不确定如何存储数据。

我也不知道如何以不会重新读取条目的方式解析访问日志。

如何有效地记录访问尝试？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

濫情▎り 2024-12-01 01:11:22

如果您使用 MySQL，请使用延迟插入（其他引擎不需要这个）
注意索引会使写入操作变得昂贵
每分钟/小时/天旋转一次表
注意过度规范化和外键

常见的模式是拥有一个简单的表用于纯写入并将日志每分钟/小时移动到一组主表。主集可以高度规范化和索引，以及一个简单的非规范化表（以节省空间）。

另一种模式是拥有一个简单的大表并每分钟/每小时运行一次汇总查询。简单表可以按日期索引（记住使用本机类型）。

最后的提示是，使架构和脚本具有幂等性（如果多次运行，数据仍然有效）。出现故障是很常见的，在特定的分钟/小时/天窗口内简单地重新运行任务可以快速修复所有问题，而不是进行大规模重建。

回复收藏 0 原文

~没有更多了~

关于作者

笑着哭最痛

暂无简介

文章

28 人气

关注发私信

陪我终i

文章 0 评论 0

关注

别忘他

文章 0 评论 0

关注

野心澎湃

文章 0 评论 0

关注

蒲公英的约定

文章 0 评论 0

关注

。

文章 0 评论 0

关注

旧时模样

文章 0 评论 0

友情链接

文江博客

大容量日志记录并批量保存到数据库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

大容量日志记录并批量保存到数据库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。