您将如何保护链接数据库不被抓取？

发布于 2024-08-26 07:39:20 字数 447 浏览 7 评论 0原文

我有一个大型链接数据库，这些链接都以特定方式排序并附加到其他信息，这（对某些人）很有价值。

目前我的设置（似乎有效）只是调用一个像 link.php?id=123 这样的 php 文件，它将带有时间戳的请求记录到数据库中。在发出链接之前，它会检查过去 5 分钟内从该 IP 发出的请求数量。如果它大于 x，它会将您重定向到验证码页面。

一切都工作得很好，但该网站已经变得非常受欢迎（并且已经被 DDO 攻击了大约 6 周），所以 php 已经陷入困境，所以我试图尽量减少我必须点击 php 来做的事情某物。我想以纯文本形式显示链接，而不是通过 link.php?id= 并有一个 onclick 函数来简单地将视图计数加 1。我仍在使用 php，但至少如果它滞后，它会在后台执行，并且用户可以立即看到他们请求的链接。

问题是，这使得该网站真正变得可抓取。有什么办法可以防止这种情况发生，但在吐出链接之前仍然不依赖 php 进行检查？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

酷到爆炸 2024-09-02 07:39:20

看来瓶颈是在数据库上。每个请求执行插入（记录请求），然后执行选择（确定过去 5 分钟内来自 IP 的请求数量），然后执行执行应用程序核心功能所需的任何数据库操作。

考虑在服务器内存中维护请求限制数据（IP、请求时间）而不是给数据库增加负担。两种解决方案是 memcache (http://www.php.net/manual/en /book.memcache.php) 和 memcached (http://php. net/manual/en/book.memcached.php）。

正如其他人所指出的，请确保查询的任何键（例如链接 id 等字段）都存在索引。如果索引已到位并且数据库仍然承受负载，请尝试使用 HTTP 加速器，例如 Varnish (http://varnish -cache.org/）。

回复收藏 0 原文