当前位置：文江博客话题详情

URL 检索服务的最佳实践？如何避免成为攻击媒介？

发布于 2024-07-14 12:32:45 字数 503 浏览 8 评论 0原文

我正在修改一个网络工具，给定一个 URL，该工具将检索文本并向用户提供一些有关内容的统计信息。

我担心为用户提供一种从我的盒子向网络上的任意 URL 发起 GET 请求的方法可能会成为攻击的媒介（例如到 http://undefending.box/broken-sw/admin ？do_something_bad）。

有没有办法尽量减少这种风险？提供公共 URL 检索能力时有哪些最佳实践？

我考虑过的一些想法：

尊重 robots.txt
仅接受或拒绝某些 URL 模式
检查适当网站的黑名单/白名单（如果存在这样的事情）
通过众所周知的第 3 方公共网络代理工作，假设他们已经内置了这些保障措施，

感谢您的帮助。

编辑：它将仅评估 HTML 或文本内容，而不下载或评估链接的脚本、图像等。如果是 HTML，我将使用 HTML 解析器。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

晚风撩人 2024-07-21 12:32:45

统计信息是否仅关于文档中的文本？您打算使用 HTML 解析器来评估它吗？

如果您只是要分析文本，即不下载更多链接、评估脚本等，那么风险就不那么严重。

通过防病毒程序传递您下载的每个文件可能不会有什么坏处。您还应该将 GET 限制为某些内容类型（即不要下载二进制文件；确保它是某种文本编码）。

回复收藏 0 原文

~没有更多了~

关于作者

衣神在巴黎

暂无简介

文章

25 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

URL 检索服务的最佳实践？如何避免成为攻击媒介？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签