当前位置：文江博客话题详情

在robots.txt中不允许目录时，我应该使用尾随的斜线吗？

发布于 2025-01-26 03:27:02 字数 187 浏览 2 评论 0原文

我想禁止在robots.txt 中使用目录/acct的爬网我应该使用哪个规则？

disallow：/acct或disallow：/acct/

acct都包含子直销和文件。拖尾的效果是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

谁的年少不轻狂 2025-02-02 03:27:02

由于robots.txt规则都是“开头”规则，因此您提出的两个规则都会禁止以下内容：

https://example.com/acct/
https://example.com/acct/foo
https://example.com/acct/bar

但是，只有以下规则不允许，而无需拖延斜线：

<代码> https://example.com/acct
https://example.com/acct.html
https://example.com/acctbar

<代码>禁止：/acct/通常会更好，因为没有任何不承受意外URL的风险。但是，它不会阻止/acct的爬行。

在大多数情况下，Web服务器重定向目录URL，而无需拖曳斜线以添加后斜线。在您的服务器上，https://example.com/acct重定向到https://example.com/acct/。如果是这种情况，通常可以允许bot爬网/acct而没有拖延斜线并查看重定向是可以的。他们将被阻止爬行重定向的目标。