robots.txt 和通配符在末尾 od 不允许

发布于 2024-08-06 11:24:40 字数 1459 浏览 5 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

千年*琉璃梦 2024-08-13 11:24:40
User-agent: *
Disallow: /news.php?id=*

User-agent: *
Disallow: /news-all.php

更多信息请点击此处

编辑:

第一条规则将允许带有参数的 news.php,但允许不带 ?id=__ 的 news.php。如果您不想抓取 news.php,则必须使用 /news.php*

User-agent: *
Disallow: /news.php?id=*

User-agent: *
Disallow: /news-all.php

More info here

EDIT:

The first rule will allow news.php with parameters but allow news.php without ?id=__. If you do not want to crawl news.php that you have to use /news.php*

迷雾森÷林ヴ 2024-08-13 11:24:40

robots.txt 中的“允许”和“禁止”行表示“允许(或禁止)以”开头的任何内容。

因此:

Disallow: /news.php

相同

Disallow: /news.php*

,当然前提是读取 robots.txt 的机器人能够理解通配符。如果机器人不理解通配符,那么它会将星号视为实际文件名的一部分。

行尾的星号是多余的,并且有潜在危险。

The Allow and Disallow lines in robots.txt say, "allow (or disallow) anything that starts with".

So:

Disallow: /news.php

is the same as

Disallow: /news.php*

Provided, of course, that the bot reading robots.txt understands wildcards. If the bot doesn't understand wildcards, then it will treat the asterisk as a part of the actual file name.

An asterisk at the end of the line is superfluous, and potentially hazardous.

So要识趣 2024-08-13 11:24:40

肯定

Disallow: /news.php
Disallow: /news-all.php

是正确的。
如果您有完整的文件名,则不需要星号。
不过,这种

Disallow: /news*

方法是否有效对我来说很有趣。

For sure

Disallow: /news.php
Disallow: /news-all.php

is correct.
No stars are needed if you have the full filename.
It is though interesting for me wheather the

Disallow: /news*

approach can work.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文