Robots.txt 用法

发布于 2024-10-12 02:58:20 字数 1459 浏览 1 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

三生路 2024-10-19 02:58:20

创建包含以下文本的 robots.txt

User-Agent: *
Disallow: /page1.html
Disallow: /page2.html

该文件必须放置在 http://www.site.com/robots.txt

有关更多信息,请参阅维基百科

此外,Google 还有一个 robots.txt 测试器,可以从他们的网站站长工具中获取,它可以让您验证其格式是否正确。

Create a robots.txt containing the following text:

User-Agent: *
Disallow: /page1.html
Disallow: /page2.html

The file must then be placed at http://www.site.com/robots.txt.

For more information, see Wikipedia.

In addition, Google has a robots.txt tester, available from their Webmaster Tools, which lets you verify that it is formatted correctly.

夜访吸血鬼 2024-10-19 02:58:20

robots.txt 必须放置在您网站的根目录中,它将包含:

User-agent: *
Disallow: page1.html
Disallow: page2.html

“User-agent: *”意味着每个 SE 都不会跟踪禁止目录/页面上的链接

编辑:您还应该将此元标记放在您的网站中第 1 页和第 2 页

<meta name="robots" content="NOINDEX, NOFOLLOW"/>

robots.txt must be placed in the root of your website, ad it will contain:

User-agent: *
Disallow: page1.html
Disallow: page2.html

"User-agent: *" means that every SE will not follow links on the disallow dirs / pages

Edit: You should also place this meta tag inside your page1 and page2

<meta name="robots" content="NOINDEX, NOFOLLOW"/>
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文