在 Google 中仍能找到非索引文件 (?)

发布于 2024-09-11 01:56:32 字数 317 浏览 14 评论 0原文

为什么我的页面 /admin/login.asp 在 Google 中通过查询“inurl:admin/login.asp”找到，而没有通过“site:www.domain.xx”查询找到？

我的 robots.txt 中有这行代码：

User-agent: *
Disallow: /admin/

页面的 HTML 代码中有这样的代码：

<meta name="robots" content="noindex, nofollow" />

有什么想法吗？

原文

How is it possible that my page /admin/login.asp is found in Google with the query "inurl:admin/login.asp" while it isn't with the "site:www.domain.xx" query?

I've this line of code in my robots.txt:

User-agent: *
Disallow: /admin/

And this in the HTML code of the page:

<meta name="robots" content="noindex, nofollow" />

Any ideas?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

只有影子陪我不离不弃 2024-09-18 01:56:32

您可以检查 Google 网站管理员 Google 是否正确解释 robots.txt。您还可以请求从那里的索引中删除 URL。

回复收藏 0 原文

月棠 2024-09-18 01:56:32

当您在 Google 搜索结果页 (SERP) 中找到该 URL 时，它的标题是否与您的标签中的标题相同？它还有描述/片段吗？

我认为正在发生的事情是 Google 通过您网站上的链接了解 URL，因此它会尝试对其进行抓取和索引。但是，由于它被 robots.txt 阻止，因此不允许抓取该页面，因此它无法看到登录页面上的 noindex 元标记。

由于 Google 不知道不应为该页面建立索引，因此会将 URL 添加到其索引中。然而，像这样的页面在 SERP 中往往只有标题和 URL，而且几乎总是没有描述/片段。有时，SERP 中的标题看起来像是他们已经抓取了页面，但他们实际上所做的是尝试根据指向它的链接的锚文本生成标题。

让页面不显示在 SERP 中的可靠方法是删除 Disallow: /admin/ 命令，并允许 Googlebot 抓取页面并查看 noindex,nofollow 元标记。

noindex命令将从SERP中删除该页面，nofollow将帮助通知Googlebot不要优先考虑它在您的登录页面上找到的链接（这将有助于保持您的抓取效率，但并不能保证Google不会抓取它在页面上找到的链接）。

回复收藏 0 原文

~没有更多了~

关于作者

薄荷港

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

在 Google 中仍能找到非索引文件 (?)

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

在 Google 中仍能找到非索引文件 (?)

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。