机器人和 301 重定向

发布于 2024-08-08 20:21:51 字数 147 浏览 8 评论 0原文

我在 6 个多月前更改了网站的 URL 结构。我检测到旧 URL 的使用,并重定向到带有 301 状态代码的新 URL。我使用 flidder 验证了状态代码是否根据请求正确返回。但机器人(yahoo slurps、googlebot 等)仍在访问旧的 URL。我有什么遗漏的吗?

I have changed the structure of the URLs of my site more than 6 months ago. I detect the use of legacy URLs and redirect to the new URL with a 301 status code. I verified with flidder that the status code is correctly returned upon the request. But bots (yahoo slurps, googlebot, etc.) are still hitting the old URLs. Is there something I am missing?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

娇女薄笑 2024-08-15 20:21:51

不,只是爬虫需要非常非常长的时间才能获取消息。我的机器人正在抓取自 2005 年以来就不存在的地址——当人们喋喋不休地谈论地址是永久的时,它们确实是永久的。

此外,根据 URL 的结构,您可以使用 robots.txt 禁止旧地址

No, just it takes a very, very long time for crawlers to get the message. I have bots crawling addresses that have not existed since 2005 - when folk harp on with addresses being permanent, they really are.

Additionally, depending on how your URL's are structured, you can disallow the old addresses with robots.txt

后来的我们 2024-08-15 20:21:51

试试这个,这只会重定向到机器人。

if (preg_match("#(google|slurp@inktomi|yahoo! slurp|msnbot)#si", $_SERVER['HTTP_USER_AGENT'])) {
    header("HTTP/1.1 301 Moved Permanently");
    header("Location: http://www.your-main-site.com/");
    exit;
}

Try this and this will only redirect to the bots.

if (preg_match("#(google|slurp@inktomi|yahoo! slurp|msnbot)#si", $_SERVER['HTTP_USER_AGENT'])) {
    header("HTTP/1.1 301 Moved Permanently");
    header("Location: http://www.your-main-site.com/");
    exit;
}
几度春秋 2024-08-15 20:21:51

如果外部网站已链接到您的旧页面,并且机器人仍然可以访问这些链接,则机器人将不断出现并尝试访问内容。

If external sites have linked to your old pages and those links are still accessible for bots, the bots will keep coming and try to access the content.

哑剧 2024-08-15 20:21:51

此处提到您的网站地址:

http://www.your-main-site.com/

我们用它来转移域名,有时也用于黑帽 seo。

mentioned you site address here:

http://www.your-main-site.com/

Thats we use to transfer the domain and sometime for blackhat seo.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文