MSN 机器人向 URL 附加错误参数

发布于 2024-10-04 06:54:52 字数 833 浏览 10 评论 0原文

在我的网站上 http://www.mustseeindia.com/places-around-bangalore" " 是有效的 URL。

在爬网时,MSN 机器人会向其附加一个字符串,从而导致爬网错误。

MSN 机器人附加的字符串 - "&layout=button_count&show_faces=false&width=80;&action=like&font&colorscheme=light&height=25"

生成了错误的 URL通过 MSN 机器人 - http://www.mustseeindia.com/places-around-bangalore&layout=button_count&show_faces=false&width=80;&action=like&font&colorscheme =light&height=25

这导致我网站上的 1000 个页面无法被 MSN 抓取,我该如何处理?

On my site http://www.mustseeindia.com/places-around-bangalore"" is valid URL.

While crawling, MSN bot is appending a string to it and there by causing a crawl error.

String appended by MSN bot - "&layout=button_count&show_faces=false&width=80;&action=like&font&colorscheme=light&height=25"

Wrong URL generated by MSN bot - http://www.mustseeindia.com/places-around-bangalore&layout=button_count&show_faces=false&width=80;&action=like&font&colorscheme=light&height=25

This is preventing 1000's of pages on my site from being crawled by MSN, how can I handle this ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

少钕鈤記 2024-10-11 06:54:52

这是基本的 URL 操作,我在您的网站上没有看到任何棘手的内容(尽管 标记充满错误),所以我怀疑这不是真正的 msnbot,而是一些伪装成 msnbot 的蹩脚垃圾邮件机器人/收割机。

That is basic URL manipulation and I don't see anything tricky on your site (although markup is full of errors), so I suspect that wasn't a real msnbot, but some lame spambot/harvester that cloaked as msnbot.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文