当前位置：文江博客话题详情

规范链接作为对抗爬虫的一种方式？

发布于 2024-08-27 06:27:25 字数 409 浏览 10 评论 0原文

假设有几个外部网站正在抓取/收获您的内容并将其作为自己的内容发布。我们还假设您为每段内容维护一个唯一/永久的 URL，因此内容别名（在您的网站上）永远不会成为问题。

从 SEO 角度来看，包含规范链接无论如何，当您的网站被“抓取”时，规范指示会被注入到窃取您内容的任何网站中（假设他们获取原始 HTML 而不是通过 RSS 等进入）？

我听说过关于跨站点规范链接行为的不同说法，从“它们被忽略”到“行为未定义”到“它不会造成伤害”到“确保这正是规范的目的”。我的印象是，规范是处理站点内别名的好方法，但不一定是处理站点间别名的方法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

岁月蹉跎了容颜 2024-09-03 06:27:25

我无法直接回答你的问题。

您（您公司中的某人）应该联系未经许可联合发布您的内容的各方，并尝试让他们在获得许可的情况下这样做。您应该澄清您对未经授权的联合组织的政策。这当然是一项业务决策，您的业务开发/流程人员和知识产权律师可能必须参与其中。

如果他们坚持继续这样做，而你绝对需要让他们停止，你可以开始向他们的机器人提供垃圾。检测他们的机器人可能并不简单，因为他们可能会伪造一个“真正的”用户代理标头并使用不同的 IP 地址（现在大多数不法分子似乎使用 EC2），但是，如果您成功，那么他们的网站将变得完整垃圾。

一旦他们的网站充满垃圾（或更糟），您就可以再次联系他们，询问他们是否愿意停止他们令人讨厌的行为。

回复收藏 0 原文

~没有更多了~

关于作者

假情假意假温柔

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

规范链接作为对抗爬虫的一种方式？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

规范链接作为对抗爬虫的一种方式？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。