防止 RSS 提要抓取?

发布于 2024-08-04 13:47:14 字数 300 浏览 6 评论 0原文

在 WordPress 网站上,我有一个希望 Google 检测到的普通博客,以及一个用于指向其他网站的传出链接的 RSS 提要。我不需要/希望机器人获取其他 RSS 提要,也不希望人们能够获取该链接供自己使用。

我已成功禁用主博客的 RSS,但不确定如何加密/保护/隐藏此附加提要的 RSS 链接。

我不确定 Facebook 如何在没有 RSS 的情况下运行新闻源,但无论他们如何做,这可能超出了我复制的能力/经验。

如果这些只是传出链接,我认为提要中的版权声明不会有多大作用。也许有一种方法可以通过 RSS 以外的方式自动输出链接?

On a Wordpress site, I have both a normal blog that I want Google to detect and an RSS feed for outgoing links to other sites. I don't need/want bots to get at this other RSS feed nor do I want people to be able to get the link for their own use.

I've disabled RSS for the main blog successfully but am not sure how to encrypt/protect/hide the RSS link for this additional feed.

I'm not sure how Facebook runs a newsfeed without RSS but however they do it is probably beyond my means/experience to replicate.

Where these are just outgoing links, I don't think copyright notices in the feed will do much. Maybe there is a way to output the links automatically through a means other than RSS?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

如果没有你 2024-08-11 13:47:14

使用 Robots.Text www.robotstxt.org 阻止 Google 跟踪该链接。所有有自尊心的机器人都应遵循 robots.txt 文件中的指令。该文件需要放在您的根目录中。

Use Robots.Text www.robotstxt.org to prevent google from following the link. All self respecting robots should follow the directives in the robots.txt file. This file needs to go in the root of your sit.

悲欢浪云 2024-08-11 13:47:14

对此的基本答案是使用一种除使用实际 RSS 之外的方式获取提要条目的方法,例如输出 JSON、通过 API 等。

这将有助于防止抓取,尽管不是完全。

The basic answer to this is to use a method of getting the feed entries in a manner other than using the actual RSS like outputting JSON, going through the API, etc.

It will help prevent scraping though not completely.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文