当前位置：文江博客话题详情

如何用 .htaccess 替换 robots.txt

发布于 2024-11-18 00:05:53 字数 313 浏览 7 评论 0原文

我有一个小情况，我必须删除我的 robots.txt 文件，因为我不希望机器人爬虫获取链接。

另外我希望用户可以访问它们，并且我不希望它们被搜索引擎缓存。

此外，由于各种原因，我无法添加任何用户身份验证。

所以我正在考虑使用 mod-rewrite 来禁止搜索引擎爬虫抓取它，同时允许所有其他爬虫这样做。

我试图实现的逻辑是编写一个条件来检查传入的用户代理是否是搜索引擎，如果是，则将它们重定向到 401。

唯一的问题是我不知道如何实现它。 :(

有人可以帮我吗。

提前致谢。

问候，

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

開玄 2024-11-25 00:05:53

我可能理解错了，但我认为

User-agent: *
Disallow: /

robots.txt 会做你想做的事 - 不让任何爬虫进入，同时保持网站对普通用户开放。

或者您是否需要专门从网络服务器中删除 robots.txt（出于什么原因？）？

I may be understanding you wrong, but I think

User-agent: *
Disallow: /

in robots.txt will do just what you want - not let any crawler in, while keeping website open for normal users.

Or do you need to specifically remove robots.txt (for what reason?) from the web server?

回复收藏 0 原文

~没有更多了~

关于作者

花辞树

暂无简介

文章

25 人气

关注发私信

我的痛♀有谁懂

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

关注

屌丝范

文章 0 评论 0

关注

lcx_

文章 0 评论 0

关注

予囚

文章 0 评论 0

关注

朦胧时间

文章 0 评论 0

友情链接

文江博客

如何用 .htaccess 替换 robots.txt

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

我的痛♀有谁懂

我是自愿种绣球花的

屌丝范

lcx_

予囚

朦胧时间

友情链接

如何用 .htaccess 替换 robots.txt

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

我的痛♀有谁懂

我是自愿种绣球花的

屌丝范

lcx_

予囚

朦胧时间

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。