当前位置：文江博客话题详情

HttpWebRequest 是否遵守 .Net 中的 robots.txt？

发布于 2024-10-30 02:32:12 字数 197 浏览 0 评论 0原文

我正在为 Web 开发人员创建一个工具，它将“扫描”他们网站上的 HTML。

这需要我的 Asp.Net 应用程序从他们的站点下载页面。

为了防止滥用，我想确保我遵守 robots.txt 等方法。

HttpWebRequest 已经这样做了吗？或者是否有一个开源实现可以用来验证给定用户代理字符串的 robots.txt 文件？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

随波逐流 2024-11-06 02:32:12

HttpWebRequest 仅发出一个 HTTP 请求。它不遵守robots.txt，因为它不知道它的存在。需要另一个请求来查看它是否存在并读取其内容，如果默认情况下这样做，您将有 50% 的开销。

对于 C# 实现，请查看此处：任何人都有 C# 代码来解析 robots.txt 并根据它评估 URL

回复收藏 0 原文

~没有更多了~

关于作者

只有一腔孤勇

暂无简介

0 文章

0 评论

23 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

HttpWebRequest 是否遵守 .Net 中的 robots.txt？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者