当前位置：文江博客话题详情

如何在 Django 中处理网络爬虫？

发布于 2024-10-08 06:19:14 字数 111 浏览 4 评论 0原文

由于网络爬虫在没有任何请求数据的情况下访问了我网站的某些部分，我的电子邮件中收到了很多错误，我想知道在 Django 中处理网络爬虫的最佳方法是什么？当我遇到空的 QueryDict 时，我应该发出重定向吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

对风讲故事 2024-10-15 06:19:14

您可以考虑实施 robots.txt 来禁止抓取工具访问您网站上的目标区域仅限于人类，例如形式。

回复收藏 0 原文

神经大条 2024-10-15 06:19:14

我认为您的视图应该适用于任何请求，在列表返回页面上显示消息“错误的请求”。 500 太丑了您确定用户不会在没有任何请求数据的情况下打开页面吗？ QueryDict 的“get”方法可以帮助设置默认值。

回复收藏 0 原文

北恋 2024-10-15 06:19:14

行为良好的爬虫应该只执行 GET 请求。表单不应该是 GET 请求。

Ruby 和 Rails 使用 CRUD 映射

Create -> POST,
READ -> GET, 
Update -> PUT, 
Delete -> DELETE

只有没有附加信息的东西才应该是 GET 请求。

Well behaved crawlers should only do GET requests. Forms should be anything but GET requests.

Ruby and Rails uses CRUD mapping

Create -> POST,
READ -> GET, 
Update -> PUT, 
Delete -> DELETE

Only things without additional info should be GET requests.

回复收藏 0 原文

~没有更多了~

关于作者

臻嫒无言

暂无简介

0 文章

0 评论

608 人气

关注发私信

友情链接

文江博客

如何在 Django 中处理网络爬虫？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如何在 Django 中处理网络爬虫？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。