当前位置：文江博客话题详情

requests 知乎 python3.x

python、requests get知乎报500

发布于 2022-09-03 13:06:37 字数 232 浏览 16 评论 0

在终端中

import requests as rq
result = rq.get("https://www.zhihu.com")

返回500错误，网页可以正常访问

另外模拟登陆，返回登陆成功但rq.get('http://zhihu.com') 也还是会报500。求解

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

困倦 2022-09-10 13:06:37

嘿嘿，因为知乎想防爬虫，而你直接这样去get的话，user agent会是"python..."，知乎直接就挡掉了。但这种防爬虫太好破，你只要伪装一把user agent就行：

>>> import requests as rq
>>> result = rq.get("https://www.zhihu.com", headers = { 'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.20 (KHTML, like Gecko) Chrome/11.0.672.2 Safari/534.20' })
>>> result
<Response [200]>

当然了，知乎这样做只是防小白爬虫，他还有各种后招去对付伪装user agent等更高级别的爬虫

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文