python、requests get知乎报500

发布于 2022-09-03 13:06:37 字数 232 浏览 10 评论 0

在终端中

import requests as rq
result = rq.get("https://www.zhihu.com")

返回500错误,网页可以正常访问

另外 模拟登陆,返回登陆成功 但rq.get('http://zhihu.com') 也还是会报500。求解

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

困倦 2022-09-10 13:06:37

嘿嘿,因为知乎想防爬虫,而你直接这样去get的话,user agent会是"python...",知乎直接就挡掉了。但这种防爬虫太好破,你只要伪装一把user agent就行:

>>> import requests as rq
>>> result = rq.get("https://www.zhihu.com", headers = { 'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.20 (KHTML, like Gecko) Chrome/11.0.672.2 Safari/534.20' })
>>> result
<Response [200]>

当然了,知乎这样做只是防小白爬虫,他还有各种后招去对付伪装user agent等更高级别的爬虫

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文