requests如何在不下载响应体的情况下重用连接?

发布于 2022-09-04 05:42:04 字数 960 浏览 14 评论 0

实际需求场景是想让爬虫只通过检验http的返回码,以此校验之前下载的某个资源是否还在线;因为并不需要下载响应体,所以使用了requests的Session对象并在动词方法中添加了stream = True的参数,如下:

    s = requests.Session()
    s.mount('http://', requests.adapters.HTTPAdapter(pool_connections=1, pool_maxsize=1))
    for i in range(20):
        url = "http://www.site.com/resources/%s" % i
        with closing(s.get(url, allow_redirects = False, stream = True)) as r:
            print r.status_code

因为启用了stream = True模式,未下载响应体的情况下,连接不会关闭,肯定是无法重用连接池中的连接了,可是强制关闭连接的话,日志输出是这样:

INFO - connectionpool.py[249] - Resetting dropped connection: www.site.com

感觉这个“Resetting dropped connection”跟文档里写的不太一致呢? requests的文档中写道:

如果你在请求中把 stream 设为 True,Requests 无法将连接释放回连接池,除非你 消耗了所有的数据,或者调用了 Response.close。

文档说关闭响应后Requests应该被“释放回连接池”,但实际上它是被关闭然后再需要时被“重新设置”了,跟不加stream = True参数时,“无缝”重用似乎是不一样的。

那么究竟该怎么做才能做到既不下载相应体,又能重用连接呢?还有关闭请求、关闭连接应该是一回事吧?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

没有你我更好 2022-09-11 05:42:05

没太看懂问题,但是根据需求,可以看下HTTP 协议的 HEAD 方法

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文