Http协议、Content-Length、获取页面内容Python

发布于 2024-12-04 17:11:15 字数 154 浏览 1 评论 0原文

我正在尝试编写自己的 Python 3 http 库，以了解有关套接字和 Http 协议的更多信息。我的问题是，如果使用我的套接字执行recv(bytesToRead)，我怎样才能只获取标题，然后使用内容长度信息，继续接收页面内容？这不是 Content-Length 标头的目的吗？提前致谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

猫烠⑼条掵仅有一顆心 2024-12-11 17:11:15

在过去，为了完成此任务，我会将套接字数据的一部分读入内存，然后从该缓冲区中读取，直到遇到“\r\n\r\n”序列（您可以使用状态机来执行此操作）或者简单地使用 string.find() 函数。一旦到达该序列，您就知道所有标题都已被读取，并且您可以对标题进行一些解析，然后读取整个内容长度。您可能需要准备阅读。不包含内容长度标头的响应，因为并非所有响应都包含它。

如果您在看到该序列之前耗尽了缓冲区，只需将更多数据从套接字读取到缓冲区中并继续处理（

如果您想查看）。

回复收藏 0 原文

~没有更多了~