当前位置：文江博客话题详情

限制pycurl中的文本下载内容

发布于 2024-11-16 12:53:04 字数 84 浏览 4 评论 0原文

我想使用 python (pycurl) 中的curl 下载网站内容。但我不希望这些网站的全部文本只是网站的某些部分。我想减少下载全文所花费的时间。谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

诗酒趁年少 2024-11-23 12:53:04

您应该设置相关标题在您的 HTTP 请求中，请参阅此问题了解如何使用 pycurl

注意：此仅在以下情况下有效：

知道数据偏移量（以字节为单位）您想要的数据在结果中的位置
Web 服务器支持此功能

回复收藏 0 原文

〃安静 2024-11-23 12:53:04

一般来说，加载页面的延迟并不在于 HTML 的实际下载——这通常很快，因为 html 无非是 Unicode 文本。除非页面上有大量的实际文本和标记，否则您不会节省太多。此外，为了获取页面的任何实际内容，您无论如何都需要下载整个 ...

就个人而言，我会异步处理此问题。 Twisted 是此类方法最常见的建议之一。

回复收藏 0 原文

~没有更多了~

关于作者

裂开嘴轻声笑有多痛

暂无简介

文章

26 人气

关注发私信

琉璃梦幻

文章 0 评论 0

关注

qq_4zWU6L

文章 0 评论 0

关注

话少情深

文章 0 评论 0

关注

西西弗的石头怪

文章 0 评论 0

关注

彻夜缠绵

文章 0 评论 0

关注

千寻…

文章 0 评论 0

友情链接

文江博客

限制pycurl中的文本下载内容

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

限制pycurl中的文本下载内容

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。