在Python中伪造一个cookie来抓取网站
我尝试抓取的网站使用 js 创建 cookie。 我的想法是,我可以在 python 中创建一个 cookie,然后使用该 cookie 来抓取网站。 但是,我不知道有什么方法可以做到这一点。 有人有什么想法吗?
The site that I'm trying to scrape uses js to create a cookie. What I was thinking was that I can create a cookie in python and then use that cookie to scrape the site. However, I don't know any way of doing that. Does anybody have any ideas?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
有关添加 cookie 的示例,请参阅 Python httplib2 - 处理 HTTP 表单帖子中的 Cookie到一个请求。
Please see Python httplib2 - Handling Cookies in HTTP Form Posts for an example of adding a cookie to a request.
如果您想做更多涉及的浏览器模拟(包括设置 cookie),请查看 mechanize。 它的模拟功能几乎是完整的(遗憾的是没有 Javascript 支持):我已经用它构建了几个抓取工具,并取得了很大的成功。
If you want to do more involved browser emulation (including setting cookies) take a look at mechanize. It's simulation capabilities are almost complete (no Javascript support unfortunately): I've used it to build several scrapers with much success.