在Python中伪造一个cookie来抓取网站

发布于 2024-07-27 21:06:17 字数 116 浏览 9 评论 0原文

我尝试抓取的网站使用 js 创建 cookie。 我的想法是,我可以在 python 中创建一个 cookie,然后使用该 cookie 来抓取网站。 但是,我不知道有什么方法可以做到这一点。 有人有什么想法吗?

The site that I'm trying to scrape uses js to create a cookie. What I was thinking was that I can create a cookie in python and then use that cookie to scrape the site. However, I don't know any way of doing that. Does anybody have any ideas?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

对风讲故事 2024-08-03 21:06:17

有关添加 cookie 的示例,请参阅 Python httplib2 - 处理 HTTP 表单帖子中的 Cookie到一个请求。

我经常需要在网络中自动执行任务
基于应用程序。 我喜欢这样做
在协议级别通过模拟
真实用户通过 HTTP 进行交互。
Python 带有两个内置模块
为此: urllib (更高级别的 Web
接口)和httplib(较低级别
HTTP 接口)。

Please see Python httplib2 - Handling Cookies in HTTP Form Posts for an example of adding a cookie to a request.

I often need to automate tasks in web
based applications. I like to do this
at the protocol level by simulating a
real user's interactions via HTTP.
Python comes with two built-in modules
for this: urllib (higher level Web
interface) and httplib (lower level
HTTP interface).

我的黑色迷你裙 2024-08-03 21:06:17

如果您想做更多涉及的浏览器模拟(包括设置 cookie),请查看 mechanize。 它的模拟功能几乎是完整的(遗憾的是没有 Javascript 支持):我已经用它构建了几个抓取工具,并取得了很大的成功。

If you want to do more involved browser emulation (including setting cookies) take a look at mechanize. It's simulation capabilities are almost complete (no Javascript support unfortunately): I've used it to build several scrapers with much success.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文