网络文档的复杂检索

发布于 2024-09-18 09:08:49 字数 201 浏览 19 评论 0原文

我需要从网站检索文档并解析它。 问题是:

  1. 该网站同时使用 http 和 https 协议
  2. 您需要登录该网站(我有一个普通帐户)
  3. 从登录页面,至少有 2 个重定向只是为了您自己登录

我管理了一个 HTTPS 连接并发布了我的登录并通过,但我在 cookie 管理和重定向方面遇到了麻烦......

I need to retrieve a document from a website, and parse it.
Problem is that:

  1. The site uses both http and https protocol
  2. You need to log in the site (I have a regular account)
  3. From the login page, there are at least 2 redirect just to log in yourself

I managed an HTTPS connection and posted my login and pass, but I'm having troubles with cookie management and the redirect....

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

平安喜乐 2024-09-25 09:08:49

commons-httpclient 会有所帮助。

commons-httpclient would help.

物价感观 2024-09-25 09:08:49

使用像 HtmlUnit 这样的库可能会有所帮助。

Using a library like HtmlUnit would probably help.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文