java通过url获取网页html源码的一点问题

发布于 2021-12-02 20:49:22 字数 150 浏览 845 评论 6

目的:通过一个url获取网页html源码,然后通过jsoup取出里面对应的值。

问题:用该url用java在后台获取页面的内容比直接在浏览器输入该url后看到的内容要少,

比如淘宝页面上看到的价格,用java在后台访问的时候整个html里根本就没有那个值

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

无边思念无边月 2021-12-06 12:26:54

jsoup对于静态网页抓取效果比较理想,对于异步(AJAX)加载数据的网页,需用htmlunit获取网页内容,再用JSOUP解析。

辞别 2021-12-06 11:58:17

目前只是拿一个来试,后面结合爬虫的话会涉及到很多网站

归途 2021-12-06 11:41:14

自己这一个浏览器内核吧,有许多开源的。不过还不如直接找到你有用的连接自己分析,毕竟只针对一个网站,又不用写通用的。

成熟稳重的好男人 2021-12-06 04:46:11

那有办法用java获取到跟浏览器一样多的内容吗?

归属感 2021-12-03 13:52:28

一个页面不止一个连接,估计十几甚至几十个请求,你用java获取只是代码,或者解析的并不是那么好,许多运行后的连接你没分析出来的。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文