Python爬虫看到这个Javascript,如何从中找到我需要的URL?

发布于 2022-09-04 17:33:52 字数 951 浏览 18 评论 0

想下载http://www.manhuatai.com/doupocangqiong/191.html里面的图片。
看到这个,因为不会javascript,所以不懂imgpath的value那串E&3G&F7&:7&:8&F8&B1&C5&F9&9C&9E&F8&B:&C:&3G2:2&F9&BG&:ETN&3G是什么意思,其中有几话我发现是直接http://mhpic.zymk.cn/comic/+value+页数+.jpg-mht.middle就能得到图片的url,但是还有很多都不能这样来获取。

<script>var mh_info={imgpath:"E&3G&F7&:7&:8&F8&B1&C5&F9&9C&9E&F8&B:&C:&3G2:2&F9&BG&:ETN&3G",startimg:1,totalimg:21,mhid:"doupocangqiong",mhname:"斗破苍穹",pageid:1292901,pagename:"第191话 魔炎高手",pageurl:"191",readmode:1,maxpreload:5,defaultminline:1,domain:"zymk.cn",comic_size:"-mht.middle"};</script>

而我需要的url是http://mhpic.zymk.cn/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%2F191%E8%AF%9DSM%2F1.jpg-mht.middle

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

唐婉 2022-09-11 17:33:52

使用selenium就可以很容易做到这件事情

from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http://www.manhuatai.com/doupocangqiong/191.html')
img=browser.find_element_by_xpath('//img[@data-bd-imgshare-binded="1"]')
print img.get_attribute('src')
# 即打印出:
# http://mhpic.zymk.cn/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%2F191%E8%AF%9DSM%2F1.jpg-mht.middle

关于selenium可以看看Python爬虫利器五之Selenium的用法

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文