selenium爬取网易云音乐个人主页时要怎么得到加载过JavaScript的网页源码?

发布于 2022-09-06 11:04:18 字数 457 浏览 13 评论 0

再用selenium爬网易云音乐个人主页时,发现page_source为并没有载JavaScript,也找不到对应的element。但是浏览器里却是显示正常的。

from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

url = 'https://music.163.com/user/home?id=360445257'
driver = webdriver.Chrome()
driver.get(url)
print('日' in driver.page_source)
driver.quit()

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

毁我热情 2022-09-13 11:04:18

试一下加个延时

driver.get(url)
**time.sleep(3)**
print('日' in driver.page_source)
driver.quit()
各空 2022-09-13 11:04:18

page_source返回页面源码,而页面源码没有JS,因此你在源码里找JS是找不到的。

selenium是模拟浏览器完成自动化操作的,你这里如果返回源码无异于用requests返回静态网页,没发挥它的作用。

如果想抓取什么数据,直接用selenium的动态操作方法就行了,比如点击,回车,查找等。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文