selenium爬取网易云音乐个人主页时要怎么得到加载过JavaScript的网页源码?
再用selenium爬网易云音乐个人主页时,发现page_source为并没有载JavaScript,也找不到对应的element。但是浏览器里却是显示正常的。
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
url = 'https://music.163.com/user/home?id=360445257'
driver = webdriver.Chrome()
driver.get(url)
print('日' in driver.page_source)
driver.quit()
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
试一下加个延时
page_source
返回页面源码
,而页面源码
没有JS
,因此你在源码里找JS是找不到的。selenium是模拟浏览器完成自动化操作的,你这里如果返回源码无异于用requests返回静态网页,没发挥它的作用。
如果想抓取什么数据,直接用selenium的动态操作方法就行了,比如点击,回车,查找等。