【求教】用BeautifulSoup正确的抓取姿势(抓取如图所示的标签?)
我写了一条目的是抓取b中的数字8
pgNum = soup.find_all(class_ = 'p-skip')[0].find_all('b')[0]
但提示的是'index out of range' 0.0
然后呢有测试了下仅仅抓取p-skip
pgNum = soup.find_all(class_ = 'p-skip')
返回的结果是 空集。。。
所以正确的抓取姿势是神马。。
附:html地址
view-source:http://search.jd.com/Search?keyword=%E5%...
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
我直接复制了你的代码,然后用的下面的测试数据:
没有任何问题, 下次建议你把
html
也贴出来谢谢各位帮我找了问题、源文件里p标签是通过js实现的
@zhimingpy @shomy
谢邀
可以结合 QT 来渲染页面以获得动态 HTML
参考:http://python.jobbole.com/84600/