Webscapping -Python -Selenium+美丽
我正在尝试构建一个网络报废者以获取用户配置文件信息,例如名称,位置,经验,技能和语言
我面临的问题是:
“ https://i.sstatic.net/mjji4.png” rel =“ nofollow noreferrer”>
在每个 li
中,标签包含我要寻找的文本
< img src =“ https://i.sstatic.net/6hyob.png” alt =“在此处输入映像说明”>
当我希望在 acexs> axeppary>经验>
时> “对于每个配置文件,如果我尝试使用不同的标签,例如Div 为我带来了我不需要的其他字段的信息。
另一件事,正如您在图片上看到的那样,它显示了“ div” id =“体验”,但是由于此标签不嵌套任何父级标签,所以我无法使用它来提取数据。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我建议这样做:
soup.findall('div')
要查找所有DIV,然后将输出分开,以便您可以获得所需的ID; D
I would recommend doing:
soup.findAll('div')
for finding all div's and then just split the output, so you can get the id that you want ;D