如何使用 lxml 、 python 解析 html
我有一些 html 文件:
<html>
<body>
<span class="text">One</span>some text1</br>
<span class="cyrillic">Мир</span>some text2</br>
</body>
</html>
如何使用 lxml 和 python 获取“some text1”和“some text2”?
I have some html file:
<html>
<body>
<span class="text">One</span>some text1</br>
<span class="cyrillic">Мир</span>some text2</br>
</body>
</html>
How can i get "some text1" and "some text2" using lxml with python?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
我使用 lxml 进行 xml 解析,但我使用 BeautifulSoup 进行 HTML 解析。这是一个非常快速/简短的浏览,以解决您的问题的一个解决方案结束。希望有帮助。
I use lxml for xml parsing, but I use BeautifulSoup for HTML. Here's a very quick/brief tour, ending with one solution to your question. Hope it helps.