Python 中的 DOM 操作(如果某个元素仅包含另一个元素......)
我需要删除所有不需要的
。如将
xxxx
xxxx
。
我怎样才能用 DOM 做到这一点? “如果
内部只有一个
,则将该
的文本分配给
并删除此
”。
我更愿意用正则表达式来做这件事,但有些人说这很糟糕。我无法想象它是如何用 DOM 完成的。
text = "<div><p>xxxx</p></div>"
???
是否可以用 DOM 来解决?或者好的旧正则表达式更适合这种情况?
Python,而不是 JavaScript。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
这对我有用:
并且产生:
我希望您也能接受我为您的其他问题给出的答案,因为我为您投入了所有工作;)
This works for me:
and yields:
I hope you'll accept the answer I gave for your other question too since I put in all the work for you ;)
您可以使用 BeautifulSoup 执行此操作:
这将搜索所有
元素的父元素没有内容,只有一个子元素(
元素),然后复制
元素添加到父级并删除
元素。
Here's a way you can do it using BeautifulSoup:
This searches for all
<p>
elements that have a parent with no content and only one child (the<p>
element), then copies the contents of the<p>
element to the parent and removes the<p>
element.基于 @jterrace 答案:(
请编辑此问题,使其完整,或发表评论)
我认为解决方法是创建一个
minidom.Document
,以便您可以修改其 xml 节点。Building upon @jterrace answer:
(PLEASE EDIT THIS QUESTION SO THAT IT IS COMPLETE, OR COMMENT)
I think the way to go is to create a
minidom.Document
so that you can modify its xml nodes.如果你有jquery,这会起作用。
If you have jquery, this will work.