如何按关键字分割文件?

发布于 2024-11-19 11:50:55 字数 792 浏览 0 评论 0原文

我有一个大的 XML 文件,看起来

<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 

<peto> oifmisnie </peto>

</data>

<data> sfnseosfnosefoisneofinseionfoaisenfoisen <emrosem> 3249087203470w </emrosem>

<peto> sdfn </peto>

</data>

我想将其分成一个列表,看起来像

 [<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 
 <peto> oifmisnie </peto></data>, <data> sfnseosfnosefoisneofinseionfoaisenfoisen             
 <emrosem> 3249087203470w </emrosem> <peto> sdfn </peto> </data>]

换句话说,我想根据“数据”一词拆分它。

我正在使用 python 2.7,感谢您的帮助。

I have a large XML file that looks like

<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 

<peto> oifmisnie </peto>

</data>

<data> sfnseosfnosefoisneofinseionfoaisenfoisen <emrosem> 3249087203470w </emrosem>

<peto> sdfn </peto>

</data>

I want to separate this into a list that looks like

 [<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 
 <peto> oifmisnie </peto></data>, <data> sfnseosfnosefoisneofinseionfoaisenfoisen             
 <emrosem> 3249087203470w </emrosem> <peto> sdfn </peto> </data>]

In other words, I want to split it based on the word "data".

I'm using python 2.7, thanks for the help.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

原来分手还会想你 2024-11-26 11:50:56

请不要为此使用正则表达式。如果需要解析 XML,请使用 XML 解析器。 XML 有太多的微妙之处,无法通过简单的字符串操作例程来处理它。有关原因的详细解释,请参阅 此问题的第一个答案问题

Please don't use regular expressions for this. If you need to parse XML, use an XML parser. XML just has too many subtleties to handle it with simple string manipulation routines. For a nice explanation as to why, see the first answer to this question.

梦断已成空 2024-11-26 11:50:55

包含的 XML 解析器 是解析 XML 的一种方法。从其中获取数据并将其放入标签完整的列表中可能有点麻烦,但它应该是可行的。

The included XML Parser is one way to parse XML. It might be a bit kludgey to get data off of it and into a list with the tags intact but it should be doable.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文