从文本文件中解析项目
我有一个文本文件,其中包含 {[]} 标记内的数据。解析该数据的建议方法是什么,以便我可以仅使用标签内的数据?
示例文本文件如下所示:
“这是一堆在任何{[方式]}中都没有{[真正]}用处的文本。我需要{[从]}它{[获取]}一些项目。'
我想最终在列表中包含“真的”、“方式”、“得到”、“来自”。我想我可以使用 split 来做到这一点..但似乎可能有更好的方法。我见过很多解析库,有一个最适合我想做的事情吗?
I have a text file that includes data inside {[]} tags. What would be the suggested way to parse that data so I can just use the data inside the tags?
Example text file would look like this:
'this is a bunch of text that is not {[really]} useful in any {[way]}. I need to {[get]} some items {[from]} it.'
I would like to end up with 'really', 'way', 'get', 'from' in a list. I guess I could use split to do it.. but seems like there might be a better way out there. I have seen a ton parsing libraries, is there one that would be perfect for what I want to do?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
我会使用正则表达式。此答案假设没有任何标记字符 {}[] 出现在其他标记字符中。
在Python正则表达式中使用详细模式:
I would use regular expressions. This answer assumes that none of the tag characters {}[] appear within other tag characters.
Using the verbose mode in python regular expressions:
这是正则表达式的工作:
This is a job for regex:
更慢,更大,没有
传统的正则表达式:P
slower, bigger, no regular expresions
the old school way :P
另一种方式
Another way