Python readlines 不分隔行
我有一个来自页面的 xml 文件,该文件在文本编辑器上正确显示,但是一旦我使用 readlines(),我只得到一行。我认为这意味着 python 无法识别正在使用的行分隔符,但 gedit 可以识别。
我想对其进行 split() 以正确获取数据,但如何查看文件中使用的行分隔符?
I have a xml file from a page which shows correctly on the text editor but once I use readlines(), I only get one line. I assume this means the line separator being used isn't recognized by python but it is by gedit.
I want to do a split() on it to get the data correctly but how can I see what line separator is being used in the file?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
正如评论中指出的,如果它是 xml,只需将其交给 XML 解析器(如 ElementTree 或 lxml)即可。换行符在 XML 中应该不重要。
有关信息,使用
open("thefile.xml", "rU")
将使用通用换行符支持打开它,因此 Python 将识别\n
、\r
或\r\n
作为换行符。As is pointed out in the comments, if it's xml, just hand it to an XML parser like ElementTree or lxml. Newlines shouldn't matter in XML.
For information, using
open("thefile.xml", "rU")
will open it with universal newline support, so Python will recognise\n
,\r
or\r\n
as newline markers.