Python readlines 不分隔行

发布于 2024-11-18 15:52:56 字数 156 浏览 1 评论 0原文

我有一个来自页面的 xml 文件,该文件在文本编辑器上正确显示,但是一旦我使用 readlines(),我只得到一行。我认为这意味着 python 无法识别正在使用的行分隔符,但 gedit 可以识别。

我想对其进行 split() 以正确获取数据,但如何查看文件中使用的行分隔符?

I have a xml file from a page which shows correctly on the text editor but once I use readlines(), I only get one line. I assume this means the line separator being used isn't recognized by python but it is by gedit.

I want to do a split() on it to get the data correctly but how can I see what line separator is being used in the file?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

梦里泪两行 2024-11-25 15:52:56

正如评论中指出的,如果它是 xml,只需将其交给 XML 解析器(如 ElementTree 或 lxml)即可。换行符在 XML 中应该不重要。

有关信息,使用 open("thefile.xml", "rU") 将使用通用换行符支持打开它,因此 Python 将识别 \n\r\r\n 作为换行符。

As is pointed out in the comments, if it's xml, just hand it to an XML parser like ElementTree or lxml. Newlines shouldn't matter in XML.

For information, using open("thefile.xml", "rU") will open it with universal newline support, so Python will recognise \n, \r or \r\n as newline markers.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文