在 Python 中以文本模式打开文件可能会导致数据丢失：为什么？

发布于 2024-11-07 20:36:57 字数 516 浏览 5 评论 0原文

codecs.open() 的文档提到

即使未指定二进制模式，文件也始终以二进制模式打开。这样做是为了避免由于使用 8 位值编码而导致数据丢失。

对文件使用文本模式如何导致“数据丢失”？听起来以文本模式打开文件可能会将字节截断为 7 位，但我在文档中找不到任何提及这一点：文本模式是仅描述为转换换行符的一种方式，没有提及一些潜在的数据丢失。那么，codecs.open() 的文档指的是什么呢？

PS：虽然可以理解自动换行符转换为平台相关的换行符编码需要一些小心，但问题是 8 位编码的具体情况。我猜测只有某些编码与自动换行符转换兼容，无论它们是8位还是7位编码。那么，为什么在 codecs.open() 的文档中单独列出 8 位编码呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

无尽的现实 2024-11-14 20:36:57

我认为他们的意思是，某些编码至少在某些字节中使用所有 8 位，因此所有 256 个值都是可能的（特别是，有可能获得不意味着 CR 或 LF 的 0x0A 或 0x0D）。

相反，在 UTF-8 文件中，CR 和 LF 字符（以及 0x80 以下的所有其他字符）始终转换为自身。它们不能作为其他字符的编码的一部分出现。

回复收藏 0 原文

~没有更多了~

关于作者

夜吻♂芭芘

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

在 Python 中以文本模式打开文件可能会导致数据丢失：为什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

在 Python 中以文本模式打开文件可能会导致数据丢失：为什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。