当前位置：文江博客话题详情

UTF-8 Notepad++ byte-order-mark

如何避免无意中将 UTF-8 文件编码为 ASCII/ANSI？

发布于 2024-08-15 05:05:41 字数 282 浏览 9 评论 0原文

在编辑编码为 UTF-8 w/o [spurious] BOM 的文件的过程中，内容可能会缺少 ASCII 或 ANSI 范围之外的任何 Unicode 字符。下次重新打开该文件时，某些文本编辑器 (Notepad++) 会将其解释为 ASCII/ANSI 编码并按原样打开。不知道更改的用户将继续编辑，现在添加非 ANSI Unicode 字符，但由于保存在 ANSI 中而无用。可以存在菜单选项 (Notepad++) 以将 ANSI 文件打开为 UTF-8 w/o BOM，但会导致无意中用 Unicode 编码覆盖 ANSI 文件的反向问题。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

多谢你的绝情让我学会死心 2024-08-22 05:05:41

一种解决方法是将 ANSI 范围之外的字符添加到文件中的注释中。根据解码算法，它可能会强制编辑器 (Notepad++) 将文件识别为以 UTF-8 w/o BOM 编码的文件。

例如，在 HTML 文档中，您可以在标头中的字符集定义后添加这样的 Unicode 注释，此处为 U+05D0 HEBREW LETTER ALEF：

回复收藏 0 原文

初见 2024-08-22 05:05:41

当文件看起来相同时，您建议编辑如何区分 ASCII/ANSI 和 UTF-8 w/o BOM 之间的区别？

如果您希望保证将 UTF-8 识别为 UTF-8，请添加 BOM，或强制文件包含 UTF-8 字符。

回复收藏 0 原文

玩套路吗 2024-08-22 05:05:41

如果可能的话，将您的编辑器配置为始终使用 UTF-8，如果没有，请向编辑器的创建者投诉。 IMO 不推荐使用不针对 unicode 的字符集，并且应将其视为此类。

无论如何，仅使用 ASCII 空间（7 位）中的字符的文件在 UTF-8 中几乎是相同的，因此，如果您必须以 ASCII 编码提供某些内容，请不要键入任何 unicode 字符。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文