当前位置：文江博客话题详情

XML 中的编码是什么？

发布于 2024-11-01 09:58:15 字数 54 浏览 0 评论 0原文

XML 中的编码是什么？正常使用的编码是utf-8。它与其他编码有何不同？使用它的目的是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烟柳画桥 2024-11-08 09:58:15

字符编码指定字符如何映射到字节。由于 XML 文档作为字节流存储和传输，因此有必要表示组成 XML 文档的 unicode 字符。

UTF-8 被选为默认值，因为它有几个优点

： ASCII，因为所有有效的 ASCII 编码文本也是有效的 UTF-8 编码（但不一定是相反！），
它每个字符仅使用 1 个字节来表示“常见”字母（那些也存在于 ASCII 中的字母）
它可以表示所有现有的Unicode 字符

字符编码是一种更通用的主题不仅仅是 XML。 UTF-8不仅限于在 XML 中使用。

每个程序员绝对需要了解处理文本的编码和字符集是一篇很好的文章，给出了对这个主题的一个很好的概述。

回复收藏 0 原文

め七分饶幸 2024-11-08 09:58:15

当计算机最初被创建时，它们大多只使用英语中的字符，从而产生了 7 位 US-ASCII 标准。

然而，世界上有许多不同的书面语言，必须找到在计算机中使用它们的方法。

如果您限制自己使用某种语言，第一种方法可以很好地工作，它是使用特定于文化的编码，例如 ISO-8859-1，它能够以 8 位表示拉丁欧洲语言字符，或者使用 GB2312 表示中文字符。

第二种方式有点复杂，但理论上可以表示世界上的每个字符，它是 Unicode 标准，其中每种语言的每个字符都有一个特定的代码。
然而，考虑到现有字符数量较多（Unicode 5 中为 109,000 个），unicode 字符通常使用三字节表示（一个字节用于 Unicode 平面，两个字节用于字符代码）。

为了最大限度地与现有代码兼容（有些仍在使用 ASCII 中的文本），UTF-8 标准编码被设计为存储 Unicode 字符的一种方式，仅使用最少的空间，如 Joachim Sauer 的答案中所述

。如果文件仅由仅理解这些语言的软件（和人员）编辑或读取，则通常会看到使用特定字符集（例如 ISO-8859-1）编码的文件；如果需要高度互操作性，则通常会看到使用 UTF-8 编码的文件独立于文化。
目前的趋势是 UTF-8 取代其他字符集，尽管这需要软件开发人员的工作，因为 UTF-8 字符串比固定宽度字符集字符串处理起来更复杂。

回复收藏 0 原文